Новосибирский Государственный Университет
Опубликован: 06.11.2008 | Доступ: свободный | Студентов: 3333 / 1206 | Оценка: 4.24 / 3.67 | Длительность: 14:37:00
Специальности: Математик
Лекция 11:

Основные понятия теории статистических решений

< Лекция 10 || Лекция 11: 123 || Лекция 12 >
Аннотация: Основные понятия. Принципы планирования эксперимента. Обоснование статистических решений при фиксированных экспериментах. Обоснование статистических решений при нефиксированных экспериментах. Обоснование статистических решений без постановки экспериментов.

Основные понятия

Наличие случайных факторов, оказывающих непосредственное влияние на эффективность вариантов действий, обуславливает целесообразность применения при выработке решений математического аппарата теории статистических решений и последовательного анализа. В лекциях 11, "12" рассматриваются принципы построения стохастических моделей и даются теории статистических решений и последовательного анализа.

Статистические методы требуются всегда, когда результаты не могут быть точно повторены сколь угодно много раз. Причины такой невоспроизводимости лежат в неконтролируемых и не поддающихся контролю влияниях, в неоднородности объектов опыта, в изменчивости материалов и условий опыта. Эти причины приводят к "рассеянию" количественных признаков в ряду наблюдений. Рассеяние ведет к неопределенности, при которой возможны только неформальные решения. Это обстоятельство является основой одного из современных определений статистики, которое было предложено Абрахамом Вальдом (Wald A. Statistiecal Decision Function. New York, 1950. Вальд ФА. "Позиционные игры". М. , "Наука", 1967.): статистика – совокупность методов, которые дают нам возможность принимать оптимальные решения в условиях неопределенности.

Описательная (дескриптивная) статистика ограничивается исследованием и описанием полных совокупностей. Современная индуктивная, или аналитическая, статистика исследует, напротив, только репрезентативную, представительную часть совокупности, свойства которой нас интересуют. Наблюдения части распространяются по индукции на всю генеральную совокупность. При этом решающим является случайный выбор наблюдаемой части генеральной совокупности – выборки – по аналогии с лотереей. Мы называем выборку случайной, если каждая возможная комбинация равного числа элементов из генеральной совокупности имеет равную вероятность образовать выборку. Случайная выборка важна, так как только она позволяет распространить выводы на всю генеральную совокупность. Полное исследование почти всегда или невозможно, или связано со слишком большими материальными и временными затратами.

Главную роль играет основанная на описательной статистике статистика индуктивная, или аналитическая (теория статистического вывода). Она позволяет распространить заключения, сделанные на основании выборки, на всю генеральную совокупность, установить закономерности, справедливые и вне области наблюдений. Индуктивная статистика дает возможность с помощью сопоставления экспериментальных данных с результатами, вытекающими из вероятностных моделей (идеализированных ситуаций), вынести суждение о соответствии эксперимента существующим научным теориям; при этом высказывания, естественно, должны носить вероятностный характер и сообщать практикам информацию, необходимую для принятия решения.

В теории оценивания необходимо принять решение о том, как можно наилучшим образом по выборке узнать характеристики генеральной совокупности.

В теории проверки гипотез речь идет о том, какой генеральной совокупности принадлежит данная выборка.

Современная статистика интересуется двумя направлениями: получением данных , то есть планами и проведением опытов, и анализом и интерпретацией данных, при которой из чисел "экстрагируется" максимально возможное количество информации.

Так как плохо спланированный опыт мало информативен, и нельзя исправить самой лучшей статистической техникой, планирование эксперимента становится особо важным составным элементом статистики.

Принципы планирования эксперимента

При планировании эксперимента выступают два взаимно противоположных принципа: принцип сравнимости и принцип обобщаемости.

Два опыта, в которых необходимо сравнить два вида обработки (лечения), взаимно сравнимы, если они отличаются только видами лечения, а со всех остальных точек зрения согласованы. Согласование касается следующих условий эксперимента и причин вариации:

  1. методы наблюдения и измерения;
  2. условия проведения эксперимента;
  3. индивидуальные особенности объектов эксперимента;
  4. особенности времени, места эксперимента, человеческие особенности.

Сравнимость отдельных экспериментов почти возможна, хотя лишь для экспериментов одной группы. Если нужно сравнивать группы экспериментов, то у них должны быть одинаковые распределения источников вариации.

Если, например, для достижения хорошей сравнимости используются только молодые самцы определенного веса и тому подобное, из одного помета, то этим обеспечивается надежная сравнимость, но утрачивается общность, для которой нужно было бы сохранение в опытах старых животных, или самок, или подобных же самцов, но из другого помета. Такой ряд экспериментов имел бы некоторую, хотя и слабую, основу для индукции.

Обобщение означает изучение и описание таких коллективов и их распределений признаков, для которых имеющиеся значения наблюдений могут рассматриваться как репрезентативные выборки. Лишь рассмотрение таких неоднородных коллективов с различными подопытными животными (возраст, пол, наследственность, предрасположенность), различным временем эксперимента (время дня, время года, метеоусловия), при различном оборудовании, различных экспериментаторах и тому подобное может привести к выводу, насколько независимы результаты от этих вариаций и мешающих факторов, то есть дать возможность провести соответствующее обобщение. Сравнимость и обобщимость для эксперимента противоположны; если сравнимость требует однородного материала, обобщимость, напротив, — неоднородного материала для получения широкого, индуктивного базиса: сравнение требует повторяющегося коллектива, обобщение – неоднородного, изменяющегося коллектива! Оба принципа должны взаимно учитываться при планировании эксперимента. Сравнение различных методов особенно благоприятно на одном и том же животном. При этом сравнимость оптимальна, а неоднородность коллектива особей может быть произвольно широкой. (Повтор. – Ред.) Полный обзор методов планирования эксперимента дан в (Herzberg Agnes M/ and Cox D.R. Recent work on the design of experiments: a bibliography and a review. J. Roy. Statist. A 132 (1969), 29-67.)

Основные принципы планирования эксперимента

  1. Повторение (дублирование) опытов: позволяет оценить ошибку эксперимента и одновременно приводит к ее уменьшению.
  2. Рандомизация (случайное распределение): позволяет получить несмещенную оценку интересующих исследователя эффектов путем исключения известных и неизвестных систематических ошибок, в особенности тренда, который обусловлен факторами времени и пространства, и дает возможность обеспечить одновременно независимость результатов эксперимента. Рандомизацию следует проводить с помощью таблицы случайных чисел.
  3. Разбиение на блоки: увеличивает точность внутриблочного сравнения.
< Лекция 10 || Лекция 11: 123 || Лекция 12 >
Данил Комардин
Данил Комардин

мне задали дистанционное задание на сертификат,но я не могу его найти