Опубликован: 16.12.2009 | Уровень: для всех | Доступ: платный
Лекция 4:

Статистический анализ числовых величин (непараметрическая статистика)

О проверке однородности двух независимых выборок

В математико-статистических терминах постановка задачи такова: имеются две выборки x_1, x_2, \dots,x_m и y_1, y_2, \dots, y_n (т. е. наборы из m и п действительных чисел), требуется проверить их однородность. Термин "однородность" уточняется ниже.

Противоположным понятием является "различие". Можно переформулировать задачу: требуется проверить, есть ли различие между выборками. Если различия нет, то для дальнейшего изучения часто выборки объединяют.

Например, в маркетинге важно выделить сегменты потребительского рынка. Если установлена однородность двух выборок, то возможно объединение сегментов, из которых они взяты, в один. В дальнейшем это позволит осуществлять по отношению к ним одинаковую маркетинговую политику (проводить одни и те же рекламные мероприятия и т.п.). Если же установлено различие, то поведение потребителей в двух сегментах различно, объединять эти сегменты нельзя, и могут понадобиться различные маркетинговые стратегии, своя для каждого из этих сегментов.

Традиционный метод проверки однородности (критерий Стьюдента). Для дальнейшего критического разбора опишем традиционный статистический метод проверки однородности. Вычисляют средние арифметические в каждой выборке

\bar x=\frac{1}{m} \sum_{1 \le i \le m}x_i,\\
Y= \frac{1}{n} \sum_{1 \le i \le n}y_i

затем выборочные дисперсии

s_x^2=\frac{1}{m-1} \sum_{1 \le i \le m}(x_i-\bar x)^2,\\
s_y^2= \frac{1}{n-1} \sum_{1 \le i \le n}(y_i- \bar y)^2

и статистику Стьюдента t, на основе которой принимают решение,

t=\frac{\bar x-\bar y}{\sqrt{(m-1)s_x^2+(n-1)s_y^2}} \sqrt{\frac{mn(m+n-2)}{m+n}} ( 1)

По заданному уровню значимости \alpha и числу степеней свободы (m+n _ 2) из таблиц распределения Стьюдента находят критическое значение t_{кр}. Если |t|>t_{кр}, то гипотезу однородности (отсутствия различия) отклоняют, если же |t|\le t_{кр}, то принимают. (При односторонних альтернативных гипотезах вместо условия |t|>t_{кр} проверяют, что t>t_{кр} ; эту постановку рассматривать не будем, так как в ней нет принципиальных отличий от обсуждаемой здесь.)

Рассмотрим условия применимости традиционного метода проверки однородности, основанного на использовании статистики t Стьюдента, а также укажем более современные методы.

Вероятностная модель порождения данных. Для обоснованного применения эконометрических методов необходимо прежде всего построить и обосновать вероятностную модель порождения данных. При проверке однородности двух выборок общепринята модель, в которой x_1, x_2, \dots,x_m рассматриваются как результаты m независимых наблюдений некоторой случайной величины Х с функцией распределения F(x) , неизвестной статистику, а y_1, y_2, \dots, y_n - как результаты п независимых наблюдений, вообще говоря, другой случайной величины Y с функцией распределения G(x) , также неизвестной статистику. Предполагается также, что наблюдения в одной выборке не зависят от наблюдений в другой, поэтому выборки и называют независимыми.

Возможность применения модели в конкретной реальной ситуации требует обоснования. Независимость и одинаковая распределенность результатов наблюдений, входящих в выборку, могут быть установлены или исходя из методики проведения конкретных наблюдений, или путем проверки статистических гипотез независимости и одинаковой распределенности с помощью соответствующих критериев [8].

Если проведено (т+п) измерений объемов продаж в (т+п) торговых точках, то описанную выше модель, как правило, можно применять. Если же, например, x_i и y_i - объемы продаж одного и того же товара до и после определенного рекламного воздействия, то рассматриваемую модель применять нельзя. (В этом случае используют модель т.н. связанных выборок, в которой обычно строят новую выборку z_i = x_i - y_i и используют статистические методы анализа одной выборки, а не двух. Проверка однородности для связанных выборок рассматривается ниже.)

При дальнейшем изложении принимаем описанную выше вероятностную модель двух выборок.

Уточнения понятия однородности. Понятие "однородность", т. е. "отсутствие различия", может быть формализовано в терминах вероятностной модели различными способами.

Наивысшая степень однородности достигается, если обе выборки взяты из одной и той же генеральной совокупности, т. е. справедлива нулевая гипотеза H_0 : F(x)=G(x) при всех х.

Отсутствие однородности означает, что верна альтернативная гипотеза, согласно которой

H_1 : F(x_0) \ne G(x_0)

хотя бы при одном значении аргумента x_0. Если гипотеза H_0 принята, то выборки можно объединить в одну, если нет - то нельзя.

В некоторых случаях целесообразно проверять не совпадение функций распределения, а совпадение некоторых характеристик случайных величин Х и Y - математических ожиданий, медиан, дисперсий, коэффициентов вариации и др. Например, однородность математических ожиданий означает, что справедлива гипотеза

H'_0 : M(X)=M(Y),

где M(Х) и M(Y) - математические ожидания случайных величин Х и Y , результаты наблюдений над которыми составляют первую и вторую выборки соответственно. Доказательство различия между выборками в рассматриваемом случае - это доказательство справедливости альтернативной гипотезы

H'_1 : M(X) \ne M(Y)

Если гипотеза H_0 верна, то и гипотеза H'_0 верна, но из справедливости H'_0 не следует справедливость H_0 . В частности, если в результате обработки выборочных данных принята гипотеза H'_0, то отсюда не следует, что две выборки можно объединить в одну. Однако в ряде ситуаций целесообразна проверка именно гипотезы H'_0 . Например, пусть функция спроса на определенный товар или услугу оценивается путем опроса потребителей (первая выборка) или с помощью данных о продажах (вторая выборка). Тогда маркетологу важно проверить гипотезу об отсутствии систематических расхождений результатов этих двух методов, т.е. гипотезу о равенстве математических ожиданий. Другой пример - из производственного менеджмента. Пусть изучается эффективность управления бригадами рабочих на предприятии с помощью двух организационных схем, результаты наблюдения - объем производства на одного члена бригады, а показатель эффективности организационной схемы - средний (по предприятию) объем производства на одного рабочего. Тогда для сравнения эффективности препаратов достаточно проверить гипотезу H'_0 .

Классические условия применимости критерия Стьюдента. Пусть выполнены два классических условия применимости критерия Стьюдента, основанного на использовании статистики t , заданной формулой (1):

а) результаты наблюдений имеют нормальные распределения:

F(x)=N(x; m_1, \sigma_1^2), G(x)=N(x; m_2, \sigma_2^2)

с математическими ожиданиями m_1 и m_2 и дисперсиями \sigma_1^2 и \sigma_2^2 в первой и во второй выборках соответственно;

б) дисперсии результатов наблюдений в первой и второй выборках совпадают:

D(X)=\sigma_1^2=D(Y)=\sigma_2^2

Если условия а) и б) выполнены, то нормальные распределения F(x) и G(x) отличаются только математическими ожиданиями, а поэтому обе гипотезы H_0 и H'_0 сводятся к гипотезе

H''_0 : m_1=m_2,

а обе альтернативные гипотезы H_1 и H'_1 сводятся к гипотезе

H"_1 : m_1 \ne m_2,

Если условия а) и б) выполнены, то статистика t при справедливости H''_0 имеет распределение Стьюдента с (т + п - 2) степенями свободы. Только в этом случае описанный выше традиционный метод обоснован безупречно. Если хотя бы одно из условий а) и б) не выполнено, то нет оснований считать, что статистика t имеет распределение Стьюдента, поэтому применение традиционного метода, строго говоря, не обосновано. Обсудим возможность проверки этих условий и последствия их нарушений.

О проверке условия нормальности. Априори нет оснований предполагать нормальность распределения результатов экономических, технико-экономических и иных наблюдений. Следовательно, нормальность надо проверять. Разработано много статистических критериев для проверки нормальности распределения результатов наблюдений [8]. Однако проверка нормальности - более сложная и трудоемкая статистическая процедура, чем проверка однородности (как с помощью статистики t Стьюдента, так и с использованием непараметрических критериев, рассматриваемых ниже).

Для достаточно надежного установления нормальности требуется весьма большое число наблюдений. Выше показано, что для того, чтобы гарантировать, что функция распределения результатов наблюдений отличается от некоторой нормальной не более чем на 0,01 (при любом значении аргумента), требуется порядка 2500 наблюдений. В большинстве экономических и технико-экономических исследований число наблюдений существенно меньше.

Как уже отмечалось, есть и одна общая причина отклонений от нормальности: любой результат наблюдения записывается конечным (обычно 2-5) количеством цифр, а с математической точки зрения вероятность такого события равна 0. Из сказанного выше следует, что в эконометрике распределение результатов экономических и технико-экономических наблюдений практически всегда более или менее отличается от нормального. Более подробно это утверждение выше.

Последствия нарушения условия нормальности. Если условие а) не выполнено, то распределение статистики t не является распределением Стьюдента. Однако при справедливости H'_0 и условии б) распределение статистики t при росте объемов выборок приближается к стандартному нормальному распределению Ф(х)=N(x; 0, 1) . К этому же распределению приближается распределение Стьюдента при возрастании числа степеней свободы. Другими словами, несмотря на нарушение условия нормальности традиционный метод (критерий Стьюдента) можно использовать для проверки гипотезы H'_0 при больших объемах выборок. При этом вместо таблиц распределения Стьюдента достаточно пользоваться таблицами стандартного нормального распределения Ф(х) .

Сформулированное в предыдущем абзаце утверждение справедливо для любых функций распределения F(x) и G(x) таких, что M(X)=M(Y), D(X)=D(Y) и выполнены некоторые внутриматематические условия, обычно считающиеся справедливыми в реальных задачах. Если же M(X) \ne M(Y) , то нетрудно вычислить, что при больших объемах выборок

P(t \le x)\approx Ф(x-a_{mn}) ( 2)

где

a_{mn}=\frac{\sqrt{mn}[M(X)-M(Y)]}{\sqrt{mD(X)+nD(Y)}} ( 3)

Формулы (2) - (3) позволяют приближенно вычислять мощность t-критерия (точность возрастает при увеличении т и п ).

О проверке условия равенства дисперсий. Иногда условие б) вытекает из методики получения результатов наблюдений, например, когда с помощью одного и того же прибора или методики m раз измеряют характеристику первого объекта и п раз-второго, а параметры распределения погрешностей измерения при этом не меняются. Однако ясно, что в постановках большинства исследовательских и практических задач нет основании априори предполагать равенство дисперсий.

Целесообразно ли проверять равенство дисперсий статистическими методами, например, как это иногда предлагают, с помощью F -критерия Фишера? Этот критерий основан на нормальности распределений результатов наблюдений, от которой неизбежны отклонения (см. выше), причем хорошо известно, что в отличие от t -критерия его распределение сильно меняется при малых отклонениях от нормальности [10]. Кроме того, F -критерий отвергает гипотезу D(X)=D(Y) лишь при большом различии выборочных дисперсий. Так, для данных [8] о двух группах результатов химических анализов отношение выборочных дисперсий равно 1,95, т.е. существенно отличается от 1. Тем не менее гипотеза о равенстве теоретических дисперсий принимается на 1% уровне значимости. Следовательно, при проверке однородности применение F -критерия для предварительной проверки равенства дисперсий нецелесообразно.

Итак, в большинстве экономических и технико-экономических задач условие б) нельзя считать выполненным, а проверять его нецелесообразно.

Последствия нарушения условия равенства дисперсий. Если объемы выборок т и п велики, то можно показать, что распределение статистики t описывается с помощью только математических ожиданий M(Х) и M(Y) , дисперсий D(X), D(Y) и отношения объемов выборок, а именно:

P(t \le x)\approx Ф(b_{mn}x-a_{mn}) ( 4)

где a_{mn} определено формулой (3),

b_{mn}^2=\frac{\lambda D(X)+D(Y)}{D(X)+ \lambda D(Y)},\\
\lambda =\frac mn ( 5)

Если b_{mn} \ne 1, то распределение статистики t отличается от распределения, заданного формулой (2), полученной в предположении равенства дисперсий. Когда b{mn}=1? В двух случаях - при m = n и при D(X) = D(Y) . Таким образом, при больших и равных объемах выборок требовать выполнения условия б) нет необходимости. Кроме того, ясно, что если объемы выборок мало различаются, то b_mn} близко к 1. Так, для данных [8] имеем b*_{mn}= 0,987, где b*_{mn} - оценка b_{mn}, полученная заменой в формуле (5) теоретических дисперсий на выборочные.

Область применимости традиционного метода проверки однородности с помощью критерия Стьюдента. Подведем итоги рассмотрения t -критерия. Он позволяет проверять гипотезу H'_0 о равенстве математических ожиданий, но не гипотезу H_0 о том, что обе выборки взяты из одной и той же генеральной совокупности. Классические условия применимости критерия Стьюдента в подавляющем большинстве экономических и технико-экономических задач не выполнены. Тем не менее при больших и примерно равных объемах выборок его можно применять. При конечных объемах выборок традиционный метод носит неустранимо приближенный характер.

Дмитрий Лямин
Дмитрий Лямин
Анна Корнева
Анна Корнева

Подскажите, пожалуйста, помимо самого обучения 1 руб. и отправки диплома по почте (за пересылку), ещё нужно платить за оформление самого диплома или удостоверения?

Ирина Симонян
Ирина Симонян
Армения, Ереван, ЕГУ, 1998
Дмитрий Степаненко
Дмитрий Степаненко
Россия