Опубликован: 16.12.2009 | Уровень: для всех | Доступ: платный
Лекция 4:

Статистический анализ числовых величин (непараметрическая статистика)

Пример 4. Пусть, как и в примере 3, распределения сосредоточены на интервале (0; 1) , и на нем F(x)=x, а G(x) - функция распределения, сосредоточенного в двух точках - \beta и 1, т.е. G(x) = 0 при x, не превосходящем \beta ; G(x) = h на (\beta ; 1] ; G(x) = 1 при x > 1. С такой функцией G(x) легко проводить расчеты. Однако она не удовлетворяет принятым выше условиям непрерывности и строгого возрастания. Вместе с тем легко видеть, что она является предельной (сходимость в каждой точке отрезка [0 ; 1] ) для последовательности функций распределения, удовлетворяющих этим условиям, а распределение статистики Вилкоксона для пары функций распределения примера 4 является предельным для последовательности соответствующих распределений статистики Вилкоксона, полученных в рассматриваемых условиях непрерывности и строгого возрастания.

Условие P(X < Y) = 1/2 выполнено, если h = (1 - )^{-1} / 2 (при \beta из отрезка [0 ; 1/2] ). Поскольку h > 1/2 при положительном \beta  , то очевидно, что медиана G(x) равна \beta, в то время как медиана F(x) равна 1/2 . Значит, при \beta = 1/2 медианы совпадают, при всех иных положительных \beta - различны. При \beta = 0 медианой G(x) является любая точка из отрезка [0 ; 1] .

Легко подсчитать, что в условиях примера 4 параметры предельного распределения имеют вид

b^2 =  \beta (1- \beta)^{-1} / 4 , g^2 = (1- 2\beta) / 4.

Следовательно, распределение нормированной и центрированной статистики Вилкоксона будет асимптотически нормальным с математическим ожиданием 0 и дисперсией

D(T) = 3 [(n-1) \beta (1- \beta)^{-1} + (m-1) (1-2\beta) + 1] (m+n+1)^{ - }

Проанализируем величину D(T) в зависимости от параметра \beta и объемов выборок m и n. При достаточно больших m и n

D(T) = 3 w \beta (1 - \beta)^{-1}  +  3 (1 - w) (1 - 2 \beta),

с точностью до величин порядка (m+n)^{-1}, где w= n/(m+n) . Значит, D(T) - линейная функция от w, а потому достигает экстремальных значений на границах интервала изменения w, т.е. при w = 0 и w = 1. Легко видеть, что при \beta (1-\beta)^{-1} <1-2\beta минимум равен 3\beta (1-\beta)^{-1} (при w = 1 ), а максимум равен 3(1 - 2\beta) (при w = 0) . В случае \beta (1-\beta)-1 >1-2\beta максимум равен 3\beta (1-\beta)^{-1} (при w = 1 ), а минимум равен 3(1 - 2\beta) (при w = 0 ). Если же \beta (1-\beta)^{-1} =1-2\beta (это равенство справедливо при \beta=\beta_0 = 1 - 2^{-1/2}  = 0,293) , то D(T)=3 (2^{1/2}-1)=1,2426 при всех w из отрезка [0; 1] .

Первый из описанных выше случаев имеет быть при \beta < \beta_0, при этом минимум D(T) возрастает от 0 (при \beta=0, w=1 - предельный случай) до 3(2^{1/2} - 1) (при \beta=\beta_0 , w - любом), а максимум уменьшается от 3 (при \beta=0, w=0 - предельный случай) до 3 (2^{1/2} - 1) (при \beta=\beta_0 , w - любом). Второй случай относится к \beta из интервала (\beta0 ; 1/2] . При этом минимум убывает от приведенного выше значения для \beta=\beta_0 до 0 (при \beta=1/2 , w=0 - предельный случай) , а максимум возрастает от того же значения при \beta=\beta_0 до 3 (при \beta=1/2 , w=0 ).

Таким образом, D(T) может принимать все значения из интервала (0 ; 3) в зависимости от значений \beta и w. Если D(T) < 1, то при применении критерия Вилкоксона к выборкам с рассматриваемыми функциями распределения гипотеза однородности (2) будет приниматься чаще (при соответствующих значениях \beta и w - с вероятностью, сколь угодно близкой к 1), чем если бы она самом деле была верна. Если 1<D(T)<3, то гипотеза (2) также принимается достаточно часто. Так, если уровень значимости критерия Вилкоксона равен 0,05, то (асимптотическая) критическая область этого критерия, как показано выше, имеет вид \{T: |T| \ge 1,96\}. Если - самый плохой случай - D(T)=3, то гипотеза (2) принимается с вероятностью 0,7422.

Гипотеза сдвига. При проверке гипотезы однородности мы рассмотрели различные виды нулевых и альтернативных гипотез - гипотезу (2) и ее отрицание в качестве альтернативы, гипотезу (6) и ее отрицание, гипотезы о равенстве или различии медиан. В теоретических работах по математической статистике часто рассматривают гипотезу сдвига, в которой альтернативой гипотезе (2) является гипотеза

H_1:    F(x) = G(x + r) ( 12)

при всех x и некотором сдвиге r, отличным от 0. Если верна альтернативная гипотеза H_1, то вероятность P(X < Y) отлична от 1/2, а потому при альтернативе (12) критерий Вилкоксона является состоятельным.

В некоторых прикладных постановках гипотеза (12) представляется естественной. Например, если одним и тем же прибором проводятся две серии измерений двух значений некоторой величины (физической, химической и т.п.). При этом функция распределения G(x) описывает погрешности измерения одного значения, а G(x+r) - другого. Вопреки распространенному заблуждению, хорошо известно, что распределение погрешностей измерений, как правило, не является нормальным - см. об этом начало лекции. Однако при анализе конкретных экономических данных как правило, нет никаких оснований считать, что отсутствие однородности всегда выражается столь однозначным образом, как следует из формулы (12). Поэтому эконометрику для проверки однородности необходимо использовать статистические критерии, состоятельные против любого отклонения от гипотезы однородности (2).

Почему же математики так любят гипотезу сдвига (12)? Да потому, что она дает возможность доказывать глубокие математические результаты, например, об асимптотической оптимальности критериев. К сожалению, с точки зрения эконометрики это напоминает поиск ключей под фонарем, где светло, а не там, где они потеряны.

Отметим еще одно обстоятельство. Часто говорят (в соответствии с классическим подходом математической статистики), что нельзя проверять нулевые гипотезы без рассмотрения альтернативных. Однако при эконометрическом анализе данных зачастую полностью ясна формулировка той гипотезы, которую желательно проверить (например, гипотезы полной однородности - см. формулу (2)), в то время как формулировка альтернативной гипотезы не очевидна (то ли это гипотеза о неверности равенства (2) хотя бы для одного значения x, то ли это альтернатива (8), то ли - альтернатива сдвига (12), и т.д.). В таких случаях целесообразно "обернуть" задачу - исходя из статистического критерия найти альтернативы, относительно которых он состоятелен. Именно это и проделано в настоящей пункте для критерия Вилкоксона.

Подведем итоги рассмотрения критерия Вилкоксона.

  1. Критерий Вилкоксона (Манна-Уитни) является одним из самых распространенных непараметрических ранговых критериев, используемых для проверки однородности двух выборок. Его значение не меняется при любом монотонном преобразовании шкалы измерения (т.е. он пригоден для эконометрического анализа данных, измеренных в порядковой шкале).
  2. Распределение статистики критерия Вилкоксона определяется функциями распределения F(x) и G(x) и объемами m и n двух выборок. При больших объемах выборок распределение статистики Вилкоксона является асимптотически нормальным с параметрами, выписанными выше ( см. формулы (1), (3) и (5)).
  3. При альтернативной гипотезе, когда функции распределения выборок F(x) и G(x) не совпадают, распределение статистики Вилкоксона зависит от величины a =  P(X < Y) . Если a отличается от 1/2, то мощность критерия Вилкоксона стремится к 1, и отличает нулевую гипотезу F = G от альтернативной. Если же a = 1/2, то это не всегда имеет место. В примере 2 приведены две различные функции распределения выборок F(x) и G(x) такие, что гипотеза однородности F = G при проверке с помощью критерия Вилкоксона будет приниматься чаще, чем если она на самом деле верна.
  4. Следовательно, в случае общей альтернативы критерий Вилкоксона не является состоятельным, т.е. не всегда позволяет обнаружить различие функций распределения. Однако это не лишает его практической ценности, точно так же, как несостоятельность критериев типа хи-квадрат при проверке согласия, независимости или однородности не мешает отклонять нулевую гипотезу во многих практически важных случаях. Однако принятие нулевой гипотезы с помощью критерия Вилкоксона может означать не совпадение F и G, а лишь выполнение равенства a = 1/2.
  5. Иногда утверждают, что с помощью критерия Вилкоксона можно проверять равенство медиан функций распределения F и G. Это не так. В примерах 3 и 4 указаны F и G с a = 1/2, но с различными медианами. Во многих случаях это различие нельзя обнаружить с помощью критерия Вилкоксона, как это показано при численном анализе асимптотической дисперсии в примере 4.
  6. Указанные выше недостатки критерия Вилкоксона исчезают для специального вида альтернативы - т.н. "альтернативы сдвига" H_1: F(x) = G(x + r) . В этом частном случае при справедливости альтернативной гипотезы мощность стремится к 1, различие медиан также всегда обнаруживается. Однако альтернатива сдвига не всегда естественна. Ее целесообразно принять, если одним и тем же прибором проводятся две серии измерений двух значений некоторой величины (физической, химической и т.п.). При этом функция распределения G(x) описывает результаты измерений с погрешностями одного значения, а F(x) = G(x+r) - другого. Другими словами, меняется лишь измеряемое значение, а собственно распределение погрешностей - одно и то же, присущее используемому средству измерения (и обычно описанное в его техническом паспорте). Однако в большинстве эконометрических исследований нет никаких оснований считать, что при альтернативе функция распределения второй выборки лишь сдвигается, но не меняется каким-либо иным образом.
  7. При всех своих недостатках критерий Вилкоксона прост в применении и часто позволяет обнаруживать различие групп (поскольку оно часто сводится к отличию a =  P(X < Y) от 1/2 ). Приведенные здесь критические замечания не следует понимать как призыв к полному отказу от использования критерия Вилкоксона. Однако для проверки гипотезы однородности в случае альтернативы общего вида можно порекомендовать состоятельные критерии, в частности, рассматриваемые в следующем пункте критерии Смирнова и типа омега-квадрат (Лемана-Розенблатта).
  8. В литературе по прикладным статистическим методам соседствуют два стиля изложения. Один из них исходит из формулировок нулевой и альтернативных гипотез (или описания набора гипотез, из которого надо выбрать наиболее адекватную), для проверки которых строятся те или иные критерии. При другом стиле изложения упор делается на алгоритмическое описание критериев для проверки тех или иных гипотез, а об альтернативах даже не упоминается.

Например, в литературе по математической статистике часто говорится, что для проверки нормальности используются критерии асимметрии и эксцесса (они описаны, например, в лучшем справочнике 1960-1980-х годов [8, табл. 4.7]). Однако эти критерии позволяют проверять некоторые соотношения между моментами распределения, но отнюдь не являются состоятельными критериями нормальности (не все отклонения от нормальности обнаруживают). Впрочем, для эконометрики эти критерии практического значения не имеют, поскольку заранее известно, что распределения конкретных экономических данных отличны от нормальных.

Так что недостатки критерия Вилкоксона не является исключением, мощность ряда иных популярных в математической статистике критериев заслуживает тщательного изучения, при этом заранее можно сказать, что зачастую они не позволяют проверять те гипотезы, с которыми традиционно связаны. При применении подобных критериев к анализу реальных данных необходимо тщательно взвешивать их достоинства и недостатки.

Состоятельные критерии проверки однородности для независимых выборок

В соответствии с эконометрической теорией естественно потребовать, чтобы рекомендуемый для массового использования в экономических и технико-экономических исследованиях критерий однородности был состоятельным. Напомним: это значит, что для любых отличных друг от друга функций распределения F(x) и G(x) (другими словами, при справедливости альтернативной гипотезы H_1 ) вероятность отклонения гипотезы H_0 должна стремиться к 1 при увеличении объемов выборок т и п. Из перечисленных выше в конце п.4 критериев состоятельными являются только критерии Смирнова и типа омега-квадрат.

Проведенное исследование мощности (методом статистических испытаний) первых четырех из перечисленных выше критериев (при различных вариантах функций распределения F(x) и G(x) ) подтвердило преимущество критериев Смирнова и омега-квадрат и при объемах выборок 6-12.

Критерий Смирнова однородности двух выборок. Он предложен членом-корреспондентом АН СССР Н.В. Смирновым в 1939 г. (см. справочник [8]). Единственное ограничение - функции распределения F(x) и G(x) должны быть непрерывными. Напомним, что согласно Л.Н. Большеву и Н.В. Смирнову [8] значение эмпирической функции распределения в точке х равно доле результатов наблюдений в выборке, меньших х. Критерий Смирнова основан на использовании эмпирических функций распределения F_m(x) и G_n(x) , построенных по первой и второй выборкам соответственно. Значение статистики Смирнова

D_{m,n}=\sup_x |F_m(x)-G_n(x)|

сравнивают с соответствующим критическим значением (см., например, [8]) и по результатам сравнения принимают или отклоняют гипотезу Н_0 о совпадении (другими словами, однородности) функций распределения. Практически значение статистики D_{m,п} рекомендуется согласно монографии [8] вычислять по формулам

D_{m,n}^+=\max_{1 \le y \le n} \left[ \frac{r}{n}-F_m(y'_y)\right]=\max_{1 \le y \le m} \left[ G_n(x'_s)-\frac{s-1}{m}\right],\\
D_{m,n}^- = \max_{1 \le r \le n} \left[ F_m(y'_y)-\frac{r-1}{n} \right]=\max_{1 \le r \le n}\left[\frac{s}{m}-G_n(x'_s)\right],\\
D_{m,n}=\max(D_{m,n}^+, D_{m,n}^-)

где x'_1<x'_2<\dots<x'_m - элементы первой выборки x_1,x_2,\dots,x_m, переставленные в порядке возрастания, а y'_1<y'_2<\dots<y'_n - элементы второй выборки y_1,y_2,\dots,y_n, также переставленные в порядке возрастания.

Разработаны алгоритмы и программы для ЭВМ, позволяющие рассчитывать точные распределения, процентные точки и достигаемый уровень значимости для двухвыборочной статистики Смирнова D_{m,n}, разработаны подробные таблицы (см., например, методику [15], содержащую тексты программ и подробные таблицы).

Однако у критерия Смирнова есть и недостатки. Его распределение сосредоточено в сравнительно небольшом числе точек, поэтому функция распределения растет большими скачками. В результате не удается выдержать заданный уровень значимости, реальный уровень значимости может в несколько раз отличаться от номинального (подробному обсуждению неклассического феномена существенного отличия реального уровня значимости от номинального посвящена работа [16]).

Критерий типа омега-квадрат (Лемана-Розенблатта). Статистика критерия типа омега-квадрат для проверки однородности двух независимых выборок имеет вид:

A  =\frac{mn}{m+n}\int_{-\infty}^{+\infty}(F_m(x)-G_n(x))^2 dH_{m+n}(x)

где H_{m+n}(x) - эмпирическая функция распределения, построенная по объединенной выборке,

H_{m+n}(x) =\frac{m}{m+n}F_m(x)+\frac{n}{m+n}G_n(x)

Статистика A типа омега-квадрат была предложена Э. Леманом в 1951 г., изучена М. Розенблаттом в 1952 г., а затем и другими исследователями. Она зависит лишь от рангов элементов двух выборок в объединенной выборке. Пусть x_1, x_2, \dots, x_m - первая выборка, x'_1 < x'_2 < \dots <x'_m - соответствующий вариационный ряд, y_1, y_2, \dots, y_n -вторая выборка, y'_1<y'_2 \dots <y'_n - вариационный ряд, соответствующий второй выборке. Поскольку функции распределения независимых выборок непрерывны, то с вероятностью 1 все выборочные значения различны, совпадения отсутствуют. Статистика А представляется в виде (см., например, [17]):

A=\frac{1}{mn(m+n)[m\sum_{i=1}^m(r_i-i)^2+n\sum_{j=1}^n(s_j-j)^2]-\frac{4mn-1}{6(m+n)}

где r_i - ранг x'_i и s_j - ранг y'_j в общем вариационном ряду, построенном по объединенной выборке.

Правила принятия решений при проверке однородности двух выборок на основе статистик Смирнова и типа омега-квадрат, т.е. таблицы критических значений в зависимости от уровней значимости и объемов значимости приведены, например, в таблицах [17].

Рекомендации по выбору критерия однородности. Для критерия типа омега-квадрат нет выраженного эффекта различия между номинальными и реальными уровнями значимости. Поэтому мы рекомендуем для проверки однородности функций распределения (гипотеза H_0 ) применять статистику А типа омега-квадрат. Если методическое, табличное или программное обеспечение для статистики Лемана-Розенблатта отсутствует, рекомендуем использовать критерий Смирнова. Для проверки однородности математических ожиданий (гипотеза H'_0 ) целесообразно применять критерий Крамера-Уэлча. По нашему мнению, статистики Стьюдента, Вилкоксона и др. допустимо использовать лишь в отдельных частных случаях, рассмотренных выше.

Некоторые соображения о внедрении современных методов прикладной статистики в практику технических и технико-экономических исследований. Даже из проведенного выше разбора лишь одной из типичных статистических задач - задачи проверки однородности двух выборок - можно сделать вывод о целесообразности широкого развертывания в организациях различных форм собственности работ по критическому анализу сложившейся в технических и технико-экономических исследованиях практики статистической обработки данных и по внедрению накопленного арсенала современных методов прикладной статистики. По нашему мнению, широкого внедрения заслуживают, в частности, методы многомерного статистического анализа, планирования эксперимента, статистики объектов нечисловой природы. Очевидно, рассматриваемые работы должны быть плановыми, организационно оформленными, проводиться мощными самостоятельными организациями и подразделениями. Целесообразно создание службы статистических консультаций в системе научно-исследовательских учреждений и вузов технического и технико-экономического профиля.

Дмитрий Лямин
Дмитрий Лямин
Анна Корнева
Анна Корнева

Подскажите, пожалуйста, помимо самого обучения 1 руб. и отправки диплома по почте (за пересылку), ещё нужно платить за оформление самого диплома или удостоверения?

Ирина Симонян
Ирина Симонян
Армения, Ереван, ЕГУ, 1998
Дмитрий Степаненко
Дмитрий Степаненко
Россия