Опубликован: 09.11.2009 | Уровень: для всех | Доступ: платный
Лекция 8:

Статистический анализ числовых величин

Аннотация: Описывается точечное и интервальное оценивание основных параметров распределений (математического ожидания, медианы, дисперсии и др). Большая часть лекции посвящена методам проверки однородности характеристик двух независимых или связанных выборок.
Ключевые слова: оценивание, ПО, медиана, дисперсия, коэффициент вариации, интервальная оценка, выборка, объем выборки, функция, выборочной средней, математическим ожиданием, доверительная вероятность, вероятность, случайная величина, нормальное распределение, Квантиль, длина, статистика, основание, доверительный интервал, параметр, неравенство, линеаризация, координаты, значение, постановка задачи, однородность, сегменты, объединение, вероятностная модель, статистические методы, гипотеза, доказательство, товар, показатель эффективности, альтернативные, статистический критерий, мощность, точность, равенство, отношение, разность, множитель, метод статистических испытаний, асимметрия, мощность критерия, место, ранг, принятия решений, таблица, пара функций, график, сходимость, минимум, максимум, значимость критерия, критическая область, отрицание, поиск, альтернатива, шкала измерений, эмпирическая функция, вывод, работ, письмо, биномиальное распределение, интервал, анализ, программное обеспечение, уровень модели

8.1. Оценивание основных характеристик распределения

Одна из основных задач прикладной статистики - оценивание по выборочным данным характеристик генеральной совокупности, таких, как математическое ожидание, медиана, дисперсия, среднее квадратическое отклонение, коэффициент вариации. Точечные оценки строятся очевидным образом - используют выборочные аналоги теоретических характеристик. Для получения интервальных оценок приходится использовать асимптотическую нормальность выборочных моментов и функций от них.

Пусть исходные данные - это выборка x_1, x_2, ..., x_n, где n - объем выборки. Выборочные значения x_1, x_2, ..., x_n рассматриваются как реализации независимых одинаково распределенных случайных величин X_1, X_2, ..., X_n с общей функцией распределения F(x) = P(X_i < x), i = 1,2, ..., n. Поскольку функция распределения произвольна (с точностью до условий регулярности типа существования моментов), то рассматриваемые задачи доверительного оценивания характеристик распределения являются непараметрическими. Существование моментов является скорее математическим ограничением, чем реальным, поскольку практически все реальные статистические данные финитны (т.е. ограничены сверху и снизу, например, шкалой прибора).

В расчетах будут использоваться выборочное среднее арифметическое

\overline{X}=(X_1+X_2+...+X_n)/n,
выборочная дисперсия
S_0^2=\{(X_1-\overline{X})^2+(X_2-\overline{X}^2)+...+(X_n-\overline{X}^2)\}/(n-1)
и некоторые другие выборочные характеристики, которые мы введем позже.

Точечное и интервальное оценивание математического ожидания. Точечной оценкой для математического ожидания в силу закона больших чисел является выборочное среднее арифметическое \overline{X}. В некоторых случаях могут быть использованы и другие оценки. Например, если известно, что распределение симметрично относительно своего центра, то центр распределения является не только математическим ожиданием, но и медианой, а потому для его оценки можно использовать выборочную медиану.

Нижняя доверительная граница для математического ожидания имеет вид

\overline{X}-U(p)s_0/n^{1/2},
где:

  • \overline{X} - выборочное среднее арифметическое;
  • p - доверительная вероятность (истинное значение математического ожидания находится между нижней доверительной границей и верхней доверительной границей с вероятностью, равной доверительной);
  • U(p) - число, заданное равенством \Phi(U(p)) = (1+ p)/2, где \Phi(x) - функция стандартного нормального распределения с математическим ожиданием 0 и дисперсией 1. Например, при p = 95% (т.е. при p = 0,95 ) имеем U(p) = 1,96. Функция U(p) имеется в большинстве литературных источников по теории вероятностей и математической статистике (см., например, [ [ 2.1 ] ]);
  • s_0 - выборочное среднее квадратическое отклонение (квадратный корень из описанной выше выборочной дисперсии).

Верхняя доверительная граница для математического ожидания имеет вид

\overline{X}+U(p)s_0/n^{1/2}.

Выражения для верхней и нижней доверительных границ получены с помощью Центральной предельной теоремы теории вероятностей, теоремы о наследовании сходимости и других результатов "Теоретическая база прикладной статистики" . Они являются асимптотическими, т.е. становятся тем точнее, чем больше объем выборки. В частности, вероятность попадания истинного значения математического ожидания между нижней и верхней доверительными границами асимптотически приближается к доверительной вероятности, но, вообще говоря, может отличаться от нее. Это - недостатки непараметрического подхода. Достоинством же является то, что его можно применять всегда, когда случайная величина имеет математическое ожидание и дисперсию, что в силу финитности (ограниченности шкал) имеет быть практически всегда в реальных ситуациях.

Интересно сопоставить с параметрическим подходом. Обычно в таких случаях предполагают нормальность результатов наблюдений (которой, как уже было обосновано в "Описание данных" , практически никогда нет). Тогда формулы для нижней и верхней доверительных границ для математического ожидания имеют похожий вид, только вместо U(p) стоят квантили распределения Стьюдента (а не нормального распределения, как в приведенных выше формулах), соответствующие объему выборки. Как известно, при росте объема выборки квантили распределения Стьюдента сходятся к соответствующим квантилям стандартного нормального распределения, так что при больших объемах выборок оба подхода дают близкие результаты. Отметим, что классические доверительные интервалы несколько длиннее, поскольку квантили распределения Стьюдента больше квантилей стандартного нормального распределения, хотя это различие, на наш взгляд, и невелико.

Пример 1. Рассмотрим данные о наработке резцов до отказа (см. 6.1, табл.6.2). Для них выборочное среднее арифметическое \overline{X} = 57,88 (это и есть точечная оценка для математического ожидания), выборочная дисперсия s_0^2 = 663,00, объем выборки n = 50. Следовательно, выборочное среднее квадратическое отклонение s_0=\sqrt{663,00}=25,75 и согласно приведенным выше формулам при доверительной вероятности p = 0,95 нижняя доверительная граница для математического ожидания такова:

57,88-1,96\cdot25,75/\sqrt{50}=57,87-7,14=50,74,
а верхняя доверительная граница есть 57,88 + 7,14 = 65,02.

Если заранее известно, что результаты наблюдения имеют нормальное распределение, то нижняя и верхняя доверительная границы для математического ожидания определяются по формулам

\overline{X}-t(p,n-1)s_0/\sqrt{n},\;\overline{X}+t(p,n-1)s_0/\sqrt{n}
соответственно. Эти формулы отличаются от предыдущих тем, что квантиль нормального распределения U(p) заменен на аналогичный квантиль распределения Стьюдента с (n - 1) степенью свободы. Другими словами, t(p, n-1) - это число, заданное равенством ST_{n-1}(p)=(1+p)/2, где ST_{n-1}(х) - функция распределения Стьюдента с (n - 1) степенью свободы.

Для доверительной вероятности р = 0,95 при объеме выборки n = 50 согласно [ [ 2.1 ] ] имеем t(p, n-1) = 2,0096. Следовательно, нижняя доверительная граница для математического ожидания такова:

57,88-2,0096\cdot 25,75/\sqrt{50}=57,88-7,32=50,56,
а верхняя доверительная граница есть 57,88 + 7,32 = 65,20. Таким образом, длина доверительного интервала увеличилась с 14,28 до 14,64, т.е. на 2,5%.

Отметим, что рассматриваемые данные согласуются с гамма-распределением (см. 7.1), а не с нормальным распределением, поэтому использование распределения Стьюдента для получения доверительных границ явно некорректно.

Иногда рекомендуют сначала проверить нормальность результатов наблюдений, а потом, в случае принятия гипотезы нормальности, рассчитывать доверительные границы с использованием квантилей распределения Стьюдента. Однако проверка нормальности - более сложная статистическая процедура, чем оценивание математического ожидания. Кроме того, применение одной статистической процедуры, как правило, нарушает предпосылки следующей процедуры, в частности, независимость результатов наблюдений (см. 7.5). Поэтому цепочка статистических процедур, следующих друг за другом, как правило, образует статистическую технологию, свойства которой неизвестны на современном уровне развития прикладной статистики.

Из сказанного вытекает, что только непараметрическую статистическую процедуру, основанную на асимптотических результатах "Теоретическая база прикладной статистики" , следует применять для анализа реальных данных. Как правило, встречающиеся на практике распределения не являются нормальными (см. 5.1), а потому применение квантилей распределения Стьюдента неправомерно.

Точечное и интервальное оценивание медианы. Точечной оценкой для медианы является выборочная медиана.

Пример 2. Для данных о наработке резцов до отказа объем выборки - четное число, поэтому выборочной медианой является полусумма 25-го и 26-го членов вариационного ряда, т.е. (56 + 56,5)/2 = 56,25.

Чтобы построить доверительные границы для медианы, по доверительной вероятности p находят U(p), как разъяснено выше. Затем вычисляют натуральное число

C(p)=[n/2-U(p)n^{1/2}/2]
где [.] - знак целой части числа. Нижняя доверительная граница для медианы имеет вид
X(C(p)),
где Х(i) - член вариационного ряда с номером i, построенного по исходной выборке (т.е. i -я порядковая статистика). Верхняя доверительная граница для медианы имеет вид
X(n+1-C(p)).
Теоретическое основание для приведенных доверительных границ содержится в литературе по порядковым статистикам (см., например, монографию [ [ 8.11 ] , с.68]).

Пример 3. Для данных о наработке резцов до отказа n = 50. Рассмотрим как обычно, доверительную вероятность p = 0,95. Тогда

C(p)=[50/2-1,96\sqrt{50}/2]=[18,07]=18.

Следовательно, нижней доверительной границей является X(18) = 47,5, а верхней доверительной границей X(50 + 1 - 18) = X(33) = 61,5.

Поскольку в случае нормального распределения медиана совпадает с математическим ожиданием, то каких-либо специальных способов ее оценивания в классическом случае нет.

Точечное и интервальное оценивание дисперсии. Точечной оценкой дисперсии является выборочная дисперсия s_0^4. Эта оценка является несмещенной и состоятельной. Доверительные границы находятся с помощью величины

d^2=(m_4-((n-1)/n)^4 s_0^4)/n,

где m_4 - выборочный четвертый центральный момент, т.е. m_4=\{(X_1-\overline{X})^4+(X_2-\overline{X})^4+...+(X_n-\overline{X})^4\}/n.

Нижняя доверительная граница для дисперсии случайной величины имеет вид

s_0^2-U(p)d,
где:

  • s_0^2 - выборочная дисперсия,
  • U(p) - квантиль нормального распределения порядка (1+p)/2 (как и раньше),
  • d - положительный квадратный корень из величины d^2, введенной выше.

Верхняя доверительная граница для дисперсии случайной величины имеет вид

s_0^2+U(p)d,
где все составляющие имеют тот же смысл, что и выше.

При выводе приведенных соотношений используется асимптотическая нормальность выборочной дисперсии, установленная, например, в учебнике по математической статистике [ [ 8.2 ] , с.419]. Соответственно доверительный интервал является непараметрическим и асимптотическим. В классическом случае точечная оценка имеет тот же вид, а вот доверительные границы находят с помощью квантилей распределения хи-квадрат с числом степеней свободы, на 1 меньшим объема выборки. Отметим, что в случае нормального распределения четвертый момент в 3 раза больше квадрата дисперсии, а потому можно оценить d^2 как (2s_0^4)/n. Это дает быстрый способ для интервальной оценки дисперсии в нормальном случае.

Пример 4. Для данных о наработке резцов до отказа объем выборки n = 50, выборочная дисперсия s_0^2 = 663,00, четвертый выборочный момент m_4 = 1702050,71. Поэтому

d^2=(1702050,71-((50-1)/50)^4 663,00^2 ) /50 = 25932,13.

Тогда d = 161,03. Для доверительной вероятности p=0,95 нижняя доверительная граница для дисперсии случайной величины такова:

663,00 - 1,96 \cdot 161,03 = 663,00 - 315,63 = 347,37,
а верхняя доверительная граница для дисперсии - 663,00+315,63=978,63.

Пример 5. В случае нормального распределения с целью быстрого получения доверительного интервала величина d^2 оценивается как

(2s_0^4)/n=(2\cdot 663,00^2)/50=17582,76,
а потому d = 132,6. Для доверительной вероятности p =0,95 нижняя доверительная граница для дисперсии заменяется на
663,00 - 1,96 \cdot 132,6 = 663,00 - 259,90 = 403,10,
а верхняя доверительная граница - на 663,00+259,90=922,9.

Сужение границ для дисперсии вполне естественно. Данные о наработке резцов до предельного состояния (т.е. до отказа) соответствуют гамма-распределению, а это распределение является асимметричным, с "тяжелым" правым "хвостом". Последнее означает, что плотность убывает заметно медленнее, чем для нормального распределения. Как следствие, четвертый момент заметно больше, чем для нормального распределения с теми же математическим ожиданием и дисперсией. А потому больше и параметр d. Из проведенных расчетов видно, что использование алгоритмов расчетов, соответствующих нормальному распределению, в ситуации, когда распределение результатов наблюдений отлично от нормального, может привести к заметно искаженным выводам.

Пример 6. В классическом случае нормального распределения исходят из того, что величина (n-1)s_0^2/\gigma^2 имеет распределение хи-квадрат с (n - 1) степенью свободы. Для доверительной вероятности p = 0,95 следует рассмотреть неравенство

31,555 < (n - 1) s_0^2/\sigma^2 < 70,222,
справедливое с вероятностью 0,95, поскольку
F(31,555)= 0,025, F(70,222) = 0,975,
где F(x) - функция хи-квадрат распределения с 49 степенями свободы. Следовательно, нижняя доверительная граница для дисперсии нормально распределенной случайной величины такова:
(n-1)s_)^2/70,222=(49 \cdot 663,00)/70,222 = 462,63,
а верхняя доверительная граница есть
(n-1)s_0^2/31,555 = (49 \cdot 663,00)/ 31,555 = 1029,54.

Полученный доверительный интервал не является симметричным относительно точечной оценки. Нижняя доверительная граница больше, чем в примерах 4 и 5, но и верхняя доверительная граница тоже больше. Несимметричность доверительного интервала в примере 6 приводит к тому, что его трудно сопоставить с симметричными интервалами примеров 4 и 5. Что же касается практических рекомендаций, то они однозначны: поскольку обычно нет основания считать данные имеющими нормальное распределение, то при анализе реальных данных надо пользоваться непараметрическими методами, не предполагающими нормальность, т.е. методами, примененными в примере 4.

Точечное и интервальное оценивание среднего квадратического отклонения. Точечной оценкой является выборочное среднее квадратическое отклонение, т.е. неотрицательный квадратный корень из выборочной дисперсии. Дисперсия рассматриваемой случайной величины - выборочного среднего квадратического отклонения s_0 - оценивается как дробь

d^2/(4 s_0^2).

Нижняя доверительная граница для среднего квадратического отклонения исходной случайной величины имеет вид

s_0-U(p)d/(2s_0),
где:

  • s_0^2 - выборочная дисперсия,
  • U(p) - квантиль нормального распределения порядка (1+p)/2 (как и раньше),
  • d - положительный квадратный корень из величины d^2, введенной выше при оценивании дисперсии.

Верхняя доверительная граница для среднего квадратического отклонения исходной случайной величины имеет вид

s_0+U(p)d/(2s_))
, где все составляющие имеют тот же смысл, что и выше.

Пример 7. Для данных о наработке резцов до отказа точечной оценкой для среднего квадратического отклонения является s_0=\sqrt{663,00}=25,75. При доверительной вероятности p=0,95 нижняя доверительная граница такова:

25,75 - 1,96\cdot 161,03 / (2 \cdot 25,75) = 25,75 - 6,13 = 19,62.

Соответственно верхняя доверительная граница симметрична нижней относительно точечной оценки и равна 25,75+6,13=31,88.

Правила интервального оценивания для среднего квадратического отклонения получены из аналогичных правил для оценивания дисперсии с помощью метода линеаризации (см. "Теоретическая база прикладной статистики" или, например, [ [ 1.15 ] , п.2.4]). Как и раньше, доверительный интервал является симметричным, непараметрическим и асимптотическим.

Поскольку среднее квадратическое отклонение - это квадратный корень их дисперсии, то доверительные границы можно получить, извлекая квадратные корни из одноименных границ для дисперсии.

Пример 8. Для данных о наработке резцов до отказа при доверительной вероятности p = 0,95 согласно примеру 4 доверительный интервал для дисперсии - это [347,37; 978,63]. Извлекая квадратные корни, получаем доверительный интервал [18,64; 31,28] для среднего квадратического отклонения, соответствующий тому же значению доверительной вероятности. Он не является симметричным относительно точечной оценки. Его длина 12,64 несколько больше длины симметричного доверительного интервала 12,26 в примере 7.

Классический подход, основанный на гипотезе нормальности распределения результатов наблюдения, связан с использованием распределения хи-квадрат и сводится к извлечению квадратных корней из доверительных границ для дисперсии.

Пример 9. Применяя формально классический подход к данным о наработке резцов до отказа, исходим из доверительного интервала для дисперсии [462,63; 1029,54], соответствующего доверительной вероятности p = 0,95. Извлекая квадратные корни, находим доверительный интервал для среднего квадратического отклонения [21,51; 32,09]. Как и следовало ожидать, длина 10,58 этого несимметричного интервала меньше длины непараметрического доверительного интервала.

Точечное и интервальное оценивание коэффициента вариации. Коэффициент вариации V = \sigma / М(Х) широко используется при анализе конкретных технических, экономических, социологических, медицинских и иных данных (поскольку они, как правило, положительны), но не очень популярен среди теоретиков в области математической статистики. Точечной оценкой теоретического коэффициента вариации V является выборочный коэффициент вариации

V_n=s_0/\overline{X}.

Дисперсия выборочного коэффициента вариации состоятельно оценивается с помощью вспомогательной величины

D^2 = (V_n^4 - V_n^2 / 4 + m_4 /(4s_0^2\overline{X}^2)-m_3/\overline{X}^3) / n ,
где:

  • \overline{X} - выборочное среднее арифметическое,
  • s_0^2 - выборочная дисперсия,
  • m_3 - выборочный третий центральный момент, т.е.
m_3=\{(X_1-\overline{X})^3+(X_2-\overline{X})^3+...+(X_n-\overline{X})^3\}/n,
  • m_4 - выборочный четвертый центральный момент (см. выше),
  • V_n - выборочный коэффициент вариации,
  • n - объем выборки.

Нижняя доверительная граница для (теоретического) коэффициента вариации исходной случайной величины имеет вид

V_n-U(p)D,
где:

  • V_n - выборочный коэффициент вариации,
  • U(p) - квантиль нормального распределения порядка (1+р)/2 (как и ранее),
  • D - положительный квадратный корень из величины D^2, введенной выше.

Верхняя доверительная граница для (теоретического) коэффициента вариации исходной случайной величины имеет вид

V_n+U(p)D,
где все составляющие имеют тот же смысл, что и выше.

Как и в предыдущих случаях, доверительный интервал является непараметрическим и асимптотическим. Он получен в результате применения специальной технологии вывода асимптотических соотношений прикладной статистики (см. "Теоретическая база прикладной статистики" ). Напомним, что эта технология в качестве первого шага использует многомерную центральную предельную теорему, примененную к сумме векторов, координаты которых - степени исходных случайных величин. Второй шаг - преобразование предельного многомерного нормального вектора с целью получения интересующего исследователя вектора. При этом используются соображения линеаризации и отбрасываются бесконечно малые величины. Третий шаг - строгое обоснование полученных результатов на стандартном для асимптотических математико-статистических рассуждений уровне. При этом обычно приходится использовать необходимые и достаточные условия наследования сходимости, полученные в монографии [ [ 1.15 ] , п.2.4]. Именно таким образом были получены приведенные выше результаты для выборочного коэффициента вариации. Формулы оказались существенно более сложными, чем в предыдущих случаях. Это объясняется тем, что выборочный коэффициент вариации - функция двух выборочных моментов, а ранее рассматривались либо выборочные моменты поодиночке, либо функция от одного выборочного момента - выборочной дисперсии.

Пример 10. Для данных о наработке резцов до отказа выборочное среднее арифметическое \overline{X} = 57,88, выборочная дисперсия s_0^2 = 663,00, выборочное среднее квадратическое отклонение s_0 = 25,75, выборочный третий центральный момент m_3 = 14927,91, выборочный четвертый центральный момент m_4 = 1702050,71. Следовательно, выборочный коэффициент вариации таков:

V_n = 25,75 / 57,88 = 0,4449.

Рассчитаем значение вспомогательной величины

\begin{gathered}
D^2 = ((0,4449)^4 - (0,4449)^2 / 4 + 1702050,71 / (4 \cdot 663,00\cdot(57,88)^2) - \\
- 14927,91 / (57,88)^3 ) / 50 = (0,0392 - 0,0495 + 0,1916 - 0,0770)/50 = \\
= 0,1043/50 = 0,002086.
\end{gathered}

Следовательно, D = 0,04567. При доверительной вероятности p = 0,95 нижняя доверительная граница для теоретического коэффициента вариации имеет вид

0,4449 - 1,96\cdot 0,04567 = 0,4449 - 0,0895 = 0,3554,
а верхняя доверительная граница такова:
0,4449 + 0,0895 = 0,5344.

Среди классических результатов математической статистики, основанных на гипотезе нормальности результатов наблюдений, нет методов построения доверительных границ для коэффициента вариации, поскольку задача построения таких границ не выражается в терминах обычно используемых распределений, например, распределений Стьюдента и хи-квадрат.

Примеры применения доверительных границ для коэффициентов вариации при решении прикладных задач приведены, например, в работе [ [ 8.9 ] ], посвященной анализу технических характеристик и показателей качества.

Анастасия Маркова
Анастасия Маркова

Здравствуйте!

4 июня я записалась на курс Прикладная статистика. Заплатила за получение сертификата. Изучала лекции, прошла Тест 1.

Сегодня вижу, что я вне курса! Почему так произошло?

Anton Iskrin
Anton Iskrin
Россия, Москва, МИСиС, 2006
Дмитрий Степаненко
Дмитрий Степаненко
Россия