Опубликован: 28.04.2012 | Доступ: свободный | Студентов: 3087 / 876 | Оценка: 3.86 / 2.57 | Длительность: 07:45:00
Специальности: Математик, Преподаватель
Лекция 5:

Функция распределения случайной величины. Виды распределения

Сравнение экспериментальных распределений с нормальным законом

Для того чтобы сравнивать любое экспериментальное распределение с нормальным, выполняют стандартизацию распределения по следующему несложному алгоритму.

1. Строят графики функций распределения экспериментального и нормального рядов в едином масштабе, после чего совмещают эти графики наложением друг на друга, начиная с нулевой точки

Графическая интерпретация алгоритма стандартизации функции распределения

Рис. 9.15. Графическая интерпретация алгоритма стандартизации функции распределения

2. Может случиться так, что линии $x=a$ для нормального ряда и $x=\overline x$ для экспериментаьлного совпадут, как на рис.9.15б . Тогда данный пункт алгоритма следует опустить и сразу перейти к следующему. Но если эти линии не совпадают (рис.9.15а ), то тогда от каждого элемента экспериментального ряда отнимают, если $\overline x >a$ (прибавляют, если $\overline x<a $ ) величину, равную $|\overline x -a |$. Эта операция называется центрированием. Она позволяет совместить на одной прямой максимумы построенных функций (рис.9.15 б). Таким образом в результате данного шага от исходного экспериментального ряда переходят к

\[ x_{i}^*= x_{i}-|\overline x-a| \ или \ x_{i}^*=x_{i}+|\overline x-a|. \] ( 26)

3. Завершают процедуру стандартизации ряда операцией нормировки на рассеяние (рис.9.15в ) по формуле

\[ z_{i}=\frac {x_{i}^*} {\sigma}=\frac {x_{i}-|\overline x-a|} {\sigma } \ или \ z_{i}=\frac {x_{i}^*} {\sigma}=\frac {x_{i}+|\overline x-a|} {\sigma }.\] ( 27)
Полученное распределение можно сравнивать с нормальным (эталонным). А функция распределения нового (преобразованного) ряда $f(z)$ в силу своих особенностей, которые здесь не обсуждаются, получила название кумулятивной функции распределения.

Если построенное нормальное распределение $f(x)$ имеет $a=0$ и $\sigma=1$, то график называют нормированным, а функция $f(x)$ обладает всеми свойствами нормированной кривой. Такие функции широко используются для расчетов теоретических кривых распределений. А сама $f(x)$ выглядит следующим образом

\[ f(x)= -\frac 1 {\sqrt{2\pi}} e^{-\frac {x^2} 2}  \] ( 28)
Очевидно, что функция (28) является четной, т.е. $f(-x)=f(x)$.

Для того чтобы определить, находится ли экспериментальная величина в границах таких, как если бы она была бы нормально распределена, исследуют кумулятивную функцию распределения, больше известную как функцию Лапласа

\[ \Phi(z)=\frac 2 {\sqrt{2\pi}}\int\limits_{-\infty}^{z}e^{-\frac {z^2} 2}dz \] ( 29)
где $ z=\frac {x-M_{X}} {\sigma}$. Тогда на основании свойства 2 интегральной функции распределения, вероятность того, что случайная величина попадет в интервал $[x_{1};x_{2}]$ определиться из
\[ P(x_{1} \leqslant x \leqslant x_{2})=\frac 1 2 \left (\Phi(x_{2})-\Phi(x_{1}) \right ), \] ( 30)
где $x_{1}=\frac {x_{1}-M_{X}} {\sigma}; \ x_{2}=\frac {x_{2}-M_{X}} {\sigma}$.

Из равенства (30) и свойства $\sigma$ можно сформулировать правило 3-х сигм, известное как критерий Чебышева.

Правило 3-х сигм (критерий Чебышева). Если случайная величина распределена по нормальному закону, то отклонение этой величины от математического ожидания ряда не превосходит $3\sigma$ влево и вправо от $M_{X}$.

Это правило на практике используется как необходимое условие для того, чтобы данный экспериментальный ряд был распределен по нормальному закону. Это значит что, если правило $3\sigma$ не выполняется, то ряд экспериментальных данных не подчиняется нормальному закону распределения. Но это утверждение не всегда верно в "обратную сторону", т.е. если правило $3\sigma$ выполняется, то ряд экспериментальных данных подчиняется нормальному закону распределения. Иными словами, выполнение этого правила не гарантирует, что исследуемый ряд распределен нор-мально. Необходимы дополнительные исследования ряда.

Пример 3. Установлено, что при измерении диаметра валика микрометром случайная погрешность измерений подчиняется нормальному закону распределения со средним квадратическим отклонением $\sigma=0,12$ мм. Систематической погрешностью пренебрегаем. Найти вероятность того, что измерения проводились с ошибкой не более, чем $\pm 0,2$ мм.

Решение. Определим $x_{1}$ для формулы (30). Данное значение 0,2 – это среднее отклонение $x_{i}$ конкретного измерения от математического ожидания, следовательно, $x_{1\frax {0,2} {0,12} \approx 1,67$. О наименьшем значении $x_{2}$ ничего в задаче не сказано, поэтому примем его равным нулю, т.е. измерения выполнялись вообще без погрешностей. Тогда с учетом сказанного, получаем

\[P \left ( |x| < 0,2 \right )=\Phi \left ( \frac {0,2} {0,12}\right ) =\Phi \left (1,67 \right ) = 0,9051  \] ( 31)

Значение функции $\Phi(x)$ для конкретного $x$ берется из специальных таблиц.

Биноминальное распределение

Биноминальным распределением называется функция распределения вероятностей появления $m$ событий в $n$ независимых испытаниях, в каждом из которых вероятность появления события постоянна и равна $p$:

\[p(x=m)=C_{n}^m p^m q^{n-m}  \] ( 32)
где $q=1-p; \ m=0,1,2, \cdot , n$. Очевидно, что
\[ F(x)=\left\{\begin{array}{ccc}{0, \ \ \ \ \ \ n \leqslant 0}\\{\sum\limits_{m=0}^n p_{m,n}, 0 <m \leqslant n}\\{1, m>n}, \\ \end{array}\right}  \] ( 33)
Из равенства (32) следует
\[ M_{X}=np, \]
т.е. математическое ожидание равно вероятности, что в $n$ событиях искомое событие состоится хотя бы один раз.

Теорема Муавра-Лапласа

Эту теорему используют для вычисления $p_{m,n}$ вместо формулы (31), если достаточно большое число. Эта теорема относится к предельным теоремам, которые используются вместо основных, если речь идет о большом количестве испытаний. В Математической статистике подобных теорем достаточно много.

Теорема. Если вероятность наступления события $A$ в $n$ независимых испытаниях есть величина постоянная и отличная от нуля, то вероятность того, что в $n$ испытаниях событие $A$ насупит $m$ раз равна

\[ p_{m,n}=\frac 1 {\sqrt {mpq}} \cdot f(t), \] ( 34)
где
\[ f(t)=\frac 1 {\sqrt {2\pi}} e^{- \frac {t^2} 2}, \ t=\frac {m-np} {\sqrt {npq}}  \] ( 35)

Пример 4. Вероятность того, что на морском берегу среди камней найдется гладкий (обкатанный) равна $\frac 8 9$. За 3 часа прогулки по берегу Некто собрал 280 разных по форме камушков. Найти вероятность того, что 20 камней из собранных будут не гладкими (не обкатанными прибоем).

Решение. Так как в задаче речь идет о большом количестве образцов ( ), то здесь следует воспользоваться теоремой Маувра-Лапласа (34) – (35). Для этого выполним некоторые предварительные расчеты по формулам (35).

\[ t=\frac {m-np} {\sqrt {npq}}=\frac {20-280 \cdot \frac 19} {\sqrt {280 \cdot \frac 1 9 \cdot \frac 8 9}} = -2,11 \]
Здесь за $q$ принимаем $\frac 8 9 $, тогда $p=1-q=\frac 1 9$. По специальным таблицам определяем значение функции распределения
\[ f(-t)=f(t)=0,0431 \]
Найденное значение подставим в формулу (34) и окончательно получим
\[  p_{20,280}=\frac {0,0431} {\sqrt {280 \cdot \frac 1 9 \cdot \frac 8 9}} \approx 0,0082.\]