Уральский государственный экономический университет
Опубликован: 24.04.2013 | Доступ: свободный | Студентов: 2935 / 1132 | Длительность: 06:24:00
Специальности: Математик, Физик
Лекция 5:

Элементы математической статистики

5.3. Построение функции распределения и плотности распределения

Нормальное распределение

Функция плотности нормального распределения вероятности случайной величины имеет вид

P(x,m,\sigma)=\frac{1}{\sqrt{2\pi}\sigma}\exp{(\frac{-1}{2\sigma^2}(x-m)^2)} ( 5.3)
где m среднее, \sigma - среднеквадратичное отклонение. Тогда функция нормального распределения будет:
F(x)=\frac{1}{\sqrt{2\pi}\sigma}\int\limits_{-\infty}^x{(\frac{-1}{2\sigma^2}(t-m)^2)dt} ( 5.4)

Пример 5.3

Для СВ, распределенной по нормальному закону построим функцию распределения вероятности , функцию плотности распределения вероятности и графики.

В MathCAD функции распределения находятся в категории Probaility distribution, функции плотности распределения находятся в категории Probability density. Используем функцию pnorm() и dnorm().

Функция pnorm (x, m, \sigma).  – рассчитывает в точке x значение функции распределения вероятности для нормального закона со средним m и среднеквадратичным отклонением \sigma.

Функция dnorm (n, m, \sigma).  – рассчитывает в точке x значение функции плотности распределения вероятности для нормального закона со средним m и среднеквадратичным отклонением \sigma.

На листинге (Рис.5.3, Рис.5.4) созданы два вектора СВ с нормальным распределением и разными параметрами m и \sigma : NR и NR1. В векторе NR NR1) каждое число имеет нормальное распределение с средним m и среднеквадратичным отклонением \sigma.

Построены две функции распределения: FN(x) - для 1 элемента вектора NR_k и FN1(x) - для 1 элемента вектора NR_k. Показаны график функций распределения FN(x) и FN1(x).

m:=1600, \sigma:=100

m1:=500, \sigma1:=100

NR:=rnorm(1000,m,\sigma), NR1:=rnorm(1000,m1,\sigma1)

FN(x):=pnorm[NR_1(x),m,\sigma], FN1(x):=pnorm[NR1_1(x),m,\sigma]

 Листинг решения примера 5.3. Функции  распределения FN(x) и FN1(x) для нормального закона и их графики

Рис. 5.3. Листинг решения примера 5.3. Функции распределения FN(x) и FN1(x) для нормального закона и их графики

DN(x):=dnorm[NR_1(x),m,\sigma], DN1(x):=pnorm[NR1_1(x),m,\sigma]

 Листинг решения примера 5.3. Функции  плотности распределения DN(x) и DN1(x) для нормального закона и их графики

Рис. 5.4. Листинг решения примера 5.3. Функции плотности распределения DN(x) и DN1(x) для нормального закона и их графики

5.4. Построение гистограммы распределения случайной величины

Гистограммой называется график, аппроксимирующий по случайным данным плотность их распределения. При построении гистограммы область значений случайной величины (а,b) разбивается на некоторое количество n сегментов, а затем подсчитывается процент попадания данных в каждый сегмент. Для построения гистограмм в MathCAD имеется несколько встроенных функций. Рассмотрим две функции

Функция hist (int, x) – возвращает вектор частоты попадания случайной величины х в интервалы, определяемые вектором сегментов int на отрезке (a.b), сегменты находятся в порядке возрастания a<int<b.

Функция - histogram (bin, х) – возвращает двумерную матрицу на отрезке (a.b), 1 столбец которой содержит середины разбиения отрезка на bin сегментов , 2 столбец - вектор частоты попадания случайной величины х.

На примере экспоненциального распределения случайной величины с параметром \lambda=20 продемонстрируем технологию построения гистограммы распределения.

Экспоненциальное или показательное распределение

Непрерывная случайная величина х, принимающая неотрицательные значения в полубесконечном интервале (0, \infty), имеет экспоненциальное распределение, если плотность распределения имеет вид:

F(x)=\lambda\epsilon^{\lambda x} ( 5.5)

Функция распределения в этом случае имеет вид:

F(x)=1-\epsilon^{\lambda x} ( 5.6)

где \lambda >0 — положительная постоянная, параметр экспоненциального распределения.

Числовые характеристики экспоненциального распределения определяются по следующим формулам:

Математическое ожидание M(x)=1/\lambda дисперсия D(x)=1/\lambda^2, среднеквадратичное отклонение \sigma(x)=1/\lambda

Пример 5.4

Построим гистограмму распределения для случайной величины с экспоненциальным распределением. Рассмотрим два способа построения.

1 способ. Гистограмма с произвольными сегментами разбиения

Сначала генерируем совокупность СВ, распределенных по экспоненциальному закону с параметром \lambda=20. С помощью функции rexp(n, \lambda). построим массив R из n=1000 случайных величин. Область изменения R лежит в пределах от a=min(R) до b=max(R). Для построения гистограммы используем функцию hist (int, x) для 50 интервалов int=50. Листинг расчета, где получены вектор частоты попадания данных в интервалы гистограммы GR и вектор сегментов int, показан на pис.5.5. MathCAD создает GR и int в виде векторов и представляет в виде таблиц, где 1 столбец номер элементов, 2 столбец значения GR и int, соответственно. Графики построены на плоскости для индексной переменной и в виде для матрицы в де гистограммы и пространственной кривой.

ORIGIN:=1

r:=10, R:=rexp(1000,r)

R=\begin{array}{|c|c|}
\hline 
 & 1 \\ \hline 
20 & 0.069 \\ \hline 
21 & 0.036 \\ \hline 
22 & 0.141 \\ \hline 
23 & ...  \\ \hline 
\end{array}

nint:=50

j:=1..nint

a:=min(R), b:=max(R)

a=1.014\times 10^{-5}, b=0.994

nint_j:=a+\frac{(b-a)}{nint}j, GR:=hist(int,R)

GR=\begin{array}{|c|c|}
\hline 
 & 1 \\ \hline 
1 & 160 \\ \hline 
2 & 131 \\ \hline 
3 & 116 \\ \hline 
4 & ...  \\ \hline 
\end{array}

int=\begin{array}{|c|c|}
\hline 
 & 1 \\ \hline 
27 & 0.537 \\ \hline 
28 & 0.557 \\ \hline 
29 & 0.577 \\ \hline 
30 & ...  \\ \hline 
\end{array}

 Листинг решения примера 5.4. 1 способ построения гистограммы.  Матрица гистограммы GR, матрица интервалов int. Гистграмма на плоскости и в трехмерном пространстве.

увеличить изображение
Рис. 5.5. Листинг решения примера 5.4. 1 способ построения гистограммы. Матрица гистограммы GR, матрица интервалов int. Гистграмма на плоскости и в трехмерном пространстве.
2 способ. Построение матрицы гистограммы

Для построения гистограммы массива R из 1000 СВ используем функцию histogram(bin, х). Область изменения R [a, b] также разобьем на 50 интервалов. MathCAD создает двумерную матрицу GR1, 1 столбец которой содержит середины разбиения отрезка (a, b) на bin=50 сегментов, 2 столбец - вектор частоты попадания случайной величины R. Рис.5.6 представляет матрицу гистограммы GR1 и ее графики. На плоскости график от индексной переменной: - по оси OX первый столбец матрицы, по оси OY – второй столбец матрицы. В пространстве график от матрицы в виде гистограммы и поверхности.

GR1=histogram(int,R)

GR=\begin{array}{|c|c|c|}
\hline 
 & 1 & 2 \\ \hline 
14 & 0.269 & 14 \\ \hline 
15 & 0.288 & 6 \\ \hline 
16 & 0.308 & 14 \\ \hline 
17 & 0.328 & 9 \\ \hline 
18 & 0.348 & 3\\ \hline 
19 & 0.368 & 6 \\ \hline 
20 & 0.388 & 5 \\ \hline 
21 & 0.408 & 1 \\ \hline 
22 & 0.428 & 3 \\ \hline 
23 & 0.448 & 3 \\ \hline 
24 & 0.467 & 0 \\ \hline 
25 & 0.487 & 0 \\ \hline 
26 & 0.507 & 1 \\ \hline 
27 & 0.527 & 0 \\ \hline 
28 & 0.547 & 1 \\ \hline 
29 & 0.567 & 1 \\ \hline
30 & 0.587 & ...  \\ \hline 
\end{array}

 Листинг решения примера 5.4. 2 способ построения гистограммы. Матрица гистограммы GR1. Гистграммы на плоскости и в трехмерном пространстве

увеличить изображение
Рис. 5.6. Листинг решения примера 5.4. 2 способ построения гистограммы. Матрица гистограммы GR1. Гистграммы на плоскости и в трехмерном пространстве

Основные итоги

В лекции представлены методы работы со случайными величинами. Рассмотрены функции всех категорий: Random numbers, pnorm. dnorm \sigma;). Statistics. Probaility distribution, Probability density, с помощью которых можно генерировать случайные последовательности с заданным распределением, рассчитывать вероятности, находить статистические характеристики, строить гистограммы распределений. На примерах показано построение графиков случайных величин в виде одномерной функции индексной переменной и в виде совокупности точек поверхности.

Задания для самостоятельного выполнения

  1. Генерировать вектор из 5000 случайных чисел, распределенных по равномерному закону на отрезке [a,b]: a=5 b=40. Показать графическое представление точек случайной величины. Рассчитать статистические характеристики.
    1. Для сгенерированного вектора построить функцию распределения и плотность распределения. Показать графики и матрицы распределений.
    2. Построить гистограмму распределения для сгенерированной матрицы. Показать графики и матрицы.
  2. Сгенерировать последовательность из 1000 случайных чисел, распределенных по заданному закону. Построить гистограмму. Рассчитать характеристики распределения: математическое ожидание, дисперсию, среднеквадратичное отклонение, медиану. Варианты законов распределения:
    • Нормальный закон распределения , математическое ожидание 3, среднеквадратичное отклонение 1,5.
    • Закон Пуассона, среднее 10.
    • Логнормальный закон, среднее 5, отклонение 2.
    • Гамма-распределение \alpha= 2.
    • Нормальный закон распределения , матожидание 5, отклонение 1.
    • Гамма-распределение (функция rgamma категории random numbers), \alpha= 1.
    • Закон Пуассона, среднее 3.
    • Бета-распределение, \alpha = 2, \beta = 8

Ключевые термины

случайная величина - величина, которая в результате опыта может принять только одно из множества значений, до опыта, неизвестно, какое именно.

функция распределения вероятность P для случайной величины X выполнения неравенства X < х, где х – одно их возможных значений СВ, F(x) = P( X < x ), F(x) - функция аргумента х.

плотность распределения вероятности – для непрерывной случайной величины X первая производная от функции распределения F(x): f(x)=F'(x).

Random number () – категория функций для генерации последовательности случайных величин.

Statistics () - категория функций для расчёта числовых характеристик случайных величин.

Probaility distribution - категория функций для построения распределения вероятности случайных величин.

Probability density - категория функций для построения распределения плотности вероятности случайных величин.

hist () функция вычисления частотного распределения случайной величины для построения гистограммы с произвольными сегментами разбиения.

histogram() функция вычисления частотного распределения случайной величины для построения гистограммы с разбиением на равные сегменты.