НОУ ИНТУИТ | Введение в математику. Лекция 14: Элементы теории вероятностей и математической статистики

Учитесь и получайте официальные документы БЕСПЛАТНО. Вы можете поддержать наш проект.

Регистрация Вход

Твой путь к знаниям!

Кабардино-Балкарский государственный университет

Опубликован: 18.04.2007 | Доступ: свободный | Студентов: 12045 / 2526 | Оценка: 4.16 / 4.04 | Длительность: 14:52:00

ISBN: 978-5-9556-0105-2

Тема: Математика

Специальности: Математик

|

Вам нравится? Нравится 124 студентам

| Поделиться |

Поддержать курс

| Скачать электронную книгу

Часто используется стандартное нормальное распределение или распределение вероятностей нахождения (попадания) случайной величины в интервал (a;b). Для вычисления значений такой функции используется интеграл (таблица значений этого, не берущегося в квадратурах, интеграла):

$\Phi(x) = \int\limits_{-\infty}^{x} \frac {1}{\sqrt{2\pi}} \exp \bigl(-\frac {z^2}2 \bigr)\,dz.$

Если известно среднее уклонение случайной величины (средне квадратичное, например), то можно получить представление о величине уклонения ожидаемых фактических значений. Количественную оценку этого дает неравенство П.Л. Чебышева.

Рассмотрим дисперсию с весами

$D=\frac {1}{n-1}\sum\limits^n_{i=1} (x_i-\bar x)^2p_i.$

Пусть a>0 - произвольное число. В сумме D выбросим все слагаемые, которые не превосходят a, тогда получим новую сумму D_a: $D_a\le D$ . Сумма D_a - есть сумма вероятностей всех тех значений x_i, которые уклоняются от среднего в ту или иную сторону на величину, большую, чем a. По правилу сложения, это будет вероятность того, что величина x получит какое-либо одно из этих значений, то есть вероятность того, что ожидаемое фактическое уклонение окажется больше, чем a. Обозначают эту вероятность так:

$P(|x-\bar x|>a)\le D/(a^2).$

Это неравенство называется неравенством Чебышева. Оно позволяет оценить вероятность уклонений, больших, чем любое заданное число a, если известна дисперсия D (среднеквадратичное отклонение).

Пример. Пусть для заданного ряда чисел имеем: x=100, D=2. Тогда вероятность получения уклонения в измерениях большего, чем 5, будет оцениваться как

$P(|x-100|>5)\le 2/25=0,08.$

Пусть имеются n взаимно независимых случайных величин $x_1, x_2,\dotsc, x_n$ с одними и теми же средним значением b и средним квадратичным уклонением c. Найдем среднее арифметическое этих величин (используя свойства, рассмотренные выше):

$\bar x = \frac {\overline{x_1+x_2+\dotsc+x_n}}{n} = \frac {\bar x_1+\bar x_2+\dotsc+\bar x_n}{n} = \frac {n\bar x}{n} =\bar x =b .$

Аналогично можно показать, что дисперсия суммы взаимно независимых случайных величин равна сумме их дисперсий. Имеет место формула

$\sigma =\sqrt{D} = \sqrt{\sum\limits^n_{i=1}D_i} = \frac {c}{\sqrt{n}}.$

Из неравенства Чебышева получаем

$P(|x-b|>a)\le c/(a^2n).$

Для любого малого a можно подобрать такое большое n, что правую часть последнего неравенства можно сделать сколь угодно малой, то есть при достаточно большом значении n можно считать имеющим сколь угодно большую (близкую к 1 ) вероятность неравенства вида $|x-b|\le a$ .

Этот закон называется законом больших чисел (в его наиболее простой форме). Он был открыт также П.Л. Чебышевым.

Пример. Для предыдущего примера найдем такое n для a=0,1. Получаем неравенство

$P(|x- 100|>0,1)\le 2/(0,01n).$

Например, чтобы сделать правую часть меньше, чем 0,01, необходимо решить неравенство: 2/(0,01n)<0,01, то есть n>2000.

Располагая каким-то распределением величин опытного происхождения, можно исследовать возможность описания этой совокупности каким-либо распределением, рассмотренным выше (если тип распределения неизвестен) или найти (идентифицировать) неизвестный параметр распределения (если тип распределения выяснен), а также эффективность того или иного описания.

Такого рода вопросы формируются обычно в виде статистических гипотез - предположений, обосновываемых или опровергаемых далее.

Пример. Гипотеза первая: данная выборка произведена из нормально распределенной генеральной совокупности. Гипотеза вторая: дисперсии двух рассматриваемых распределений совокупностей равны.

Есть процедуры, позволяющие отвергнуть проверяемую гипотезу как противоречащую имеющимся данным, либо убедиться в том, что гипотеза этим данным не противоречит.

Наиболее часто проверяемой гипотезой является гипотеза о нормальности распределения, то есть о подчиненности ряда нормальному распределению (распределению Гаусса).

Выше, при рассмотрении задачи аппроксимации мы указывали, что экспериментальные данные, по которым отыскивается эмпирическая формула, подвержены ошибкам, например, ошибкам округления. Мы предполагали при этом (правда, неявно), что эти ошибки носят детерминированный характер. Но экспериментальные данные, а также ошибки могут иметь и случайный характер. Такая ситуация встречается чаще. Подход и метод наименьших квадратов, рассмотренные при решении задачи аппроксимации, пригодны и в этих, изменившихся качественно, условиях. Зависимости y=f(x₁, x₂, ..., x_n), определенные для случайных наборов данных и снабженные соответствующими статистическими оценками адекватности, предсказания, как в целом, так и по отдельным факторам x_i, i=1,2,...,n, называются регрессионными зависимостями , а сама зависимость - многофакторной регрессионной зависимостью . Возможны и однофакторные зависимости y=f(x). Обычно ищут линейную зависимость вида y=a₀+a₁x₁+a₂x₂+...+a_nx_n. В других случаях ищут квадратичную многофакторную зависимость. В предыдущем разделе мы рассматривали, как можно методом наименьших квадратов найти однофакторную модель.

Дальше >>

Авторизоваться

Введение в математику

Элементы теории вероятностей и математической статистики

Вопросы и ответы