Новосибирский Государственный Университет
Опубликован: 07.04.2008 | Доступ: свободный | Студентов: 7151 / 1241 | Оценка: 4.56 / 4.32 | Длительность: 16:54:00
Специальности: Математик
Лекция 11:

Числовые характеристики зависимости

< Лекция 10 || Лекция 11: 123 || Лекция 12 >

Примеры

Пример 67. Если \xi и \eta суть координаты точки, брошенной наудачу в треугольник D с вершинами (2,0), (0,0) и (0,1), то их коэффициент корреляции \rho(\xi,\,\eta) отрицателен. Это можно объяснить так: чем больше \xi, тем меньше у \eta возможностей быть большой.

Полезно убедиться в этом, проверив справедливость следующих высказываний. Во-первых,

f_\xi(x)=\begin{cases} 
1-\frac{x}{2}, & 0\le x\le 2, \\
0, & \text{ иначе};
\end{cases}  \quad
f_\eta(y)=\begin{cases} 
2-2y, & 0\le y\le 1, \\
0, & \text{ иначе }
\end{cases}
и вычисленные по этим плотностям средние ( вычислить ) равны соответственно {\mathsf E\,}\xi=2/3 и {\mathsf E\,}\eta=1/3.

Во-вторых, по определению многомерного равномерного распределения в области D,

{\mathsf E\,}(\xi\,\eta)=\mathop{\int\int}\limits_{\!\!D} 
x\cdot y \cdot 1\,\,dx\,dy=
\int\limits_0^2\;\smash{\int\limits_{0}^{\,1{-}x/2}}
x\,y \;dy\,\;dx=\frac16.
Ковариация (а с ней и коэффициент корреляции) отрицательна.

Пример 68. Найдем коэффициент корреляции между числом выпадений единицы и числом выпадений шестерки при n подбрасываниях правильной игральной кости.

Обозначим для i\in\{1,\,\dots,\,6\} через \xi_i случайную величину, равную числу выпадений грани с i очками при n подбрасываниях кубика. Посчитаем {{\rm cov}}(\xi_1,\,\xi_6). Каждая из случайных величин \xi_i имеет биномиальное распределение с параметрами n и \frac16, поэтому {\mathsf E\,}\xi_i=\frac{n}{6}   , {\mathsf D\,}\xi_i=\frac{5n}{36}.

Далее заметим, что \xi_1+\ldots+\xi_6=n. Из-за симметрии кубика математические ожидания {\mathsf E\,}\xi_1\xi_2, \vphantom{\int^b}{\mathsf E\,}\xi_1\xi_3, {\mathsf E\,}\xi_1\xi_6 одинаковы, но отличаются от {\mathsf E\,}\xi_1\xi_1={\mathsf E\,}\xi_1^2={\mathsf D\,}\xi_1+{({\mathsf E\,}\xi_1)}^2=
\frac{5n}{36}+\frac{n^2}{36}. Посчитаем {\mathsf E\,}\xi_1(\xi_1+\dots+\xi_6). С одной стороны, это число равно

{\mathsf E\,}\xi_1(\xi_1+\ldots+\xi_6)={\mathsf E\,}\xi_1\cdot n =
\frac{n^2}{6}.
С другой стороны,
{\mathsf E\,}\xi_1(\xi_1+\ldots+\xi_6)={\mathsf E\,}\xi_1^2+5{\mathsf E\,}\xi_1\xi_6
=\frac{5n}{36}+\frac{n^2}{36} + 5{\mathsf E\,}\xi_1\xi_6.
Отсюда 5{\mathsf E\,}\xi_1\xi_6=\frac{n^2}{6}-\frac{5n}{36}-\frac{n^2}{36}, т.е. {\mathsf E\,}\xi_1\xi_6=\frac{n^2-n}{36}. Следовательно, искомый коэффициент корреляции равен
\rho(\xi_1,\, \xi_6)=
\frac{{\mathsf E\,}\xi_1\xi_6-{\mathsf E\,}\xi_1{\mathsf E\,}\xi_6}{\sqrt{\vphantom{a^2}{\mathsf D\,}\xi_1{\mathsf D\,}\xi_6}}
=\frac{(n^2-n)/36-n^2/36}{5n/36}=-\frac15.
Интересно, что полученный коэффициент корреляции не зависит от n.

Пример 69. Вычислим математическое ожидание и дисперсию гипергеометрического распределения. Мы не могли сделать это раньше, так как очень не хотели вычислять следующие суммы:

{\mathsf E\,}\xi=\sum\limits_k k\,\frac{C_K^k C_{N-K}^{n-k}}{C_N^n},
\qquad 
{\mathsf E\,}\xi^2=\sum\limits_k k^2\,\frac{C_K^k C_{N-K}^{n-k}}{C_N^n},
где, напомним (чтобы читатель окончательно отказался от мысли вычислить эти суммы напрямую), суммирование ведется по целым k таким, что {0\le k\le K} и 0\le
n-k\le N-K.

Рассмотрим урну, содержащую K белых шаров и N-K не белых, и пусть из нее наудачу и без возвращения выбирают по одному n шаров. Свяжем случайную величину \xi, равную числу белых шаров среди n выбранных, с результатами отдельных извлечений шаров.

Обозначим через \xi_i, где i=1,\,\ldots,\,n, "индикатор" того, что iпо счету вынутый шар оказался белым: \xi_i=1, если при i -м извлечении появился белый шар, иначе \xi_i=0. Тогда \xi=\xi_1+\ldots+\xi_n - число появившихся белых шаров, и математическое ожидание считается просто:

{\mathsf E\,}
\xi={\mathsf E\,}(\xi_1+\ldots+\xi_n)={\mathsf E\,}\xi_1+\ldots+{\mathsf E\,}\xi_n.

Убедимся, что случайные величины \xi_1,\,\ldots,\,\xi_n имеют одно и то же распределение Бернулли \mathrm B_p\mspace{1mu}, где p=K\mspace{2mu}/\mspace{2mu}N.

Пронумеруем шары: белые - номерами от одного до K, остальные - номерами от K+1 до N. Элементарным исходом опыта является набор из n номеров шаров в схеме выбора n элементов из N без возвращения и с учетом порядка. Общее число исходов равно |\Omega|=C_N^n.

Вычислим вероятность события A_i=\{\xi_i=1\}. Событие A_i включает в себя элементарные исходы (наборы), в которых на i -м месте стоит любой из номеров белых шаров, а остальные n-1 место занимают любые из оставшихся N-1 номеров. По теореме 1 о перемножении шансов число благоприятных событию A_i исходов есть произведение K и A_{N-1}^{n-1}. Здесь K есть число способов поставить на iместо один из номеров белых шаров, A_{N-1}^{n-1} - число способов после этого разместить на оставшихся n-1 местах остальные N-1 номеров шаров. Но тогда

p=\Prob(\xi_i=1)=\Prob(A_i)=\frac{|A_i|}{|\mspace{4mu}\Omega\mspace{4mu}|}=\frac{K C_{N-1}^{n-1}}{C_N^n}}=\frac{K}{N}\,
что совершенно очевидно: вероятность 20-му шару быть белым, если мы ничего не знаем про первые 19, точно такая же, как вероятность первому шару быть белым и равна отношению числа белых шаров к числу всех.

Вернемся к математическому ожиданию:

{\mathsf E\,}
\xi={\mathsf E\,}\xi_1+\ldots+{\mathsf E\,}\xi_n=n{\mathsf E\,}\xi_1=np=\frac{nK}{N}\,.

Вычислим дисперсию \xi. До сих пор мы не интересовались совместным распределением \xi_1,\,\ldots,\,\xi_n: для вычисления математического ожидания их суммы нам было достаточно знания маргинальных распределений этих величин. Но дисперсия суммы уже не всегда равна сумме дисперсий. Зависимость величин \xi_1,\,\ldots,\,\xi_n очевидна: если, скажем, случилось событие A_1=\{\xi_1=1\}, то вероятность второму шару быть белым уже не равна отношению K\mspace{2mu}/\mspace{2mu}N:

\Prob(\xi_2=1\,\cond
\,\xi_1=1)=\frac{K\mspace{1mu}{-}\mspace{1mu}1}{N\mspace{1mu}{-}\mspace{1mu}1} \neq \frac{K}{N}=\Prob(\xi_2=1).
Поэтому при вычислении дисперсии будем пользоваться свойством 19. Вычислим ковариацию величин \xi_i и \xi_j, i\ne
j. Для этого сначала посчитаем {\mathsf E\,}(\xi_i\xi_j). Произведение \xi_i\xi_j снова имеет распределение Бернулли: {\xi_i\xi_j=1,} если при i\mspace{-2mu} -м и j\mspace{-1mu} -м извлечениях появились белые шары. Вероятность этого события равна
\Prob(\xi_i\xi_j=1)=\Prob(A_i\cap A_j)=
\frac{|A_i\cap
A_j|}{|\,\Omega\,|}=\frac{K(K-1)C_{N-2}^{n-2}}{C_N^n}}
=\frac{K(K\mspace{1mu}{-}\mspace{1mu}1)}{N(N\mspace{1mu}{-}\mspace{1mu}1)}.
Тогда
{{\rm cov}}(\xi_i,\,\xi_j)={\mathsf E\,}(\xi_i\xi_j)-{\mathsf E\,}\xi_i{\mathsf E\,}\xi_j=
\frac{K(K\mspace{1mu}{-}\mspace{1mu}1)}{N(N\mspace{1mu}{-}\mspace{1mu}1)}-
\frac{K}{N}\,\frac{K}{N}=-\frac{K(N\mspace{1mu}{-}\mspace{1mu}K)}{N^{2\mathstrut}(N\mspace{1mu}{-}\mspace{1mu}1)}.
Подставляя одинаковые дисперсии {\mathsf D\,}\xi_i=p(1-p) и эти не зависящие от i и j ковариации в формулу дисперсии суммы, получаем
{\mathsf D\,}\xi &=&{\mathsf D\,}(\xi_1+\ldots+\xi_n)=
\sum\limits_{i=1}^n{\mathsf D\,}\xi_i + \sum\limits_{i\ne j}{{\rm cov}}(\xi_i,\xi_j)= \\
&=&np(1-p)+n(n-1){{\rm cov}}(\xi_1,\,\xi_2)=\\[2mm]
&=&n\,\frac{K}{N}\Bigl(1-\frac{K}{N}\Bigr)-
n(n\mspace{1mu}{-}\mspace{1mu}1)\frac{K(N\mspace{1mu}{-}\mspace{1mu}K)}{N^{2\mathstrut}(N\mspace{1mu}{-}\mspace{1mu}1)}
=n\,\frac{K}{N}\Bigl(1-\frac{K}{N}\Bigr)\Bigl(1-\frac{n\mspace{1mu}{-}\mspace{1mu}1}{N\mspace{1mu}{-}\mspace{1mu}1}\Bigr).

Заметим любопытнейшую вещь: если вынимать шары с возвращением, то испытания станут независимыми испытаниями в схеме Бернулли; cтавшие независимыми величины \xi_i в сумме дадут число белых шаров, имеющее биномиальное распределение с параметрами n и p=\frac{K}{N} и точно такое же математическое ожидание np=\frac{nK}{N}, как и у числа белых шаров при выборе без возвращения}.

Дисперсия же у числа белых шаров при выборе без возвращения меньше, чем при выборе с возвращением - за счет отрицательной коррелированности слагаемых \xi_i и \xi_j при i\ne j.

< Лекция 10 || Лекция 11: 123 || Лекция 12 >
Виктория Монахова
Виктория Монахова
Ulmas Abdullaev
Ulmas Abdullaev

Случайные величины кси1 и кси2 независимы и имеют равномерное распределение на отрезке [0;1]. Найти плотности распределения величин а) кси1-кси2 б) кси1/кси2.