Новосибирский Государственный Университет
Опубликован: 07.04.2008 | Доступ: свободный | Студентов: 7151 / 1241 | Оценка: 4.56 / 4.32 | Длительность: 16:54:00
Специальности: Математик
Лекция 11:

Числовые характеристики зависимости

< Лекция 10 || Лекция 11: 123 || Лекция 12 >
Аннотация: Ковариация двух случайных величин и ее свойства. Коэффициент корреляции и его свойства

Ковариация двух случайных величин

Мы знаем, что для независимых случайных величин с конечными вторыми моментами дисперсия их суммы равна сумме их дисперсий. В общем случае дисперсия суммы равна

\begin{equation} 
{\mathsf D\,}(\xi+\eta)
={\mathsf D\,}\xi+{\mathsf D\,}\eta + 
2\bigl({\mathsf E\,}(\xi\eta)-{\mathsf E\,}\xi\,{\mathsf E\,}\eta\,\bigr).
\end{equation} ( 18)

Величина {\mathsf E\,}(\xi\eta)-{\mathsf E\,}\xi\,{\mathsf E\,}\eta равняется нулю, если случайные величины \xi и \eta независимы (свойство (E7) математического ожидания). С другой стороны, из равенства ее нулю вовсе не следует независимость, как показывают примеры 50 и 51. Эту величину используют как "индикатор наличия зависимости" между двумя случайными величинами.

Определение 39. Ковариацией {{\rm cov}}(\xi,\,\eta) случайных величин \xi и \eta называется число {{\rm cov}}(\xi,\,\eta)={\mathsf E\,}\bigl((\xi-{\mathsf E\,}\xi)(\eta-{\mathsf E\,}\eta)\bigr).

Свойство 18. Справедливы равенства: {{\rm cov}}(\xi,\,\eta)={\mathsf E\,}(\xi\eta)-{\mathsf E\,}\xi\,{\mathsf E\,}\eta; {{\rm cov}}(\xi,\,\xi)={\mathsf D\,}\xi; {{\rm cov}}(\xi,\,\eta)={{\rm cov}}(\eta,\,\xi); {{\rm cov}}(c\cdot\xi,\,\eta)=c\cdot{{\rm cov}}(\xi,\,\eta)\vphantom{\int_{b_b}}.

Непосредственным возведением суммы в квадрат проверяется следующее свойство.

Свойство 19. Дисперсия суммы нескольких случайных величин вычисляется по любой из следующих формул:

{\mathsf D\,}(\xi_1+\ldots+\xi_n) &=&
\sum\limits_{i=1}^n{\mathsf D\,}\xi_i + \sum\limits_{i\ne j}{{\rm cov}}(\xi_i,\xi_j) = \\
&=&\sum\limits_{i=1}^n{\mathsf D\,}\xi_i + 2\sum\limits_{i < j}{{\rm cov}}(\xi_i,\xi_j) =
\sum\limits_{i,j}{{\rm cov}}(\xi_i,\xi_j).

Обсудим достоинства и недостатки ковариации, как величины, характеризующей зависимость двух случайных величин.

Если ковариация {{\rm cov}}(\xi,\,\eta) отлична от нуля, то величины \xi и \eta зависимы. Чтобы судить о наличии зависимости согласно любому из определений независимости, требуется знать совместное распределение пары \xi и \eta. Но найти совместное распределение часто бывает сложнее, чем посчитать математическое ожидание произведения \xi и \eta. Если нам повезет, и математическое ожидание \xi\eta не будет равняться произведению их математических ожиданий, мы установим зависимость \xi и \eta не находя их совместного распределения. Это очень хорошо.

Пример 65. Покажем, что с помощью ковариации можно судить о зависимости даже тогда, когда для вычисления совместного распределения недостаточно данных. Пусть \xi и \eta - независимые случайные величины и дисперсия \xi отлична от нуля. Покажем, что \xi и \xi+\eta зависимы:

{\mathsf E\,}\bigl(\xi(\xi+\eta)\bigr)={\mathsf E\,}\xi^2+{\mathsf E\,}\xi\,{\mathsf E\,}\eta,
\qquad
{\mathsf E\,}\xi\,{\mathsf E\,}(\xi+\eta)={({\mathsf E\,}\xi)}^2+
{\mathsf E\,}\xi\,{\mathsf E\,}\eta.
Вычитая одно из другого, получим {{\rm cov}}(\xi,\xi+\eta)={\mathsf D\,}\xi>0. Следовательно, \xi и \xi+\eta зависимы.

Упражнение. Доказать, что \xi и \xi+\eta независимы, если {\mathsf D\,}\xi=0.

Величина {{\rm cov}}(\xi,\,\eta) не является "безразмерной": если \xi - объем газа в сосуде, а \eta - давление этого газа, то ковариация измеряется в {\textrm{м}^3{\times}\,\textrm{Па}}. Иначе говоря, при умножении \xi или \eta на 100 ковариация тоже увеличится в 100 раз. Но от умножения на 100 величины не стали "более зависимыми", так что большое значение ковариации не означает более сильной зависимости. Это очень плохо.

Нужно как-то нормировать ковариацию, получив из нее "безразмерную" величину, абсолютное значение которой:

  1. не менялось бы при умножении случайных величин на число;
  2. свидетельствовало бы о "силе зависимости" случайных величин.

Замечание Говоря о "силе" зависимости между случайными величинами, мы имеем в виду следующее. Самая сильная зависимость - функциональная, а из функциональных - линейная зависимость, когда \xi=a\eta+b п.н. Бывают гораздо более слабые зависимости. Так, если по последовательности независимых случайных величин \xi_1,\,\xi_2,\,\dots построить величины \xi=\xi_1+\ldots+\xi_{24}+\xi_{25} и \eta=\xi_{25}+\xi_{26}+\ldots+\xi_{90}, то эти величины зависимы, но очень "слабо": через единственное общее слагаемое \xi_{25}. Сильно ли зависимы число гербов в первых 25 подбрасываниях монеты и число гербов в испытаниях с 25 -го по 90 -е?

Итак, следующая величина есть всего лишь ковариация, нормированная нужным образом.

< Лекция 10 || Лекция 11: 123 || Лекция 12 >
Виктория Монахова
Виктория Монахова
Ulmas Abdullaev
Ulmas Abdullaev

Случайные величины кси1 и кси2 независимы и имеют равномерное распределение на отрезке [0;1]. Найти плотности распределения величин а) кси1-кси2 б) кси1/кси2.