Числовые характеристики зависимости
Коэффициент корреляции
Определение 40. Коэффициентом корреляции случайных величин и , дисперсии которых существуют и отличны от нуля, называется число
Замечание Чтобы разглядеть "устройство" коэффициента корреляции, распишем по определению числитель и знаменатель:
Перед нами - "косинус угла" между двумя элементами и гильбертова пространства, образованного случайными величинами с нулевым математическим ожиданием и конечным вторым моментом, снабженного скалярным произведением и "нормой", равной корню из дисперсии, или корню из скалярного произведения .Пример 66. Рассмотрим продолжение примера 65, но пусть и будут не только независимыми, но и одинаково распределенными случайными величинами, и их дисперсия отлична от нуля. Найдем коэффициент корреляции величин и :
Коэффициент корреляции величин и равен косинусу угла , образованного "векторами" и , когда и "ортогональны" и их "длина" одинакова.Теорема 33. Коэффициент корреляции обладает свойствами:
- если и независимы, то
- всегда
- тогда и только тогда, когда и п.н. линейно связаны, т.е. существуют числа и такие, что .
Доказательство. Свойство (1) мы уже много раз ( сколько?) упоминали и один раз доказали. Более того, при рассмотрении свойств математического ожидания мы привели примеры 50 и 51 - два из многих возможных примеров того, что свойство (1) в обратную сторону неверно.
Докажем свойство (2). Рассмотрим преобразование случайной величины, называемое стандартизацией. Случайная величина имеет нулевое математическое ожидание и единичную дисперсию:
Коэффициент корреляции теперь запишется проще: . .Далее, неравенство равносильно неравенству
Подставив в него вместо , вместо и взяв математические ожидания всех частей неравенства, получим свойство (2):( 19) |
Докажем свойство (3). В одну сторону утверждение проверяется непосредственно: если , то
Докажем вторую часть свойства (3): если , то существуют числа и такие, что .
Рассмотрим сначала случай . Тогда второе неравенство в формуле (19) превращается в равенство:
Если математическое ожидание неотрицательной случайной величины равно нулю, то , п.н. Поэтому с единичной вероятностью В случае нужно рассмотреть первое неравенство в формуле (19) и повторить рассуждения. Тем самым теорема 33 доказана.Полезно знать следующие часто употребляемые термины.
Определение 41. Говорят, что и отрицательно коррелированы если положительно коррелированы, если некоррелированы, если .
Смысл знака хорошо виден в случае . Тогда знак равен знаку в равенстве п.н. Так, означает, что чем больше , тем больше и . Напротив, означает, что чем больше , тем меньше . Похожим образом можно трактовать знак коэффициента корреляции и в случае, когда , помня при этом, что зависимость между и теперь уже не линейная и, возможно, даже не функциональная.
Так, величины и в примерах 65 и 66 положительно коррелированы, но их зависимость не функциональная.
Следующее свойство показывает, что модуль коэффициента корреляции не меняется при линейных преобразованиях случайных величин.
Свойство 20. Для любых случайных величин и с конечной и ненулевой дисперсией при любых постоянных и имеет место равенство
где - знак .Доказательство. Запишем , не забывая про свойства дисперсии: