Мне нужно изучить математическую статистику с нуля для обработки данных на компьютере. Читаю уже вторую лекцию, но пока ничего даже отдалённо близкого к моей цели не нахожу. Есть ли математическая статистика в дальнейших лекциях? Или я зря теряю время на изучение этого курса? У меня крайне ограниченный временной срок - я не могу терять время на самостоятельную проверку моего вопроса посредством изучения данного курса. |
Показатели вариации в статистике
7.1. Абсолютные и относительные показатели вариации
Рассмотрим две совокупности сотрудников рекламных агентств.
Распределение сотрудников первого агентства по уровню месячной заработной платы представлено в табл. 7.1.
Размер месячной заработной платы, руб. | Середина интервала, xi | Число сотрудников, чел., fi | xi*fi |
---|---|---|---|
4 000-6 000 | 5 000 | 10 | 50 000 |
6 000-8 000 | 7 000 | 6 | 42 000 |
8 000-10 000 | 9 000 | 19 | 171 000 |
10 000-12 000 | 11 000 | 26 | 286 000 |
14 000-16 000 | 15 000 | 10 | 150 000 |
16 000-18 000 | 17 000 | 5 | 85 000 |
Сумма | - | 95 | 1 031 000 |
Распределение сотрудников второго агентства по уровню месячной заработной платы представлено в табл. 7.2.
Размер месячной заработной платы, руб. | Середина интервала, xi | Число сотрудников, чел., fi | xi*fi |
---|---|---|---|
1 500-4 500 | 3 000 | 9 | 27 000 |
4 500-7 500 | 6 000 | 26 | 156 000 |
7 500-10 500 | 9 000 | 24 | 216 000 |
10 500-13 500 | 12 000 | 18 | 216 000 |
13 500-16 500 | 15 000 | 14 | 210 000 |
16 500-19 500 | 18 000 | 10 | 180 000 |
19 500-22 500 | 21 000 | 9 | 189 000 |
Сумма | - | 110 | 1 194 000 |
Рассчитаем средний уровень заработной платы:
- для первого агентства:
- для второго агентства:
Как видим, средние в двух совокупностях практически совпадают между собой (с разницей в 1 руб.). Однако если вы вдруг случайно встретите сотрудников этих агентств и поинтересуетесь уровнем оплаты их труда, то вас заверят, что платят у них вовсе не одинаково! Почему?! Оказывается, что разброс значений вокруг средней в этих совокупностях абсолютно разный. Значит, такой характеристики, как средняя, вовсе не достаточно, чтобы делать выводы о совокупности. Для этого используют показатели вариации.
Вариацией называется изменчивость значений признака у единиц статистической совокупности. Для измерения величины вариации используются абсолютные и относительные показатели вариации.
К абсолютным показателям вариации относятся размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение.
Размах вариации (R) вычисляется как разность между максимальным и минимальным значениями признака
( 7.1) |
Среднее линейное отклонение (d) представляет собой среднюю арифметическую величину из абсолютных значений отклонений отдельных значений признака от их средней. Если данные не сгруппированы, то рассчитывается невзвешенное среднее линейное отклонение
( 7.2) |
Для сгруппированных данных, представленных в виде вариационного ряда, используется взвешенное среднее линейное отклонение, где весами выступают частоты соответствующих вариант:
( 7.3) |
Дисперсией () называется средняя арифметическая величина, полученная из квадратов отклонений значений признака от их средней
- для несгруппированных данных:
( 7.4) - для сгруппированных данных:
( 7.5)
Квадратный корень из дисперсии называется средним квадратическим отклонением (его называют также стандартным отклонением):
- для несгруппированных данных:
( 7.6) - для сгруппированных данных:
( 7.7)
Абсолютные показатели вариации, за исключением дисперсии, имеют те же единицы измерения, что и исследуемый показатель вариационного ряда. Поэтому, если экономическая интерпретация, например, среднего линейного отклонения, проста и понятна физически, то в случае с дисперсией она затруднена. Однако дисперсия рассчитывается в статистическом анализе гораздо чаще, чем другие показатели вариации. Связано это с тем, что дисперсия широко используется в таких видах статистического анализа, как корреляционный, регрессионный, дисперсионный, при оценках результатов выборочного наблюдения. Кроме того, именно с помощью дисперсии можно оценить влияние случайных и систематических факторов на формирование значений случайной величины.
Для сравнения вариации одного и того же показателя в разных совокупностях (например, заработной платы двух рекламных агентств) или вариации разных показателей в одной совокупности (например, вариации заработной платы и возраста в одном рекламном агентстве) используют относительные показатели вариации. К ним относят:
- коэффициент осцилляции:
( 7.8) - относительное линейное отклонение:
( 7.9) - коэффициент вариации:
( 7.9)
Принято считать, что если значение &> 33%, то совокупность неоднородна, и для дальнейшего статистического анализа следует либо исключить крайние значения признака, либо разбить совокупность на однородные группы (требование однородности данных присутствует практически во всех видах статистического анализа).
Рассчитаем показатели вариации для приведенных в табл. 7.1 и 7.2 вариационных рядов (табл. 7.3 и 7.4).
Размер месячной заработной платы, руб. | Середина интервала, xi | Число сотрудников, чел., yj | (xi-x)*f | (xi-x)2*f |
---|---|---|---|---|
4 000-6 000 | 5 000 | 10 | 58 530 | 342 576 090 |
6 000-8 000 | 7 000 | 6 | 23 118 | 89 073 654 |
8 000-10 000 | 9 000 | 19 | 35 207 | 65 238 571 |
10 000-12 000 | 11 000 | 26 | 3 822 | 561 834 |
12 000-14 000 | 13 000 | 19 | 40 753 | 87 582 571 |
14 000-16 000 | 15 000 | 10 | 41 470 | 171 976 090 |
16 000-18 000 | 17 000 | 5 | 30 735 | 188 928 045 |
Сумма | - | 95 | 233 675 | 945 936 855 |
По первому агентству получим следующие данные.
Размах вариации:
R = xmax - xmin = 18 000 - 4000 = 14 000 (руб.).
Среднее линейное отклонение (так как ряд сгруппирован и частоты не равны между собой) рассчитываем как взвешенную величину:
Среднее квадратическое отклонение:
Коэффициент осцилляции:
Относительное линейное отклонение:
Судя по коэффициенту вариации, совокупность по данному признаку можно считать однородной.
Проведем расчет аналогичных характеристик вариации по второму агентству (табл. 7.4).
Размер месячной заработной платы, руб. | Середина интервала, xi | Число сотрудников, чел., yj | (xi - x)*f | (xi - x)2*f |
---|---|---|---|---|
1 500-4 500 | 3 000 | 9 | 70 686 | 555 167 844 |
4 500-7 500 | 6 000 | 26 | 126 204 | 612 594 216 |
7 500-10 500 | 9 000 | 24 | 44 496 | 82 495 584 |
10 500-13 500 | 12 000 | 18 | 20 628 | 23 639 688 |
13 500-16 500 | 15 000 | 14 | 58 044 | 240 650 424 |
16 500-19 500 | 18 000 | 10 | 71 460 | 510 653 160 |
19 500-22 500 | 21 000 | 9 | 91 314 | 926 471 844 |
Сумма | - | 110 | 482 832 | 2 951 672 760 |
Показатели вариации по второму агентству:
Размах вариации:
R = 22 500 - 1500 = 21 000 (руб.);
Среднее линейное отклонение:
Среднее квадратическое отклонение - 5180 (руб.).
Коэффициент осцилляции - 193%.
Относительное линейное отклонение - 40%.
Таким образом, по данному признаку вторая совокупность сотрудников неоднородна.
Сравнение относительных показателей вариации по двум совокупностям говорит о том, что дифференциация по уровню заработной платы во втором агентстве гораздо выше, чем в первом, хотя их средние практически совпадают между собой.