Не могу найти требования по оформлению выпускной контрольной работы по курсу профессиональной переподготовки "Менеджмент предприятия" |
Основы эконометрических методов
Асимптотическое распределение прогностической функции. Из формул (5) и (6) следует, что
![M(x^*(t))=M{a^*(t-t_{cp}+b^*}=M(a^*)(t-t_{cp})+M(b^*)=a(t-t_{cp})+b=x(t)](/sites/default/files/tex_cache/c7c93024bdf1f8d2696acab238598db1.png)
т.е. рассматриваемая оценка прогностической функции является несмещенной. Поэтому
![D(x^*(t))=D(a^*)(t-t_{cp})^2+2M{(a^*-a)(b^*-b)(t-t_{cp}}+D(b^*)](/sites/default/files/tex_cache/e02b55b3e075784df143b57275e44f8d.png)
При этом, поскольку погрешности независимы в совокупности и , то
![M{(a^*-a)(b^*-b)(t-t_{cp})}=\frac{1}{n}\sum_{i=1}^n c_i(t-t_{cp})M(e_i^2)=\frac{1}{n}(t-t_{cp})\sigma^2\sum_{i=1}^n c_i=0](/sites/default/files/tex_cache/a0be17fb1a58da017ec59d5a4caac672.png)
Таким образом,
![D(x^*(t))=\sigma^2{\frac{1}{n}+\frac{(t-t_{cp})^2}{\sum_{i=1}^n(t_i - t_{cp})^2}](/sites/default/files/tex_cache/8c75916152f8e4592a01d1975faede60.png)
Итак, оценка является несмещенной и асимптотически нормальной. Для ее практического использования необходимо уметь оценивать остаточную дисперсию
Оценивание остаточной дисперсии. В точках , имеются исходные значения зависимой переменной
и восстановленные значения
. Рассмотрим остаточную сумму квадратов
![SS=\sum_{i=1}^n(x^*(t_i)-x(t_i))^2=\sum_{i=1}^2\{(a^*-a)(t_i-t_{cp})+(b^*-b)-e_i)^2](/sites/default/files/tex_cache/734e7d41b7461aee8e30a7178e20995b.png)
В соответствии с формулами (5) и (6)
![SS=\sum_{i=1}^n\{(t_i-t_{cp})\sum_{i=1}^n c_je_j+\frac{1}{n}\sum_{i=1}^n e_j-e_i\}^2=\\ \sum_{i=1}^n\{\sum_{i=1}^n\{c_j(t_i-t_{cp})+\frac{1}{n}\}e_j-e_i\}^2=\sum_{i=1}^nSS_i](/sites/default/files/tex_cache/c9a19bb72342ce8da48232317b1db047.png)
Найдем математическое ожидание каждого из слагаемых:
![M(SS_i)= \sum_{i=1}^n\{c_j(t_i-t_{cp})+\frac{1}{n}\}^2\sigma^2-2\{c_i(t_i-t_{cp})+\frac{1}{n})\sigma^2+\sigma^2](/sites/default/files/tex_cache/89bf2fef35e1852086674f26af509add.png)
Из сделанных ранее предположений вытекает, что при имеем
следовательно, по закону больших чисел статистика
является состоятельной оценкой остаточной дисперсии
.
Получением состоятельной оценкой остаточной дисперсии завершается последовательность задач, связанных с рассматриваемым простейшим вариантом метода наименьших квадратов. Не представляет труда выписывание верхней и нижней границ для прогностической функции:
![x_{вверх}(t)=a^*(t-t_{cp})+b^*+\delta(t), x_{нижн}(t)=a^*(t-t_{cp})+b^*-\delta(t)](/sites/default/files/tex_cache/5c3f8de13b3923b8c6cd7c6d9c6151d6.png)
![\delta(t)=U(p)\sigma^*\{\frac{1}{n}+\frac{(t-t_{cp})^2}{\sum_{i=1}^n (t_i-t_{cp})^2}^{1/2}, \sigma^*=(\frac{SS}{n})^{1/2}](/sites/default/files/tex_cache/7d56a4970d896e6f22657966de38d7b9.png)
Здесь - доверительная вероятность,
, как и в главе 4 - квантиль нормального распределения порядка
, т.е.
![Ф(U(p))=\frac{1+p}{2}](/sites/default/files/tex_cache/65f672c40fdd09f1eeec4b441c0ce7a4.png)
При (наиболее применяемое значение) имеем
. Для других доверительных вероятностей соответствующие значения квантилей можно найти в статистических таблицах .
Сравнение параметрического и непараметрического подходов. Во многих литературных источниках рассматривается параметрическая вероятностная модель метода наименьших квадратов. В ней предполагается, что погрешности имеют нормальное распределение. Это предположение позволяет математически строго получить ряд выводов. Так, распределения статистик вычисляются точно, а не в асимптотике, соответственно вместо квантилей нормального распределения используются квантили распределения Стьюдента, а остаточная сумма квадратов делится не на
, а на
. Ясно, что при росте объема данных различия стираются.
Рассмотренный выше непараметрический подход не использует нереалистическое предположение о нормальности погрешностей. Распределения, встречающиеся в задачах менеджмента, как правило, не являются нормальными. Платой за отказ от нормальности является асимптотический характер результатов. В случае простейшей модели метода наименьших квадратов оба подхода дают практически совпадающие рекомендации. Это не всегда так, не всегда два подхода бают близкие результаты. Например, в задаче обнаружения выбросов методы, опирающиеся на нормальное распределение, нельзя считать обоснованными, и обнаружено это было с помощью непараметрического подхода.
Общие принципы. Кратко сформулируем несколько общих принципов построения, описания и использования эконометрических методов анализа данных. Во-первых, должны быть четко сформулированы исходные предпосылки, т.е. полностью описана используемая вероятностно-статистическая модель. Во-вторых, не следует принимать предпосылки, которые редко выполняются на практике. В-третьих, алгоритмы расчетов должны быть корректны с точки зрения математико-статистической теории. В-четвертых, алгоритмы должны давать полезные для практики выводы.
Применительно к задаче восстановления зависимостей это означает, что целесообразно применять непараметрический подход, что и сделано выше.
Пример оценивания по методу наименьших квадратов. Пусть даны пар чисел
, представленных во втором и третьем столбцах табл.13.1. В соответствии с формулами (2) и (4) выше для вычисления оценок метода наименьших квадратов достаточно найти суммы выражений, представленных в четвертом и пятом столбцах табл.13.1.
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
---|---|---|---|---|---|---|---|---|
1 | 2 | 12 | 1 | 12 | 3,14 | 12,17 | -0,17 | 0,03 |
2 | 3 | 20 | 9 | 60 | 9,42 | 18,45 | 1,55 | 2,40 |
3 | 4 | 20 | 16 | 80 | 12,56 | 21,59 | -1,59 | 2,53 |
4 | 7 | 32 | 49 | 224 | 21,98 | 31,01 | 0,99 | 0,98 |
5 | 9 | 35 | 81 | 315 | 28,26 | 37,29 | -2,29 | 5,24 |
6 | 10 | 42 | 100 | 420 | 31,40 | 40,43 | 1,57 | 2,46 |
![]() |
34 | 161 | 256 | 1111 | 0,06 | 13,64 | ||
![]() |
5,67 | 26,83 | 42,67 | 185,17 |
В соответствии с формулой (2) , а согласно формуле (4)
![a^*=\frac{1111-\frac{1}{6}161*34}{256-1/6(34)^2}=3,14](/sites/default/files/tex_cache/95ba57fee5d4701906acdd193e3ac5eb.png)
Следовательно, прогностическая формула имеет вид
![x^*(t)=3,14(t-5,67)+26,83=3,14t-3,14*5,67+26,83=3,14t-17,80+26,83=3,14t+9,03](/sites/default/files/tex_cache/703c94125e58467ff4f414f55a6eccd9.png)
Следующий этап анализа данных - оценка точности приближения функции методом наименьших квадратов. Сначала рассматриваются т.н. восстановленные значения
![\hat x_i-x^*(t_i), j=1,2,\dots, n](/sites/default/files/tex_cache/8a999f2e219d3f7034ebf3748155febf.png)
Это те значения, которые полученная в результате расчетов прогностическая функция принимает в тех точках, в которых известны истинные значения зависимой переменной