Не могу найти требования по оформлению выпускной контрольной работы по курсу профессиональной переподготовки "Менеджмент предприятия" |
Основы эконометрических методов
Метод наименьших квадратов для линейной функции
Начнем с задачи точечного и доверительного оценивания линейной прогностической функции одной переменной.
Исходные данные - набор пар чисел
, где
- независимая переменная (например, время), а
- зависимая (например, индекс инфляции, курс доллара США, объем месячного производства или размер дневной выручки торговой точки). Предполагается, что переменные связаны зависимостью
![X_k = a (_tk - t_{ср})+ b + e_k , k = 1,2, \dots,n,](/sites/default/files/tex_cache/963730442fb9b2c5872a83a8df242c48.png)
где и
- параметры, неизвестные исследователю и подлежащие оцениванию, а
- погрешности, искажающие зависимость. Среднее арифметическое моментов времени
![T_{ср} = (t_1 + t_2 +\dots+t_n ) / n](/sites/default/files/tex_cache/a579da8888372c84924a6898183dea04.png)
введено в модель для облегчения дальнейших выкладок.
Обычно оценивают параметры a и b линейной зависимости методом наименьших квадратов. Затем восстановленную зависимость используют для точечного и интервального прогнозирования.
Как известно, метод наименьших квадратов был разработан великим немецким математиком К. Гауссом в 1794 г. Согласно этому методу для расчета наилучшей функции, приближающей линейным образом зависимость от
, следует рассмотреть функцию двух переменных
![f(a,b)=\sum_{i=1}^n (x_i - a(t_1-t_{cp})-b)^2](/sites/default/files/tex_cache/e2d87bf9b0ebcb60dff897dce3239c59.png)
Оценки метода наименьших квадратов - это такие значения и
, при которых функция
достигает минимума по всем значениям аргументов. Чтобы найти эти оценки, надо вычислить частные производные от функции
по аргументам
и
, приравнять их 0, затем из полученных уравнений найти оценки: Имеем:
![\frac{df(a,b)}{da}=\sum_{i=1}^n 2(x_i - a(t_i - t_{cp})(-(t_i - t_{cp}))\\
\frac{df(a,b)}{db}=\sum_{i=1}^n 2(x_i - a(t_i - t_{cp})-b)(-1)](/sites/default/files/tex_cache/9cb3de46432972ad69a380d0ebdcb830.png)
Преобразуем правые части полученных соотношений. Вынесем за знак суммы общие множители 2 и (-1). Затем рассмотрим слагаемые. Раскроем скобки в первом выражении, получим, что каждое слагаемое разбивается на три. Во втором выражении также каждое слагаемое есть сумма трех. Значит, каждая из сумм разбивается на три суммы. Имеем:
![\frac{df(a,b)}{da}=(-2)(\sum_{i=1}^n x_i(t_i - t_{cp})-a \sum_{i=1}^n (t_i - t_{cp}))\\
\frac{df(a,b)}{db}=(-2)(\sum_{i=1}^n x_j - a \sum_{i=1}^n(t_i - t_{cp})-bn)](/sites/default/files/tex_cache/8c504171afaf13af77670e2f075922f8.png)
Приравняем частные производные 0. Тогда в полученных уравнениях можно сократить множитель (-2). Поскольку
![]() |
( 1) |
уравнения приобретают вид
![\sum_{i=1}^n x_i(t_i - t_{cp})-a \sum_{i=1}^n (t_i - t_{cp})^2=0\\
\sum_{i=1}^n x_i - bn=0](/sites/default/files/tex_cache/105d16ec56cc80d0e79330ba6e1a6e4a.png)
Следовательно, оценки метода наименьших квадратов имеют вид
![]() |
( 2) |
В силу соотношения (1) оценку можно записать в более симметричном виде:
Эту оценку нетрудно преобразовать и к виду
![]() |
( 3) |
![]() |
( 4) |
Следовательно, восстановленная функция, с помощью которой можно прогнозировать и интерполировать, имеет вид
![x^*(t) = a^*(t - t_{ср})+ b^*.](/sites/default/files/tex_cache/3b31f304f562453fece6ff57bbf2fbf8.png)
Обратим внимание на то, что использование в последней формуле ничуть не ограничивает ее общность. Сравним с моделью вида
![X_k = c t_k+ d + e_k , k = 1,2, \dots,n.](/sites/default/files/tex_cache/c2ee92ae67464b06b08c48f185b2457b.png)
Ясно, что
![c=a, d=d-at_{cp}](/sites/default/files/tex_cache/77fec9f470a00fc404de078b8a75141e.png)
Аналогичным образом связаны оценки параметров:
![c^*=a^*, d^*=b^*-a^*t_{cp}](/sites/default/files/tex_cache/98b9febb1b7c39699eab460c800ffde8.png)
Для получения оценок параметров и прогностической формулы нет необходимости обращаться к какой-либо вероятностной модели. Однако для того, чтобы изучать погрешности оценок параметров и восстановленной функции, т.е. строить доверительные интервалы для и
, подобная модель необходима.
Непараметрическая вероятностная модель. Пусть значения независимой переменной детерминированы, а погрешности
, - независимые одинаково распределенные случайные величины с нулевым математическим ожиданием и дисперсией
неизвестной исследователю.
В дальнейшем неоднократно будем использовать Центральную Предельную Теорему (ЦПТ) теории вероятностей для величин (с весами), поэтому для выполнения ее условий необходимо предположить, например, что погрешности
, финитны или имеют конечный третий абсолютный момент. Однако заострять внимание на этих внутриматематических "условиях регулярности" нет необходимости.
Асимптотические распределения оценок параметров. Из формулы (2) следует, что
![]() |
( 5) |
Согласно ЦПТ оценка имеет асимптотически нормальное распределение с математическим ожиданием b и дисперсией
оценка которой приводится ниже.
Из формул (2) и (5) вытекает, что
![x_i - x_{cp}=a(t_i - t_{cp})+b+e_i - b-\frac{1}{n}\sum_{i=1}^n e_i,\\
(x_i - x_{cp})(t_i - t_{cp})=a(t_i - t_{cp})^2 + e_i(t_i - t_{cp})-\frac{(t_i - t_{cp})}{n}\sum_{i=1}^n e_i](/sites/default/files/tex_cache/3951cae0b434fd6845e9d740f6cbeeec.png)
Последнее слагаемое во втором соотношении при суммировании по i обращается в 0, поэтому из формул (2-4) следует, что
![]() |
( 6) |
Формула (6) показывает, что оценка является асимптотически нормальной с математическим ожиданием
и дисперсией
![D(a^*)=\sum_{i=i}^n c_i^2 D(e_i)=\frac{\sigma^2}{\sum_{i=1}^n(t_i - t_{cp})^2}](/sites/default/files/tex_cache/3c9a07c39afc5da5a895acaffeeee170.png)
Отметим, что многомерная нормальность имеет быть, когда каждое слагаемое в формуле (6) мало сравнительно со всей суммой, т.е.
![\lim_{n \to \infty}max|t_i - t_{cp}|/\{\sum_{i=1}^n (t_i - t_{cp})^2\}^{1/2}=0](/sites/default/files/tex_cache/82bbd36c1d9936f9ed0ea2cd9b6b6c7d.png)
Из формул (5) и (6) и исходных предположений о погрешностях вытекает также несмещенность оценок параметров.
Несмещенность и асимптотическая нормальность оценок метода наименьших квадратов позволяют легко указывать для них асимптотические доверительные границы (аналогично границам в предыдущей главе) и проверять статистические гипотезы, например, о равенстве определенным значениям, прежде всего 0.