Поволжский Государственный Университет Телекоммуникаций и Информатики
Опубликован: 13.08.2013 | Доступ: свободный | Студентов: 1280 / 383 | Длительность: 07:30:00
Специальности: Экономист
Лекция 2:

Статистическая обработка данных в системе Mathcad

Линейная регрессия

При линейной регрессии функция y(x) имеет вид  y(x)=a+bx и описывает отрезок прямой.

Для проведения линейной регрессии в Mathcad имеются ряд встроенных функций:

  • corr(VX,VY)– функция корреляции. Возвращает скаляр – коэффициент корреляции векторов VX и VY (Пирсона);
  • intercept(VX,VY) – возвращает параметр a - смещение линии регрессии векторов VX и VY по вертикали (свободный член прямой регрессии);
  •  slope(VX,VY ) – возвращает значение параметра  b - наклон линии регрессии векторов  VX и  VY (угловой коэффициент линии регрессии),

где  VX и  VY – векторы координат заданных точек. Координаты отдельной точки занимают в векторах  VX и  VY одинаковые позиции.

Полиномиальная регрессия

При полиномиальной регрессии функция  y(x) имеет вид:

y(x)=a_0 + a_1 x + a_2 x^2 + a_3 x^3 +...+ a_n x^n	( 3.1)

Для реализации полиномиальной регрессии имеется встроенная функция regress(VX,VY,n), которая возвращает вектор VS, содержащий коэффициенты полинома n–й степени. Эти коэффициенты вычисляются по всей совокупности заданных точек, т. е. глобально. Полученный полином наилучшим образом приближается к "облаку" точек с координатами, хранящимися в векторах VX и VY.

Линейная регрессия общего вида

При линейной регрессии общего вида функция  y(x) описывается как:

y(x) = F(x, K_1, K_2,...,K_n) = K_1F_1(x) + K_2F_2(x) +...+ K_nF_n(x)	( 3.2)

Функция регрессии является линейной комбинацией нескольких функций  F_1(x), F_2(x),..., F_n(x), причем сами эти функции могут быть и нелинейными, что резко расширяет возможности такой аппроксимации и распространяет ее на нелинейные функции.

Для реализации линейной регрессии общего вида используется функция linfit(VX,VY,F), которая возвращает вектор коэффициентов К линейной регрессии общего вида, при котором коэффициент корреляции"облака" исходных точек и функции у(х) максимален. Вектор F функции  linfit должен содержать функции  F_1(x), F_2(x), ..., F_n(x), записанные в символьном виде. Вектор  VX должен содержать абсциссы точек в возрастающем порядке, а ординаты в векторе  VY должны соответствовать абсциссам в векторе  VX .

Нелинейная регрессия общего вида

Нелинейная регрессия общего вида это нахождение вектора К параметров произвольной функции  F(x, K1, K2,..., Kn) при котором обеспечивается минимальная среднеквадратичная погрешность приближения "облака" исходных точек. Для этого используется функция

genfit (VX, VY, VS, F)

Эта функция возвращает вектор K параметров функции F, дающий минимальную среднеквадратичная погрешность приближения  F(x, K1, K2,..., Kn) исходных данных.

Функция F должна быть вектором с символьными выражениями, они должны содержать аналитические выражения для исходной функции и ее производных по всем параметрам.

Вектор VS содержит начальные значения элементов вектора K.

При решении задачи возникает две проблемы:

  1. Надо вычислять производные по переменным, обычно это делается с помощью символьных операций;
  2. Необходимо применять функцию genfit в ее стандартном виде, в связи с этим все параметры заменяются на  K1, K2,..., Kn..

Функция предсказания

На практике нередко приходится сталкиваться с задачей расчёта последующих точек по ряду известных точек – задачей предсказания. Для предсказания поведения функциональной зависимости в Mathcad имеется функция: рredict (data,k,N) – предсказание, где data вектор данных, k – число точек предшествующих предсказанию, N - число предсказываемых точек данных.

Функция предсказания обеспечивает высокую точность при монотонных исходных функциях или функциях, представляемых полиномом невысокой степени.

Функция predict применима к предсказуемым событиям, поведение которых описывается реальной математической зависимостью. В странах со стабильной экономикой эта функция вполне применима для описания сезонных и стабильных колебаний курса валют, прибылей фирм, продажа товаров и.т.д.

Краткие итоги

Рассмотрен пакет Mathcad — система компьютерной алгебры из класса систем автоматизированного проектирования понятия эксперимента и математической модели.

Рассмотрены основные встроенные функции, применяемые для статистической обработки данных: сплайновой аппроксимации (pspline, lspline, interp), линейной регрессии (corr, intercept, slope), полиномиальной регрессии (regress), линейной регрессии общего вида (linfit), Нелинейная регрессия общего вида (genfit), функция предсказания (predict). Предназначение данных функций способы их применения для обработки данных.

Вопросы для самопроверки

  1. Перечислите достоинства и недостатки системы Mathcad.
  2. Перечислите основные функции, применяемые в статистической обработке.
  3. Для чего применяется функция RND(x)?
  4. В каких случаях применяются функции сплайновой аппроксимации?
  5. Чем отличается функция линейной регрессии от функции линейной регрессии общего вида?
  6. Дайте определение нелинейной регрессии общего вида?
  7. Дайте определение функции предсказания?
  8. В каких случаях функция предсказания применяется, а в каких применение ее является не целесообразным?