Опубликован: 11.08.2009 | Уровень: для всех | Доступ: свободно
Лекция 9:

Описание неопределенностей в теории принятия решений

Одна из ведущих научных школ в области анализа интервальных данных - это школа проф. А.П. Вощинина, активно работающая с конца 70-х годов. В частности, изучены проблемы регрессионного анализа, планирования эксперимента, сравнения альтернатив и принятия решений в условиях интервальной неопределенности.

Рассматриваемое ниже направление отличается нацеленностью на асимптотические результаты, полученные при больших объемах выборок и малых погрешностях измерений, поэтому оно и названо асимптотической статистикой интервальных данных.

Сформулируем сначала основные идеи асимптотической математической статистики интервальных данных. Следует сразу подчеркнуть, что основные идеи достаточно просты, в то время как их проработка в конкретных ситуациях зачастую оказывается достаточно трудоемкой.

Пусть существо реального явления описывается выборкой x_1, x_2 , \dots, x_n. В вероятностной теории математической статистики, из которой мы исходим, выборка - это набор n независимых в совокупности одинаково распределенных случайных величин. Однако беспристрастный и тщательный анализ подавляющего большинства реальных задач показывает, что статистику известна отнюдь не выборка x_1, x_2, \dots, x_n, а величины

y_j = x_j + \varepsilon _j,  j = 1, 2, \dots , n,

где \varepsilon _1, \varepsilon _2, \dots \varepsilon_n , некоторые погрешности измерений, наблюдений, анализов, опытов, исследований (например, инструментальные ошибки).

Одна из причин появления погрешностей - запись результатов наблюдений с конечным числом значащих цифр. Дело в том, что для случайных величин с непрерывными функциями распределения событие, состоящее в попадании хотя бы одного элемента выборки в множество рациональных чисел, согласно правилам теории вероятностей имеет вероятность 0, а такими событиями в теории вероятностей принято пренебрегать. Поэтому при рассуждениях о выборках из обычно используемых распределений (нормального, логарифмически нормального, экспоненциального, равномерного, гамма - распределений, распределения Вейбулла-Гнеденко и т.п.) приходится принимать, что эти распределения имеют элементы исходной выборки x_1, x_2 , \dots, x_n , в то время как статистической обработке доступны лишь искаженные значения y_j = x_j + \varepsilon_j .

Введем обозначения

x = (x_1, x_2 , \dots, x_n), y = (y_1, y_2 ,\dots, y_n), \varepsilon = (\varepsilon_1, \varepsilon_2, \dots , \varepsilon_n)

Пусть статистические выводы основываются на статистике f:R^n \to R^1 используемой для оценивания параметров и характеристик распределения, проверки гипотез и решения иных статистических задач. Принципиально важная для статистики интервальных данных идея такова: СТАТИСТИК ЗНАЕТ ТОЛЬКО f(y) , НО НЕ f(x) .

Очевидно, в статистических выводах необходимо отразить различие между f(y) и f(x) . Одним из двух основных понятий статистики интервальных данных является понятие нотны.

Определение. Величину максимально возможного (по абсолютной величине) отклонения, вызванного погрешностями наблюдений , известного статистику значения f(y) от истинного значения f(x) , т.е.

N_f(x) = \sup |f(y) - f(x)|,

где супремум берется по множеству возможных значений вектора погрешностей \varepsilon (см. ниже), будем называть НОТНОЙ .

Если функция f имеет частные производные второго порядка, а ограничения на погрешности имеют вид

|\varepsilon_i| \le \Delta, i=1,2, \dots, n ( 1)

причем \Delta мало, то приращение функции f с точностью до бесконечно малых более высокого порядка описывается главным линейным членом, т.е.

f(y)-f(x)=\sum_{1\le i \le n}\frac{df(x)}{dx_i}\varepsilon_i+O(\Delta^2)

Чтобы получить асимптотическое (при \Delta \to 0 ) выражение для нотны, достаточно найти максимум и минимум линейной функции (главного линейного члена) на кубе, заданном неравенствами (1).

Легко видеть, что максимум достигается, если положить

\varepsilon_i=\begin{cases}
\Delta, \frac {df(x)}{dx_i}\ge0\\
-\Delta, \frac{df(x)}{dx_i}<0
\end{cases}

а минимум, отличающийся от максимума только знаком, достигается при \varepsilon_i=-\varepsilon_i. Следовательно, нотна с точностью до бесконечно малых более высокого порядка имеет вид

N_f(x)=(\sum_{1 \le i \le n} |\frac{df(x)}{dx_i}|)\Delta

Это выражение назовем асимптотической нотной.

Условие (1) означает, что исходные данные представляются статистику в виде интервалов [y_i-\Delta; y_i+\Delta], i=1,2, \dots, n (отсюда и название этого научного направления). Ограничения на погрешности могут задаваться разными способами - кроме абсолютных ошибок используются относительные или иные показатели различия между x и y.

Если задана не предельная абсолютная погрешность \Delta, а предельная относительная погрешность \delta, т.е. ограничения на погрешности вошедших в выборку результатов измерений имеют вид

|\varepsilon_i|\le \delta|x_i|, i=1,2,\dots, n

то аналогичным образом получаем, что нотна с точностью до бесконечно малых более высокого порядка, т.е. асимптотическая нотна, имеет вид

N_f(x)=(\sum_{1 \le i \le n}| x_i \frac{df(x)}{dx_i}|)\delta

При практическом использовании рассматриваемой концепции необходимо провести в расчетных формулах тотальную замену символов x на символы y. В каждом конкретном случае удается показать, что в силу малости погрешностей разность N_f(y)-n_f(x) является бесконечно малой более высокого порядка сравнительно с N_f(x) или N_f(y)

Михаил Агапитов
Михаил Агапитов

Не могу найти  требования по оформлению выпускной контрольной работы по курсу профессиональной переподготовки "Менеджмент предприятия"

Подобед Александр
Подобед Александр

Я нажал кнопку "начать курс" и почти его уже закончил, но для получения диплома на бумаге, нужно его же оплатить? Как оплатить? 

Елена Лин
Елена Лин
Россия, Сыктывкар, 36 школа, 2009
Юлия Раковская
Юлия Раковская
Россия, Иркутск