Опубликован: 16.12.2009 | Уровень: для всех | Доступ: платный
Дополнительный материал 3:

Методика сравнительного анализа родственных эконометрических моделей

П3-8. Математические основы методов согласования ранжировок и классификаций

При использовании нескольких обобщенных показателей получаются, как правило, различающиеся ранжировки объектов. Как их согласовать с целью дальнейшего использования при классификации? В настоящем пункте формулируются и обосновываются методы решения этой задачи. В отличие от "Эконометрические методы проведения экспертных исследований и анализа оценок экспертов" дается строгое математическое изложение с доказательствами основных утверждений.

Взвешенные агрегированные показатели. Пусть Х_1, Х_2, \dots , Х_К - частные (или групповые) числовые показатели. Пусть каждому из них приписан вес - А_1, А_2,\dots , А_К соответственно, отражающий их относительную важность (оцененную экспертами или иным способом). Весовые коэффициенты неотрицательны и в сумме составляют 1.

Взвешенные агрегированные показатели можно определить следующим единообразным способом.

Введем (чисто формально) распределение вероятностей, приписывающее каждому значению Х_М, М=1,2, \dots ,К, вероятность А_М. Для этого распределения обычным образом определим такие характеристики, как математическое ожидание, медиана, начальные моменты, мода и т.д., которые и будем использовать в качестве взвешенных агрегированных показателей или при их расчете.

При этом математическое ожидание дает взвешенное среднее арифметическое, медиана - взвешенную медиану (в частном случае, когда одна из ступенек функции распределения приходится на высоту 0,5, целесообразно ввести понятия левой и правой медиан - т.е. левого и правого концов указанной ступеньки соответственно).

Начальный момент р -го порядка после извлечения корня р -ой степени дает взвешенное степенное. Аналогичным образом получаем обобщенное среднее по Колмогорову общего вида.

Мода указывает на значение наиболее важного показателя.

В соответствии с методологией устойчивости (см. "Проблемы устойчивости эконометрических процедур" выше) при анализе конкретной ситуации целесообразно одновременно использовать несколько обобщенных показателей, например, взвешенную медиане и взвешенное среднее арифметическое. Такая процедура предусмотрена в настоящей методике. Хотя согласно теории измерений (см. "Основы теории измерений" ) использование среднего арифметического некорректно, но приходится учитывать традиции (проблема учета традиций подробно обсуждалась в "Эконометрические методы проведения экспертных исследований и анализа оценок экспертов" ).

Согласование упорядочений по агрегированным показателям. Сопоставим упорядочения объектов по двум видам агрегированных оценок, например, по взвешенной медиане и по взвешенному среднему арифметическому. Для этого построим "квазитолерантность расхождений (КТР)", т.е. некоторое бинарное отношение (о теории бинарных отношений см., например, книгу [2]) на множестве объектов. (Как известно, бинарное отношение на данном множестве объектов можно отождествить с подмножеством множества пар объектов, т.е. с подмножеством декартова квадрата исходного множества объектов.)

По определению два объекта связаны отношением КТР (т.е. пара объектов входит в рассматриваемое подмножество) тогда и только тогда, когда два упорядочения - по взвешенной медиане и по взвешенному среднему арифметическому - для них противоречивы. Это возможно в двух случаях. Первый - средний взвешенный арифметический показателей для первого (из двух рассматриваемых) объектов больше (или равен) такового для второго объекта, а взвешенная медиана для первого, наоборот, меньше, чем для второго. Второй - средний взвешенный арифметический показателей для первого (из двух рассматриваемых) объектов меньше такового для второго вида, а взвешенная медиана для первого, наоборот, больше (или равна), чем для второго.

Отношение КТР является симметричным (если пара (А,В) входит в него, то входит и пара (В,А)) и антирефлексивным (ни одна пара (А,А) не входит в КТР). Свойством транзитивности это бинарное отношение, вообще говоря, не обладает (если пары (А,В) и (В,С) входят в него, то пара (А,С) может входить в КТР, а может и не входить).

Формально присоединим к КТР все пары вида (А,А). Получим рефлексивное симметричное отношение, т.е. толерантность (о толерантностях много написано в монографии [2]). Будем называть ее "толерантностью расхождений (ТР)".

Построим новое бинарное отношение Зам(ТР) путем транзитивного замыкания (в смысле теории бинарных отношений, см., например, монографию [2,с.27]) "толерантности расхождений". Это означает, что подмножество пар объектов, входящих в толерантность ТР, пополняется некоторыми новыми парами. А именно, если А, В и С - три объекта такие, что пара (А,В) и пара (В,С) входят в "толерантность расхождений", то пару (А,С) включаем в замыкание этой толерантности. Для полученного множества пар повторяем описанную операцию. Продолжаем так до тех пор, пока новые пары не перестанут добавляться (процесс не может продолжаться бесконечно, поскольку общее число пар конечно).

Бинарное отношение Зам(ТР) можно описать и по-другому: пара (А,В) входит в Зам(ТР) тогда и только тогда, когда либо она входит в ТР, либо существует конечная последовательность объектов С, D, E, \dots, Q такая, что пары (A,C), (C,D), (D,E), \dots, (Q,B) входят в ТР, т.е. от А к В можно пройти за несколько шагов, каждый из которых - переход от первого элемента пары, входящей в ТР, ко второму.

Последнее замечание подсказывает наглядную геометрическую интерпретацию операции замыкания. Представим себе объекты точками на плоскости. Пара (А,В) входит в ТР тогда и только тогда, когда от А до В можно добраться по дороге. Тогда ясно, что пара (А,С) входит в Зам(ТР) в том и только в том случае, когда от А до С можно добраться по дороге, возможно. через несколько промежуточных пунктов (объектов).

Теорема о структуре замыкания. Описание структуры Зам(ТР) дает следующая теорема.

Теорема 1. Замыкание "толерантности расхождений" - отношение эквивалентности (рефлексивное симметричное транзитивное отношение), задающее разбиение объектов на кластеры (группы эквивалентных в рассматриваемом смысле объектов). Кластеры между собой упорядочены: все объекты одного кластера одновременно лучше (или одновременно хуже) всех объектов другого кластера одновременно по обоим используемым агрегированным показателям. Внутри же кластеров, состоящих более чем из одного элемента, имеются противоречия: для какого-то объекта есть другой из того же кластера такой, что упорядочение по одному агрегированному показателю противоречит упорядочению по другому агрегированному показателю.

Доказательство. Рефлексивность Зам(ТР) вытекает из рефлексивности ТР - поскольку любая пара (А,А) входит в ТР, то она входит и в Зам(Т,Р) . Симметричность вытекает из симметричности ТР: если из А в В можно добраться по цепочке С, D, E, \dots , Q, то из В в А - по обратной цепочке Q, \dots ,E, D,С, каждые два соседних элемента которой образуют пару, входящую в ТР наряду с "симметричной" парой из прямой цепочки. Транзитивность вытекает из процедуры построения Зам(ТР) . В теории бинарных отношений рефлексивное симметричное и транзитивное отношение, как известно, называется эквивалентностью (см., например, [2, с.54]).

Хорошо известно (см., например, теорему 2.1 в монографии [2, с.55-56]), что отношение эквивалентности задает разбиение множества объектов на кластеры (классы, группы, подмножества) такое, что пара (А,В) входит в Зам(ТР) тогда и только тогда, когда объекты А и В включены в один и тот же кластер.

Теперь введем упорядоченность кластеров.

Лемма. Пусть X = \{A, B, \dots\} и Y = \{C,D, \dots \} - два кластера. Пусть А меньше С при использовании одного из двух рассматриваемых видов агрегированных оценок (например, по взвешенной медиане или по взвешенному среднему арифметическому). Тогда А меньше С и при сравнении по второй агрегированной оценке. Более того, любой объект из первого кластера меньше любого объекта из второго кластера в смысле любой из двух агрегированных оценок.

Докажем лемму. Если бы А было больше или равно С по второй оценке, то пара (А,С) входила бы в КТР и ТР, а потому объекты А и С входили бы в один класс разбиения, соответствующего Зам(ТР) , что противоречит исходному предположению. Это рассуждение показывает также, что для любых двух объектов В и D из разных кластеров упорядоченности по двум агрегированным оценкам совпадают.

Однако совпадает ли упорядоченность В и D (или даже В и С ) с упорядоченностью А и С?

Одну из упорядоченностей обозначим знаком < (т.е. "меньше"; знак > означает здесь "больше или равно"). Может ли быть так, что А<С, но В>С ? Тогда А<С<В. Вторую упорядоченность обозначим знаком //. Тогда в соответствии с рассуждениями предыдущего абзаца А//С//В, следовательно, пара (А,В) не может входить в КТР, а потому и в ТР.

Поскольку А и В лежат в одном кластере, то существует цепочка А(1)=А, А(2), А(3), \dots , А(К) = В такая, что пары (А(Р), А(Р+1)) входят в КТР, Р = 1, 2, 3, \dots , К-1. Рассмотрим минимальное М такое, что А(М)<С, А(М+1)>С (такое М существует, поскольку А1<С, а АК>С ). Тогда в рассуждениях предыдущего абзаца можно положить А=А(М), В=А(М+1) . Получаем, что пара (А(М), А(М+1)) не входит в КТР, что противоречит определению Зам(ТР) .

Итак, доказано, что из А<С вытекает В<С для любого В из кластера, включающего А. Аналогичным образом устанавливается, что В<D для любого D из кластера, включающего С. Лемма доказана.

Каждый из кластеров, порожденных Зам(ТР), может состоять из одного или нескольких элементов. Внутри кластера из одного элемента противоречий быть не может. Если в кластере несколько элементов, то хотя бы одна пара объектов из этого кластера входит в КТР. Однако некоторые пары могут и не содержать противоречий. Например, если упорядочения имеют вид А<В<С и С//А//В, то пары (В,С) и (А,С) входят в КТР, а пара (А,В) - нет. Если же второе упорядочение имеет вид С//В//А, то все три пары входят в квазитолерантность расхождений.

Теорема 1 доказана.

Развитие методики агрегирования. В результате описанной выше процедуры получаем ранжировку (упорядоченный ряд), элементами которой являются, вообще говоря, не отдельные объекты, а кластеры, состоящие из некоторого числа объектов (некоторые из кластеров могут состоять из одиночных объектов, для которых не оказалось рассматриваемых выше противоречий). Если построенное согласно описанной процедуре разбиение объектов на кластеры и полученный на его основе ранжировочный ряд удовлетворяет заказчика, то они и определяют итоговую ранжировку и итоговый агрегированный показатель (выражающийся, например, в номере кластера, в который входит рассматриваемый объект, в итоговой ранжировке). Если же нет (например, получился всего один класс), то требуется дополнительный анализ с привлечением экспертов. Он должен быть нацелен на уточнение предпочтений экспертов. Например, им могут быть предъявлены для сравнения пары объектов, входящих в "квазитолерантность расхождений". Это исследование может описаться на различные методики выявления предпочтений (в экономических терминах - функций полезности).

По ранжировке строится классификация путем разбиения области значений итогового агрегированного показателя на упорядоченные зоны. Границы между зонами задаются с помощью опроса экспертов с учетом процедуры дальнейшего использования этих зон.

Заметим, что описанная выше методика может применяться в различных вариантах. В облегченном варианте весовые коэффициенты не оцениваются. Например, они априори предполагаются равными или же задаются исследовательской группой, строящей агрегированный показатель.

В соответствии с общей схемой устойчивости ( "Проблемы устойчивости эконометрических процедур" ) целесообразно численно изучить устойчивость значений агрегированного показателя к малым отклонениям значений весовых коэффициентов, а также ответов экспертов. Развитие этой идеи ведет к разработке методики численного эксперимента, а также к применению и изучению интервальных экспертных оценок, когда ответ эксперта - интервал действительных чисел или интервал в порядковой шкале (несколько соседних градаций), и т.д. (см. "Эконометрические информационные технологии" и "Эконометрические методы проведения экспертных исследований и анализа оценок экспертов" ).

Могут быть использованы и иные виды средних величин, кроме среднего арифметического и медианы, в частности, среднее геометрическое и другие виды средних по Колмогорову.

Дмитрий Лямин
Дмитрий Лямин
Анна Корнева
Анна Корнева

Подскажите, пожалуйста, помимо самого обучения 1 руб. и отправки диплома по почте (за пересылку), ещё нужно платить за оформление самого диплома или удостоверения?

Ирина Симонян
Ирина Симонян
Армения, Ереван, ЕГУ, 1998
Дмитрий Степаненко
Дмитрий Степаненко
Россия