НОУ ИНТУИТ | Исследование операций и модели экономического поведения. Лекция 8: Анализ антагонистической игры на основе принципа максимума гарантированного результата

Учитесь и получайте официальные документы БЕСПЛАТНО. Вы можете поддержать наш проект.

Регистрация Вход

Твой путь к знаниям!

Нижегородский государственный университет им. Н.И.Лобачевского

Опубликован: 26.04.2007 | Доступ: свободный | Студентов: 1447 / 140 | Оценка: 3.69 / 3.54 | Длительность: 14:45:00

ISBN: 978-5-9556-0072-7

Тема: Математика

Специальности: Математик

|

Вам нравится? Нравится 24 студентам

| Поделиться |

Поддержать курс

| Скачать электронную книгу

Замечание 1.18 (о бабочкообразных ядрах ). Рассмотрим частный случай, когда

$p_1(x) = 1 - x,\quad p_2(y) = 1 - y,$

и, следовательно,

$M(x,y) = \left\{ \begin{aligned} & 1 - 2x, && 0 \le y < x \le 1,\\ & 0, && 0 \le x = y \le 1,\\ & 2y -1, && 0 \le x < y \le 1. \end{aligned} \right.$

( 7.3)

Разрывная поверхность, которая соответствует функции M(x,y) из (7.3), определенной на единичном квадрате $0\le x$ , $y\le 1$ , представлена на рис.1.15. Указанная поверхность составлена из трех частей, включающих два плоских треугольника и (изображенный жирной линией) отрезок, который лежит на прямой x=y в плоскости M(x,y)=0. Все части имеют общую точку (отмеченную темным кружком). Форма поверхности напоминает бабочку, и этим определяется использование термина " бабочкообразные ядра " применительно к функциям вида (7.2).

Рис. 1.15.

Оценим нижнюю цену игры и максиминную стратегию игрока P₁. Воспользуемся представлением

$\begin{gathered} \underline{v} = \max_{0 \le x \le 1} \min_{0 \le y \le 1} M(x,y) = \max_{0 \le x \le 1} \mu(x),\\ \mu(x) = \min\left\{\inf_{0 \le y < x} M(x,y), M(x,x), \inf_{x < y \le 1} M(x,y)\right\}\!. \end{gathered}$

( 7.4)

При этом, согласно (7.2),

$\begin{gathered} \inf \{M(x,y) \colon 0 \le y < x\} = 2 p_1(x) -1,\\ M(x,x) = p_1(x) - p_2(x),\\ \inf \{M(x,y)\colon x < y \le 1\} = 1 - 2p_2(x) \end{gathered}$

и, следовательно,

$\mu(x) = \min \{2p_1(x) - 1, p_1(x) - p_2(x),\ 1 - 2p_2(x)\}.$

( 7.5)

Определим вещественное число t как решение уравнения (см. рис.1.14):

( 7.6)

Заметим, что в силу (7.1), условий

$p_1(0) = 1,\quad p_2(0) = 1$

и условия монотонности функций p₁, p₂, решение уравнения (7.6) существует и является единственным. Теперь, согласно (7.4), можно оценить нижнюю цену игры как

$\underline{v} = \max \left\{\sup_{0 \le x < t} \mu(x), \mu(t), \sup_{t < x \le 1} \mu(x)\right\}\!.$

( 7.7)

Из (7.6) и условия монотонности функций p₁, p₂ вытекает, что

$p_1(t) + p_2(t) \ge 1,\ 0 \le x \le t.$

( 7.8)

Прибавив к каждой части этого неравенства величину p₁(x), получим левое неравенство из записи (7.9):

$2p_1(x) - 1 \ge p_1(x) - p_2(x) \ge 1 - 2 p_2(x).$

( 7.9)

Вычитая величину 2p₂(x) из левой и правой частей неравенства (7.5), получим правое неравенство из (7.9). Теперь из (7.5) и (7.9) следует, что

$\mu(x) = 1 - 2p_2(x),\ 0 \le x \le t,$

причем

$\sup\{\mu(x) \colon 0 \le x < t\} = 1 - 2p_2(t).$

( 7.10)

Неравенство

$p_1(t) + p_2(t) \le 1,\ t \le x \le 1,$

( 7.11)

также является следствием (7.6) и условий монотонности функций p₁ и p₂. Сопоставляя (7.8) и (7.11), выводим, что следствием (7.11) являются неравенства, обратные отношениям в (7.9), т.е.

$2p_1(x) - 1 \le p_1(x) - p_2(x) \le 1 - 2 p_2(x).$

( 7.12)

Тогда из (7.5) и (7.12) вытекает, что

$\mu(x) = 2 p_1(x)-1,\ t \le x \le 1,$

причем

$\sup\{\mu(x) \colon t < x \le 1\} = 2p_1(t) - 1.$

( 7.13)

Пусть теперь x=t. Тогда из (7.9) и (7.12) следует равенство

2p_1(x) - 1 = p_1(x) - p_2(x) = 1 - 2 p_2(x),

( 7.14)

откуда, учитывая (7.7), (7.10) и (7.13), получаем, что

$\underline{v} = \max \{\mu(x) \colon 0 \le x \le 1\} = p_1(t) - p_2(t).$

( 7.15)

При этом максиминная стратегия x^* игрока P₁ определяется как решение уравнения (7.6), т.е. x^*=t.

Аналогично определяется верхняя цена игры и минимаксная стратегия игрока P₂. Запишем

$\bar{v} = \min_{0 \le y \le 1} \max_{0 \le x \le 1} M(x,y) = \min_{0\le y\le 1} \eta(y),$

( 7.16)

$\eta(y) = \max \left\{\sup_{0 \le x < y} M(x,y), M(y,y), \sup_{y < x \le 1} M(x,y)\right\}\!.\notag$

При этом, согласно (7.2),

$\begin{gathered} \sup\{M(x,y) \colon 0 \le x < y\} = 1 - 2 p_2(y),\\ M(y,y) = p_1(y) - p_2(y),\\ \sup\{M(x,y) \colon y < x \le 1\} = 2p_1(y) - 1, \end{gathered}$

и, следовательно,

$\eta(y) = \max\{2p_1(y) - 1,\,p_1(y) - p_2(y),\,1-2p_2(y)\}.$

( 7.17)

Теперь из (7.17), (7.9) и (7.12) выводим, что

$\begin{gathered} \eta(y) = 2 p_1(y) - 1,\ 0 \le y < t,\\ \eta(y) = 1 - 2 p_2(y),\ t < y \le 1,\\ \end{gathered}$

откуда следует справедливость оценок

$\begin{gathered} \inf\{\eta(y) \colon 0 \le y < t\} = 2p_1(t) - 1,\\ \inf\{\eta(y) \colon t < y \le 1\} = 1 - 2p_2(t). \end{gathered}$

Полученные оценки в сочетании с равенством (7.14) приводят к выводу, что

$\bar{v} = \min\{\eta(y) \colon 0 \le y \le 1\} =p_1(t) - p_2(t).$

( 7.18)

При этом минимаксная стратегия y^* игрока P₂ определяется тем же значением t, что и максиминная стратегия игрока P₁, т.е.

$x^\ast = y^\ast = t$

( 7.19)

где

из (7.6); см. рис.1.14.

Совпадение верхней и нижней цен игры доказывает, что пара ( x^*,y^*) из (7.19) является седловой точкой ядра (7.2). Следовательно, эта пара стратегий определяет решение, обладающее свойствами равновесия по Нэшу. Полученному решению соответствует цена игры

( 7.19)

Еще раз отметим, что решение (7.19), (7.20) является также оптимальным по Парето. Следует также обратить внимание на то, что величина v из (7.20) есть гарантированное игроку P₁ математическое ожидание полезности, а не выигрыш в конкретной реализации игры (который может иметь лишь значения из множества {-1,0,+1} ). В случае, когда цена игры v оказывается положительной (отрицательной), говорят, что игра поставлена в пользу первого (второго) игрока. При v=0 игру называют " безобидной ".

Выражение (7.20) для цены игры является важной рекомендацией. Согласно этому выражению, для постановки игры в свою пользу игрок P_i (i=1,2) должен стремиться увеличить вероятность p_i(t), соответствующую упреждению t из (7.6). Как уже отмечалось, мы полагаем, что каждая из сторон знает обе функции p₁, p₂.

Замечание 1.19 (об играх типа дуэлей ). Модели рассмотренного выше типа первоначально использовались как средство описания боевых столкновений типа дуэлей (например, дуэли истребитель-бомбардировщик, штурмовик-наземный комплекс и т.п.). При этом функции p₁(x) и p₂(y) характеризуют вероятности поражения противника при выстреле, осуществленном игроком P₁ или P₂ соответственно с расстояния x или (при естественном предположении, что стреляющая сторона не была уничтожена противником еще до своего выстрела). В теории рассмотрены случаи, когда стороны могут последовательно осуществить несколько выстрелов, обнаруживая факты промахов противника (в этом случае дуэль называется " шумной ") или не имея возможностей для такого обнаружения (в этом случае говорят о " бесшумной " дуэли). Исследования подобных моделей оказали определенное влияние на содержание наставлений для некоторых родов войск^{4Дрешер М. Стратегические игры. Теория и приложения. М.:
Советское радио, 1964.}}.

Тем самым, пример, рассмотренный выше, может классифицироваться как шумная дуэль, в которой каждая сторона имеет один выстрел. Заметим, что интерпретация дуэлей как конкурентных взаимодействий появилась значительно позднее^{5См., например, пособие: Крушевский А.В. Теория игр. Киев:
Вища школа, 1977.}.

В заключение отметим, что успешное вычисление минимаксного и максиминного значений ядра в рассмотренном примере существенно опиралось на специфику конкретной функции (7.2). В общем случае такие вычисления могут оказаться гораздо более сложными. Эти трудности, однако, исчезают, если выбор стратегий (для каждой стороны) ограничен конечным числом вариантов, которые можно перебрать в процессе анализа. Этот случай рассматривается в следующей лекции.

Дальше >>

Авторизоваться

Исследование операций и модели экономического поведения

Анализ антагонистической игры на основе принципа максимума гарантированного результата

Вопросы и ответы