Опубликован: 05.08.2011 | Доступ: свободный | Студентов: 1542 / 82 | Оценка: 4.50 / 3.50 | Длительность: 18:52:00
ISBN: 978-5-9963-0014-3
Специальности: Математик, Экономист
Лекция 1:

Теория игр

Лекция 1: 123 || Лекция 2 >

Совместные смешанные стратегии

Мы уже говорили о том, что в игре может быть несколько равновесий Нэша. Давайте приведем конкретный пример; пример не только проиллюстрирует этот факт, но и вдобавок поднимет важную проблему, которую мы попытаемся решить в этом параграфе.

Пример 1.9. Этот классический пример называется "Семейный спор" (по-английски звучит более внушительно: "Battle of the sexes"). Рассмотрим семью (пока что из двух человек), которая пытается решить, куда пойти вечером. Муж, разумеется, хочет идти на футбол, в то время как жена пытается вытащить мужа в театр. Но, несмотря на этот конфликт интересов, за семью можно быть спокойным: и муж, и жена хотят провести вечер вместе, и ни футбол, ни театр будут не в радость, если пойти туда одному. Осталось только сделать предположение (пожалуй, самое противоестественное), что муж и жена не обсуждают друг с другом свои решения, а просто сами по себе идут или на футбол, или в театр. У игры получается следующая матрица (строки выбирает муж, столбцы — жена; в векторе результатов первый компонент принадлежит мужу, второй — жене).

\begin{array}{r|rr}
               & \sdt{Футбол} & \sdt{Театр} \\ \hline
\text{Футбол}  &     (5, 2)     &        (0, 0)      \\
\text{Театр}   &     (0, 0)     &        (2, 5)      \\
\end{array}

Как нетрудно заметить, у этой игры два равновесия Нэша:

(\text{Футбол}, \text{Футбол})\text{ и }
(\text{Театр}, \text{Театр}).

Ни мужу, ни жене невыгодно отклоняться от одного из этих равновесий. Но вот первая беда: любое из них нечестное — если постоянно выбирать одну и ту же стратегию (а стимулов отклоняться-то нет), один супруг будет получать значительно большую выгоду, чем другой.

Можно попробовать решить эту игру в смешанных стратегиях. Сыграем за мужа: найдем для данной вероятности q того, что жена пойдет на футбол, оптимальную вероятность p пойти на футбол самому:

\text{E [выгода мужа]} = 5pq + 2(1-p)(1-q) = p(7q-2) + 2-2q.

Поскольку для жены ситуация абсолютно симметрична, понятно, что в точке p=\frac57, q=\frac27 (каждый выбирает свой любимый способ провести вечер с вероятностью \frac57 ) достигается равновесие в смешанных стратегиях, ведь ожидаемая выгода каждого участника не зависит от его стратегии. В итоге ожидаемая выгода и мужа, и жены оказывается равной p(7q-2)+2-2q = 2-\frac47 = \frac{10}7. Вот и вторая беда: использовать смешанные стратегии хуже, чем просто согласиться на "неподходящий" вариант: там выгода будет равна 2, а тут всего \frac{10}7.

Конец примера 1.9.

На первый взгляд кажется, что делать нечего: придется кому-то поступиться своим интересом. Решение приходит в виде нового понятия равновесия, которое позволяет участникам использовать внешнюю информацию.

Определение 1.7. Совместная смешанная стратегия игроков — это распределение вероятностей на всем множестве возможных чистых стратегий всех игроков \mathbf S .

То есть, грубо говоря, муж и жена заранее договариваются: кто-то (возможно, кто-то третий — важно, что ни один участник не контролирует этот результат, но оба имеют к нему доступ) вечером подбросит монетку, и если выпадет орел, то они вместе пойдут в театр, а если решка — на футбол. В такой ситуации исход получается оптимальным: и точку (0,0) выбирать никогда не придется, и равновесие честное, ведь у каждого участника ожидаемая выгода равна \frac72.

Определение 1.8. Равновесие в совместных смешанных стратегиях — это такое распределение вероятностей p на множестве чистых стратегий \mathbf S, что для всех i\in\mathcal I и любой пары векторов s_i, s^\prime_i\in \mathbf S

\sum\limits_{\mathbf s_{-i}}p(s_i,\mathbf s_{-i})u_i(s_i,\mathbf s_{-i}) \ge \sum\limits_{\mathbf s_{-i}}p(s_i,\mathbf s_{-i})u_i(s^\prime_i,\mathbf s_{-i}),

или, что то же самое,

\sum\limits_{\mathbf s_{-i}}p(s_i,\mathbf s_{-i})\left(\vphantom{1^2}u_i(s_i, \mathbf s_{-i}) - u_i(s^\prime_i, \mathbf s_{-i})\right)\ge 0.

То есть некое внешнее устройство выбирает стратегию \mathbf s\in\mathbf S случайным образом по распределению p, и оказывается так, что для каждого из игроков в получившемся векторе невыгодно отклоняться от своей стратегии. В примере с семейным спором все выходит именно так: монетка определяет стратегию и мужа, и жены, но при этом выбор делается между двумя равновесиями Нэша, то есть любой случайно выбранный вектор получится равновесным. Совместные смешанные стратегии — это способ перейти от одного равновесия Нэша к линейной комбинации нескольких равновесий, если эта комбинация оказывается более выгодна агентам.

Равновесия по Байесу-Нэшу

До сих пор мы рассматривали исключительно игры, в которых все агенты знали все на свете. Каждый агент знал функции выплаты u_i других агентов, знал множества стратегий других игроков S_i. Более того, каждый агент знал, что каждый другой агент это знает, и что каждый другой агент знает, что он знает, что... в общем, понятно.

Однако на самом деле это условие довольно часто не выполняется. А если агент не знает, к примеру, какие выплаты у других агентов, то говорить о равновесии Нэша становится бессмысленным. Что же делать?

Пример 1.10. В качестве примера рассмотрим вариант все того же "семейного спора", который на этот раз для мужа гораздо печальнее. Предположим, что муж не уверен, хочет ли жена провести с ним вечер или, наоборот, в этот раз от него отдохнуть. Если жена ищет встречи, то матрица игры будет как в примере 1.9:

\begin{array}{r|rr}
               & \sdt{Футбол}   &    \sdt{Театр}     \\ \hline
\text{Футбол}  &     (5, 2)     &        (0, 0)      \\
\text{Театр}   &     (0, 0)     &        (2, 5)      \\
\end{array}

А если встречаться не хочет, то матрица становится другой:

\begin{array}{r|rr}
               & \sdt{Футбол}   &     \sdt{Театр}    \\ \hline
\text{Футбол}  &     (5, 0)     &        (0, 5)      \\
\text{Театр}   &     (0, 2)     &        (2, 0)      \\
\end{array}

Пусть муж ничего не знает о желаниях жены, и для него вероятности этих исходов равны 50%. Таким образом, с точки зрения мужа, у жены есть два возможных типа; или, что то же самое, есть два возможных равновероятных состояния мира, и только жена знает истинное состояние (этакая, простите за выражение, "жена Шредингера").

Если в такой ситуации муж решит пойти на футбол, то (в предположении о 50%) ему невыгодно будет менять свое предпочтение, ведь в случае футбола выгода получается \frac12\cdot 0 + \frac12\cdot 5 = \frac52, а в случае театра лишь \frac12\cdot 2 + \frac12\cdot 0 = \frac12. А для жены, очевидно, в такой ситуации выгодным будет идти на футбол, если она хочет встретить мужа, и идти в театр, если не хочет. Таким образом, профиль стратегий (\text{Футбол}, [\text{Футбол}, \text{Театр}]) будет находиться в равновесии Нэша.

Конец примера 1.10.

Более общая формулировка будет изрядно напоминать равновесие в совместных смешанных стратегиях. Но теперь придется немного дополнить модель самой игры. Определение 1.9 отличается от определения 1.1 только множествами типов \Theta_i.

Определение 1.9. Стратегическая игра с неполной информацией — это четверка

\langle \mathcal I, \{S_i\}_{i\in\mathcal I}, \{\Theta_i\}_{i\in\mathcal I},
\{u_i\}_{i\in\mathcal I}\rangle,

где обозначения расшифровываются следующим образом:

  1. \mathcal I=\{1,...,N\} — конечное множество игроков.
  2. \{S_i\}_{i\in\mathcal I} — множество доступных игрокам действий.
  3. \{\Theta_i\}_{i\in\mathcal I} — множество типов игроков; для типов мы будем применять ту же нотацию, например

    \theta_{-i} =
(\theta_1,...,\theta_{i-1},\theta_{i+1},...,\theta_N).

    Через \mathbf\Theta будем обозначать множество векторов типов: \mathbf\Theta=\Theta_1\times\ldots\times\Theta_N. Каждому игроку i известен его собственный тип \theta_i и общее распределение p(\mathbf\Theta), из которого берутся типы всех остальных; в частности, игрок i знает

    p(\mathbf\Theta_{-i}\mid \theta_i) =
\frac{p(\theta_i,\mathbf\Theta_{-i})}{p(\theta_i)}.
  4. \{u_i\}_{i\in\mathcal I} — множество функций выплат u_i:\mathbf S\times\mathbf\Theta \to\mathbb R. Функции выплат теперь зависят не только от стратегий, но и от типов.

В играх с неполной информацией игроки не знают типов других игроков, но знают распределение. Таким образом, легко определить новое понятие равновесия, которое теперь будет действовать только в ожидании.

Определение 1.10. Равновесие по Байесу-Нэшу для стратегической игры с неполной информацией \langle \mathcal I, \{S_i\}_{i\in\mathcal I}, \{\Theta_i\}_{i\in\mathcal I}, \{u_i\}_{i\in\mathcal I}\rangle — это такой профиль стратегий s^*\in S, что для всякого агента i\in\mathcal I и всякого его типа \theta_i\in\Theta_i выполняется следующее условие:

s_i^*\in \arg\max\limits_{s^\prime_i\in S_i} \sum\limits_{\mathbf\Theta_{-i}}p(\mathbf\Theta_{-i}\mid\theta_i)u_i(s^\prime_i, \mathbf s_{-i}(\mathbf\Theta_{-i}), \theta_i, \mathbf\Theta_{-i}).

Очевидно (проверьте!), что любое равновесие в доминантных стратегиях является равновесием по Байесу-Нэшу.

Кроме уже описанных, нам в теории экономических механизмов потребуется и еще одно понятие равновесия, промежуточное между равновесием по Байесу-Нэшу и равновесием в доминантных стратегиях.

Определение 1.11. Равновесие ex post для стратегической игры с неполной информацией \langle \mathcal I, \{S_i\}_{i\in\mathcal I}, \{\Theta_i\}_{i\in\mathcal I}, \{u_i\}_{i\in\mathcal I}\rangle — это равновесие по Байесу-Нэшу \mathbf s^*\in S, в котором дополнительно выполняется следующее условие: для всех i\in\mathcal I, всех \theta\in\Theta и всех s^\prime_i\in S_i

u_i(\mathbf s^*(\theta), \theta) \ge u_i(\mathbf s^\prime_i, s_{-i}(\theta_{-i}), \theta).

Проще говоря, даже если агенту i рассказать о том, какие типы были у всех остальных игроков, ему все равно не будет резона менять свое решение. Поэтому агенту i гарантированно "не о чем жалеть" в результате игры: даже если он узнает то, чего не знал раньше, все равно для него s^*_i останется оптимальной стратегией. Мы еще не раз встретимся с понятием ex post и другими моментами времени в течение игры в контексте аукционов; подробно эти понятия мы объясним в "Введение в дизайн механизмов" .

Лекция 1: 123 || Лекция 2 >