Опубликован: 06.11.2008 | Уровень: специалист | Доступ: платный | ВУЗ: Новосибирский Государственный Университет
Лекция 10:

Вычисление оптимальных стратегий в бесконечных играх

< Лекция 9 || Лекция 10: 1234 || Лекция 11 >

Задача

Распределение атакующих единиц между двумя объектами ( Дрешер М. Стратегические игры. М., "Советское радио" ,1964.).

Предположим, что планируется атака двух населенных пунктов T_1 и T_2, имеющих соответственно важности (ценности) k_1 и k_2. Пусть противники, один из которых атакует (игрок I), а второй обороняется (игрок II), имеют по N боевых единиц и пусть N достаточно велико.

Эти единицы могут быть распределены следующим образом. Игрок I может выделить n_1 единиц для атаки объекта T_1 и N-n_1 единиц для атаки объекта T_2. В свою очередь игрок II может выделить n_2 единиц для обороны объекта T_1 и N-n_2 единиц для обороны объекта T_2. При этом будем считать, что одна единица игрока II поражает только одну единицу игрока I.

Допустим, что критерий эффективности игрока I пропорционален числу атакующих единиц, достигших объекта, и ценности объекта.

Обозначим

x=\frac{n_1}{N}\text{  и }y=\frac{n_2}{N} ( 10.18)
.

Тогда чистыми стратегиями игроков будут числа из интервала [0,1] вида (10.18.) Следовательно, необходимо решать матричную игру больших размеров. Однако, если N достаточно велико, можно полагать, что игрок I выбирает любое x\in [0,1], а игрок II — любое y\in [0,1].

Таким образом, первоначальная конфликтная ситуация хорошо моделируется бесконечной игрой на единичном квадрате с функцией выигрыша

K(x,y)=
\left< \begin{array}{ccc}
Nk_1(x-y) \text{ если }x \ge y;\\
Nk_2(y-x) \text{ если }x \le y;
\end{array}\right ( 10.19)

Путем построения графиков функции K(x,y) для фиксированных x легко убедиться, что эта функция выпукла по y (рис. 10.6).


Рис. 10.6.

Следовательно,

\nu = \mathop{min}\limits_y \mathop{max}\limits_x 
\left< \begin{array}{ccc}
Nk_1(x-y) \text{ если }x \ge y;\\
Nk_2(y-x) \text{ если }x \le y.
\end{array}\right

Из рассмотрения функции K(x,y) для различных фиксированных значений y

можно убедиться, что если

0\le y \le \frac{1}{2}, то

\mathop{max}\limits_x K(x,y)=Nk_1(1-y),

а если \frac{1}{2} < y \le 1, то

\mathop{max}\limits_x K(x,y)=Nk_2y.

Отсюда

\mathop{max}\limits_x K(x,y)=max[Nk_1(1-y),Nk_2y].

Итак,

\nu=\mathop{min}\limits_y max[Nk_1(1-y),Nk_2y] ( 10.20)
.

Из рассмотрения функции

max[Nk_1(1-y),Nk_2y]

видно, что она принимает минимальное значение при y^*, которое удовлетворяет уравнению

Nk_1(1-y^*)=Nk_2y^* ( 10.21)

Из уравнения (10.21.) находим

y^*=\frac{k_1}{k_1+k_2}.

Тогда на основании (10.20.)

\nu=\frac{k_1k_2}{k_1+k_2}N.

Следовательно, с учетом (10.18.) оптимальная стратегия игрока II состоит в выделении \frac{k_1}{k_1+k_2}N единиц для обороны объекта T_1 и \frac{k_2}{k_1+k_2}N единиц для обороны объекта T_2.

Для определения оптимальной стратегии игрока I воспользуемся теоремой 1.

Находим

\frac{\partial k(x,y)}{\partial y} = 
\left< \begin{array}{ccc}
-Nk_1, \text{ если }x > y;\\
Nk_2, \text{ если }x < y.
\end{array}\right

Составляем уравнение

K(x,\frac{k_1}{k_1+k_2}N)=\frac{k_1k_2}{k_1+k_2}N,

то есть, если x\ge y, то

Nk_1(x-\frac{k_1}{k_1+k_2}N)=\frac{k_1k_2}{k_1+k_2}N ( 10.22)
,

если x\le y, то

Nk_2(\frac{k_1}{k_1+k_2}N-x)=\frac{k_1k_2}{k_1+k_2}=\frac{k_1k_2}{k_1+k_2}N ( 10.23)
.

Уравнение (10.22.) имеет решение x=1, а уравнение (10.23.) имеет решение x=0.

Так как

\frac{\partial k(0,y^*)}{\partial y} >0; x_1=0

и

\frac{\partial k(1,y^*)}{\partial y} <0; x_2=1,

то на основании теоремы(10.1.) игрок I имеет оптимальную стратегию вида

F^*(x)=\alpha I_0(x)+(1-\alpha)I_1(x).

Для определения \alpha составляем следующее уравнение:

\alpha Nk_2+(1-\alpha)(-Nk_1)=0 ( 10.24)

Уравнение (10.24.) имеет решение:

\alpha=\frac{k_1}{k_1+k_2}.

Таким образом, оптимальная стратегия игрока I заключается в том, чтобы нанести удар всеми силами по объекту T_1 или T_2, руководствуясь случайным выбором, то есть выбирая объект T_1 с вероятностью \frac{k_2}{k_1+k_2} и T_2 с вероятностью \frac{k_1}{k_1+k_2}.

Итак, на основании решения рассмотренной игры получены рекомендации, согласно которым обороняющаяся сторона может свои силы распределить заранее вполне определенным образом – назначить \frac{k_1}{k_1+k_2} часть сил для обороны объекта T_1 и \frac{k_2}{k_1+k_2} часть для обороны объекта T_2.

Нападающая сторона должна случайным образом сосредоточить все силы для атаки объекта T_1 или T_2 соответственно их важности.

Например, если объект T_1 в два раза важнее объекта T_2, то объект T_1 должны оборонять \frac{2}{3} всех имеющихся сил. В свою очередь, нападающая сторона должна атаковать этот объект всеми силами с вероятностью \frac{1}{3}.

< Лекция 9 || Лекция 10: 1234 || Лекция 11 >
Данил Комардин
Данил Комардин

мне задали дистанционное задание на сертификат,но я не могу его найти

Илья Шаров
Илья Шаров
Россия
Андрей Савельев
Андрей Савельев
Россия, Магнитогорск