НОУ ИНТУИТ | Практикум по методам построения алгоритмов. Лекция 11: Анализ игр

Учитесь и получайте официальные документы БЕСПЛАТНО. Вы можете поддержать наш проект.

Регистрация Вход

Твой путь к знаниям!

Опубликован: 08.04.2009 | Уровень: для всех | Доступ: платный

|

Вам нравится? Нравится 24 студентам

| Поделиться |

Поддержать программу

11.4. Альфа-бета-процедура

Мы видели, как можно вычислить цену игры, обойдя все вершины ее дерева. Однако иногда можно сэкономить и часть дерева не посещать. Пусть, например, игра имеет два исхода (выигрыш и проигрыш) и мы обнаружили (после просмотра части дерева), что некоторый ход является для нас выигрышным. Тогда нет смысла рассматривать остальные ходы. Более общо, если мы нашли ход, гарантирующий нам максимальный выигрыш (допускаемый правилами игры), то нет смысла искать дальше.

Подобная оптимизация возможна не только в тех случаях, когда мы знаем максимально возможный выигрыш. Пусть, например, дерево игры имеет такой вид, как на рис. 11.6, причем $a\ge b$ и мы обходим вершины дерева слева направо.

Рис. 11.6. Оптимизация возможна если a не меньше b

Тогда после просмотра вершины

мы знаем, что цена корневой вершины не меньше

. Перейдя к min-вершине и просмотрев ее первого сына

, мы определяем, что цена min-вершины не больше

и (при $b\le a$ ) она не может повлиять на цену корня. Поэтому следующие вершины (серая область на рисунке) и их поддеревья нам просматривать не нужно.

Примененную в обоих случаях оптимизацию можно описать так. Приступая к оценке некоторой вершины, мы знаем некоторый промежуток [m,M] , в пределах которого нас интересует цена этой вершины - либо потому, что она заведомо не может выйти за пределы промежутка (как в первом случае, когда лучше выигрыша ничего не бывает), либо потому, что это нам ничего не дает (как во втором случае, когда все цены меньше для нас неотличимы от ).

Более формально, введем обозначение $x_{[a,b]}$ , где - число, а [a,b] - промежуток:

$x_{[a,b]}=\begin{cases} a, &\text{если $x\le a$;}\\ x, &\text{если $a\le x\le b$;}\\ b, &\text{если $b\le x$.} \end{cases}$

Другими словами, $x_{[a,b]}$ - ближайшая к

точка промежутка [a,b]

, которую можно назвать "приведенным к [a,b]

значением

". Теперь можно сказать, что после просмотра вершины

на рисунке 11.6. нас интересует приведенная к $[a,+\infty]$ цена min-вершины (все значения, меньшие

, безразличны), а после просмотра вершины

эта приведенная цена уже известна (равна

). Аналогичным образом цена игры с двумя исходами $\pm 1$ равна ее приведенной к отрезку [-1,+1]

цене, и после обнаружения выигрышного хода становится ясным, что эта цена равна

.

Используя это соображение, напишем оптимизированный алгоритм, в котором рекурсивно определяется приведенная к промежутку [a,b] цена игры в текущей вершине:

procedure find_reduced_cost (a,b: integer; var c: integer)
| var x: integer;
begin
| if тип = final then begin
| | c:= стоимость, приведенная к [a,b]
| end else if тип = max then begin
| | вверх_налево;
| | find_reduced_cost (a,b,c);
| | {c = максимум цены вершины и братьев слева,
| |      приведенный к [a,b]
| | while есть_справа and (c<b) do begin
| | | вправо;
| | | find_reduced_cost (c,b,x);
| | | c := x;
| | end;
| | {c=цена вершины под текущей, приведенная к [a,b]}
| | вниз;
| end else begin {тип = мин}
| | ...симметрично
| end;
end;

Естественный вопрос: насколько такого рода оптимизация помогает уменьшить перебор? Мы рассмотрим простейший пример. Пусть игра имеет фиксированную длину, из каждой позиции возможны два хода, игроки ходят по очереди, каждый делает ходов и цены листьев равны или . Дерево такой игры - полное двоичное дерево, min- и max-уровни чередуются, в листьях написаны нули и единицы, и нужно вычислить значение в корне. (Если считать, что $1=\text{истина}$ , $0=\text{ложь}$ , то максимум и минимум соответствуют операциям OR (ИЛИ) и AND (И), поэтому иногда говорят об AND-OR-дереве.)

Сколько листьев нужно посетить, чтобы вычислить значение в корне? Напомним, что всего листьев $2^{2n}$ для дерева с уровнями (каждый из игроков делает ходов).

11.4.1. Доказать, что для любых значений в листьях описанный нами оптимизированный алгоритм просматривает не менее 2^n листьев.

Решение. На уровне находятся четыре вершины. В ходе работы алгоритм должен узнать цену игры хотя бы в двух из них. В самом деле, пусть нижняя вершина есть min-вершина. Если в ней нуль, то в одном из ее сыновей тоже нуль. А раз это max-вершина, то для установления этого факта нужно знать цену обоих сыновей (равную нулю). Второй случай: в корне единица. Тогда в обеих его сыновьях должна быть единица, и чтобы быть в этом уверенным, нужно в каждом из них посмотреть как минимум одного сына.

Аналогично ради каждого значения на уровне нужны два значения на уровне и так далее - в конце концов на уровне нужно знать 2^n значений.

Для наглядности мы говорили о конкретном алгоритме, описанном выше. Но справедлив и более общий факт: любой набор значений в листьях, который однозначно определяет значение в корне, содержит не менее 2^n значений.

11.4.2. Провести аккуратное доказательство этого утверждения.

Указание. По существу уже все доказано, надо только это оформить.

Только что полученная оценка относилась к самому благоприятному случаю. Утверждение следующей задачи, напротив, говорит о наихудшем случае.

11.4.3. Пусть у нас спрашивают значения в листьях AND-OR-дерева в заранее неизвестном нам порядке, и мы можем называть эти значения по собственному усмотрению. Доказать, что мы можем действовать так, чтобы до последнего момента (пока есть хоть одно не названное значение) цена корня оставалось бы неизвестной (то есть могла быть и нулем, и единицей в зависимости от еще не названных значений).

Эта задача показывает, что любой алгоритм отыскания цены корня в наиболее неблагоприятном случае вынужден обходить все листья (в частности, наш оптимизированный алгоритм никакого выигрыша не дает).

Решение. Будем доказывать это индукцией по высоте дерева. Пусть корень является AND-вершиной. Тогда будем оттягивать (по предположению индукции) определение значений в детях корня, а когда дальше оттягивать будет нельзя (последний лист поддерева становится известным), сделаем так, чтобы это поддерево было истинным. Тем самым значение в корне совпадает со значением в другом поддереве и может оставаться неопределенным до последнего момента.

Более интересной является оценка среднего числа опрошенных листьев. Будем считать, что алгоритм find_reduced_cost применяется к некоторому фиксированному AND-OR-дереву (с фиксированными значениями в листьях), но для каждой вершины порядок просмотра двух ее детей выбирается случайно. Тогда общее число просмотренных листьев становится случайной величиной.

11.4.4. Доказать, что математическое ожидание этой случайной величины (среднее по всем порядкам просмотров) для любого AND-OR-дерева высоты (с 4^n вершинами) не превосходит 3^n .

Решение. Рассмотрим сначала случай n=1 , то есть дерево глубины . Пусть его корень является AND-вершиной. Если в корне находится , то на первом уровне 0, 0 или 0,1 . В первом случае нам достаточно просмотреть две вершины (найдя первый нуль, мы не ищем второй). Во втором случае с вероятностью 1/2 нам хватит двух, а с вероятностью 1/2 понадобится три или четыре. Если же в AND-корне находится , то в обеих OR-вершинах первого уровня находится единица, и на каждую из них нужно в среднем не больше 3/2 просмотров листьев (с вероятностью не менее 1/2 мы сразу попадаем в лист с единицей и второй лист не смотрим).

Дальнейшее рассуждение легко происходит по индукции. Пусть среднее значение числа запрашиваемых листьев для любого дерева глубины не превосходит 3^k . Рассмотрим дерево глубины 2k+2 с фиксированными значениями в листьях. Для каждого выбора порядка на первых двух уровнях известно, какие из четырех вершин высоты будут рассмотрены. По предположению среднее число использованных листьев при рассмотрении каждой вершины высоты (усреднение по всем порядкам обхода) не больше 3^k . Дополнительно усредняем по порядкам на двух первых уровнях и замечаем, что в среднем рассматривается не больше трех вершин высоты .

11.4.5. Получить более точную оценку для числа просмотренных листьев в предыдущей задаче. Используйте разные оценки в зависимости от значения в корне; это позволит заменить $\sqrt{3}$ в оценке на меньшее число $(1+\sqrt{33})/4$ .]

Дальше >>

Практикум по методам построения алгоритмов

Практикум по методам построения алгоритмов

Анализ игр

11.4. Альфа-бета-процедура

Вопросы и ответы

Студенты

Авторизоваться

Практикум по методам построения алгоритмов

Практикум по методам построения алгоритмов

Анализ игр

11.4. Альфа-бета-процедура

Вопросы и ответы

Студенты