Стратегия равноценных ответных действий
В начале 1980-х годов политолог Мичиганского университета Роберт Аксельрод пред-
ложил специалистам по теории игр со всего мира разработать стратегии решения дилеммы
заключенных в виде компьютерных программ. Они были распределены по парам, каждая из
которых разыгрывала дилемму заключенных 150 раз. На основании набранных очков соста-
вили рейтинг программ, принимавших участие в турнире.
Победителем стал профессор математики университета в Торонто Анатолий Рапопорт.
Его выигрышная стратегия оказалась одной из самых простых: «око за око, зуб за зуб». Для
Роберта Аксельрода этот результат явился большой неожиданностью, поэтому он решил
провести еще один турнир, увеличив число участников. Рапопорт и в этот раз подал про-
грамму, основанную на той же стратегии, – и снова победил.
Стратегия равноценных ответных действий – один из вариантов правила поведения
«поступайте с другими так, как они поступают с вами»
[52]
. Если говорить более точно, эта
стратегия подразумевает сотрудничество на первом этапе, после чего повторяются действия,
которые предпринял соперник на предыдущем этапе.
По мнению Роберта Аксельрода, стратегия равноценных ответных действий опирается
на четыре принципа, которые должны присутствовать в любой эффективной стратегии для
повторяющейся дилеммы заключенных: понятность, доброжелательность, возмездие и про-
щение. Стратегия равноценных ответных действий очень проста и понятна: сопернику нет
необходимости долго размышлять над вашим следующим ходом или просчитывать его. В
основе такой стратегии лежит доброжелательность: она никогда не инициирует обман. В
этой стратегии есть элемент возмездия: она не оставляет обман безнаказанным. Кроме того,
эта стратегия стимулирует прощение: участники игры не держат зла друг на друга слишком
долго и готовы возобновить сотрудничество.
32
Об этом идет речь в их рабочем докладе Identifying Moral Hazard: A Natural Experiment in Major League Baseball,
доступ к которому можно получить здесь:
http://ddrinen.sewanee.edu/Plunk/dhpaper.pdf
.
33
В то время Шиллинг был питчером команды Arizona Diamondbacks Национальной бейсбольной лиги, а обладатель
приза Сая Янга Рэнди Джонсон – его товарищем по команде. Источник: Ken Rosenthal, “Mets Get Shot with Mighty Clemens
at the Bat,” Sporting News, June 13, 2002.
А. Диксит, Б. Д. Нейлбафф. «Теория игр. Искусство стратегического мышления в бизнесе и жизни»
70
Одна из самых впечатляющих характеристик стратегии равноценных ответных дей-
ствий состоит в том, что она показала лучшие результаты по итогам всего турнира, хотя и
не победила (и не могла победить) ни одну из конкурирующих стратегий в прямом проти-
востоянии с ними. В лучшем случае эта стратегия может только сравнять счет с соперни-
ком. Следовательно, если бы Аксельрод оценивал каждую игру по принципу «победитель
получает все», стратегия равноценных ответных действий имела бы на своем счету только
проигрыши и ничьи, а значит, не добилась бы победы по итогам всего турнира
[53]
.
Однако Аксельрод оценивал парные игры между компьютерными программами не по
принципу «победитель получает все»: в его турнирах учитывался такой фактор, как готов-
ность к сотрудничеству. Большое преимущество этой стратегии заключается в том, что она
сближает соперников. В худшем случае эта стратегия может потерпеть поражение из-за
одного предательства, но дальше – только ничья.
Стратегия равноценных ответных действий стала победителем этих соревнований
именно потому, что стимулировала сотрудничество, не допуская при этом эксплуатации.
Другие стратегии были либо слишком ориентированными на доверие и открытыми для экс-
плуатации, либо слишком агрессивными и побуждающими игроков выбивать друг друга из
игры.
И все-таки мы считаем, что стратегия равноценных ответных действий – ошибочная.
Малейший промах или неправильное толкование результатов приводят к полному провалу
стратегии. Этот недостаток не был столь очевидным в искусственной среде соревнования
между компьютерными программами, поскольку там просто исключались ошибки и непра-
вильное толкование. Однако в случае применения этой стратегии в реальном мире ошибки
и заблуждения неизбежны, а результат может оказаться катастрофическим.
Проблема стратегии равноценных ответных действий состоит в том, что обе стороны
противостояния повторяют ошибки и заблуждения друг друга. Одна сторона наказывает
другую за предательство, и это вызывает цепную реакцию. Соперник отвечает на наказание
ответным ударом, который влечет за собой очередное наказание. В таком противостоянии
может и не наступить момент, когда одна из сторон приняла бы наказание без ответного
удара.
Предположим, Флад и Дрешер разыгрывают стратегию равноценных ответных дей-
ствий. Поначалу ни один из них не идет на предательство, поэтому какое-то время все скла-
дывается хорошо. Затем, скажем, в 11-м раунде игры Флад по ошибке выбирает стратегию
«предать» или останавливается на стратегии «сотрудничать», но Дрешер по ошибке считает,
что Флад выбрал предательство. В любом случае Дрешер выберет в 12-м раунде ход «пре-
дать», но Флад выберет стратегию «сотрудничать», поскольку Дрешер выбрал сотрудниче-
ство в 11-м раунде. В 13-м раунде они поменяются ролями. Ситуация, когда один из игроков
выберет сотрудничество, а другой – предательство, будет повторяться снова и снова до тех
пор, пока очередная ошибка или заблуждение не восстановят сотрудничество между сопер-
никами или не заставят каждого из них выбрать предательство.
Такие циклы или ответные удары часто наблюдаются во время реальных конфликтов
между израильтянами и арабами на Ближнем Востоке, или между католиками и протестан-
тами в Северной Ирландии, или между индусами и мусульманами в Индии. На границе
между штатами Западная Вирджиния и Кентукки шла памятная вражда между Хэтфилдами
и Маккоями. В художественной литературе тоже можно найти яркие примеры того, как
такие действия могут привести к непрекращающемуся циклу ответных ударов, как в случае
вражды между Грэнджерфордами и Шепердсонами в романе Марка Твена.
Да из-за чего же вышла ссора, Бак? Из-за земли?
– Я не знаю. Может быть.
– Ну а кто же первый стрелял? Грэнджерфорд или Шепердсон?
А. Диксит, Б. Д. Нейлбафф. «Теория игр. Искусство стратегического мышления в бизнесе и жизни»
71
– Господи, ну почем я знаю! Ведь это так давно было.
– И никто не знает?
– Нет, папа, я думаю, знает, и еще кое-кто из стариков знает; они только
не знают, из-за чего в самый первый раз началась ссора
[54]
.
Стратегия равноценных ответных действий не предполагает возможности остановить
этот порочный круг. Она слишком ориентирована на возмездие и недостаточно стимули-
рует прощение. В следующих версиях соревнований, которые устраивал Роберт Аксельрод,
предусматривалась возможность ошибок и заблуждений; в итоге другие, более бескорыст-
ные, стратегии показали свое превосходство над стратегией равноценных ответных дей-
ствий
[55]
.
Здесь мы можем научиться чему-то даже у обезьян. В ходе одного эксперимента с
хохлатыми тамаринами одной из обезьян давали возможность потянуть рычаг, чтобы дру-
гая могла достать пищу. Однако для того, чтобы потянуть рычаг, следовало приложить уси-
лие. Теоретически каждой обезьяне было бы выгоднее ничего не делать, пока партнер тянет
рычаг. Но тамарины научились сотрудничать, чтобы избежать возмездия. Их сотрудничество
сохранялось до тех пор, пока одна из обезьян два раза подряд не совершила предательство.
Эта стратегия представляет собой разновидность стратегии «зуб за зуб», а именно – «два
зуба за зуб»
34
.
Достарыңызбен бөлісу: |