Око за око

20.04.2010

Tit for tat

Я с детства пытался понять, как вести себя с другими людьми. Вот сделал мне кто-то гадость – и что с этим делать? Как относиться к такому человеку? Сразу дать по морде или подождать, дать ему шанс исправиться? А может, простить – «ударившему тебя по правой щеке подставь левую» – ведь так учит Евангелие? Или лучше вообще не дожидаться, пока тебе сделают что-то плохое и самому нанести упреждающий удар?

Желающих научить меня жить всегда было достаточно, вот только советовали они вещи часто диаметрально противоположные. Мама говорила одно, папа – другое, в книжках было написано третье и так далее. Нужно было что-то выбирать и я задавался вопросом: почему я должен поступать именно так, а не иначе? Где доказательство того, что вот это – хорошо и правильно, а это – нет?

Вразумительных ответов я не нашел. В качестве подтверждения своей правоты мне рассказывали различные истории, но отдельный случай без статистики – не доказательство, ведь всегда можно найти отдельные примеры, которые подтвердят или опровергнут любую точку зрения. Меня это не убеждало. К авторитетам, которые предлагают верить им без всяких доказательств, я тоже с детства относился с недоверием. Одним словом, я запутался. Все, что мне оставалось – прислушиваться к себе, своему настроению и совести, принимая решения. Как и все, время от времени я совершал ошибки.

Только теперь, по прошествии нескольких десятилетий, я нашел ответы на свои вопросы и произошло это совершенно случайно. Не так давно мне попалась ссылка на статью, в которой описывался турнир компьютерных алгоритмов, который проходил еще в 1980 году, тридцать лет назад. Эта статья стала для меня своего рода откровением и серьезно изменила мои взгляды на этику.

Правила турнира были очень просты: состязаться могли алгоритмы любой сложности, присылать свои алгоритмы на турнир мог любой желающий. Алгоритмы соревновались парами, состав которых менялся после каждого раунда так, чтобы каждый мог сыграть с каждым. В ходе раунда алгоритмы по очереди делали ходы (какое-то большое, но фиксированное количество), ставя по своему усмотрению противнику плюс или минус. Каждый плюс давал противнику по одному баллу, каждый минус – отбирал. Выигрывал тот алгоритм, который набирал в сумме по всем раундам максимальное количество очков.

По сути, турнир представлял собой упрощенную модель общества: встречаются люди, вступают друг с другом в отношения, могут сделать друг другу «хорошо» или «плохо».

При таких условиях, если каждый следует библейским заповедям (возлюби ближнего своего) и делает друг другу добро (ставит плюсики), то все получают максимальную, но абсолютно одинаковую выгоду, то есть нет ни выигравших, ни проигравших. Есть только одна проблема: в реальной жизни это не работает. Рано или поздно найдется кто-то, кто поймет, что выигрышная стратегия в этой ситуации заключается в том, чтобы брать, ничего не давая взамен.

Алгоритм, который ставит своему визави минусы, выигрывает у алгоритма, который всегда и всем ставит плюсы. Поэтому абсолютное добро, к сожалению, абсолютно нежизнеспособно. Впрочем, если все будут ставить друг другу только минусы, то выиграть тоже будет невозможно – у всех будет одинаковое (максимально возможное) количество минусов, то есть абсолютное зло – бессмысленно.

Эффективная стратегия поведения должна уметь различать «добрых» и «злых» игроков и относиться к ним по-разному: с «добрыми» – сотрудничать (ставить им плюсики), «злых» – наказывать (ставить минусы). Мало того, нужно как-то демонстрировать другим игрокам, что ты – «добрый», и готов с ними сотрудничать.

Это уже достаточно эффективная стратегия, но можно сделать её еще лучше: какое-то количество «злых» игроков, встретив отпор, могут передумать и начать сотрудничать. Это можно и нужно использовать, поэтому стратегия должна учитывать возможность того, что партнер «перевоспитается и быть готовой перейти от «наказания» к сотрудничеству. Впрочем, если визави сначала демонстрирует, что «перевоспитался», а затем снова начинает делать гадости, нужно быть готовым к ответным действиям.

Результат соревнования удивил всех. Алгоритм-победитель, написанный Анатолием Рапопортом, состоял всего из четырех строк на BASIC’е и делал буквально следующее: первым ходом всегда ставил своему визави плюс, а затем просто повторял его ходы. И все. Ничего больше, никаких хитростей.

В этих простых действиях заключаются принципы идеальной стратегии поведения в обществе:

Начинай по-хорошему, покажи, что готов сотрудничать,
Отвечай добром на добро и ударом на удар,
Будь готов простить раскаявшихся.

Я считаю это правильным и готов в это верить. Разумеется, в реальной жизни все бывает несколько сложнее, но принципиально ничего не меняется.

У истории есть продолжение: на следующий год снова проводился турнир по тем же правилам. Все участники заранее готовились к тому, чтобы превзойти алгоритм-победитель и… Не смогли.