Дилемма заключенного, как реальность нашей жизни

Многие считают математику довольно абстрактной наукой, но на самом деле, именно математика определяет многие процессы вокруг нас, и в природе, и в социуме. Сегодня об одной такой управляющей конструкции, под несколько зловещим названием «дилемма заключенного» расскажет кандидат экономических наук, доцент кафедры математики и анализа данных Финансового университета при Правительстве РФ, Фомичева Татьяна Леонидовна.

Дилемма заключенного – это одна из фундаментальных проблем раздела математики под названием «теория игр». Ее в 1950 году сформулировали американские математики-исследователи Мерил Флад и Мелвин Дрешер, а название ей дал канадский математик Альберт Такер. Суть ее в следующем. Полиция поймала двух подельников по преступлению, и допрашивает их в разных камерах, не давая общаться между собой. Но улики против них слабые, надежда только на признание вины. Устанавливаются такие условия, что если один из арестованных расскажет всё о другом, то он будет отпущен, а другой получит 10 лет заключения. Если они оба промолчат, то получат по одному году заключения «для порядка». Если же они оба «сдадут» друг друга, то получат по 3 года тюрьмы. Как вы думаете, какой результат реален? Каждый из заключенных действует рационально, т.е. стремится получить максимальный выигрыш для себя лично и рассказывает всё про своего подельника. В результате каждый получает по три года заключения. Дилемма заключенного показывает, как даже при рациональных действиях каждого из субъектов, система в целом приходит в неоптимальное состояние.

Но каким образом связаны абстрактные преступники и наша жизнь? Самый простой пример. Сейчас цену за поездку в такси определяет искусственный интеллект агрегатора, но вплоть до недавнего времени, каждый водитель определял ее для конкретного пассажира самостоятельно. И в дождь, или в снег, или при поломке метро цены одновременно у всех взлетали в потолок. Для этого им не надо было сговариваться, просто каждый из них оказывался в положении того самого заключенного. И размышлял примерно таким образом: «Если я подниму цену, а все остальные нет, я получу сверхприбыль. Если мы все поднимем, я получу хоть что-то. А если я не подниму, но остальные поднимут, прибыль получают только они.» И все единогласно и молчаливо увеличивают цену поездки. Состояние равновесное – пассажиры в проигрыше.

Вероятно, все видели картинку по телевизору, а, может быть, кто-то лично участвовал. При объявлении распродажи толпа врывается в супермаркет, снося двери, давя более слабых и т.п. Но каждый из этих озверевших индивидуумов ведет себя как рациональный поведенческий экономист, считая, что если он будет стремиться к получению товара, то у него, по крайней мере, будет на это шанс. Результат: несколько «счастливчиков» с вожделенным товаром, несколько пострадавших, толпа разочарованных. Математика коллективной глупости.

Конкуренция на рынках. Возьмем, например, Coca-Cola и Pepsi. У них есть разного рода паритетные соглашения между собой. И вот, допустим, Coca-Cola идет на «предательство» снижая цену на свои напитки. Если Pepsi «продолжит сотрудничество» оставит свои цены на прежнем уровне, то она рискует потерять долю рынка, т.к. конкурент будет продавать большее количество продукции, чем раньше. Соответственно, они тоже будут демпинговать. Такая ценовая война может привести к снижению суммарной прибыли корпораций и даже к некоторым финансовым проблемам.

И даже внутри нас идет эта же игра между иммунной системой и вирусами. Существует определенный статус кво. Вирус нарушает его, совершая мутацию («предательство»!), надеясь обогнать иммунный ответ. Организм отвечает тем же, подключая незадействованные прежде иммунные системы. Если бы они могли каким-либо образом «договориться» в выигрыше были бы все. А так – наш организм заболевает, пока создастся адекватный иммунный ответ, и вирус будет побежден, нам обеспечена неделя болезни.

Классический пример – холодная война между СССР и США (НАТО). Выбор был простым: если мы разоружимся, а они нет, нас уничтожат. Значит, мы должны вооружаться. Если мы вооружаемся, а они нет — мы побеждаем. А если вооружаются оба, мы всё равно в относительной безопасности, хоть и живем в состоянии вечной паники, тратя деньги на пушки вместо масла. Оба игрока, действуя строго в своих интересах, пришли к единственно логичному для них исходу — десятилетиям чудовищного напряжения и гонке вооружений, которая могла в любой момент положить конец всей человеческой цивилизации. Они не хотели этого, но они были вынуждены это делать самой железной логикой взаимного недоверия.

Современные новости говорят нам о том же. Тот же самый алгоритм, только комнат стало больше, и у каждого участника на столе лежит свой калькулятор. Для одной стороны уступка выглядит как потеря лица и риск получить удар по своим интересам в будущем. Для другой — уступка выглядит как капитуляция перед силой и прямая угроза безопасности. Рациональное действие каждого — ужесточать свою позицию, демонстрировать силу, наращивать давление, ожидая такого же хода от оппонента. Каждый шаг, который кажется логичным и оправданным внутри одной «комнаты для допроса», снаружи выглядит как шаг к общей пропасти, куда все катятся с идеальной, выверенной математической предопределённостью.

Но существует ли безболезненный выход из дилеммы заключенного? Да, но уже лежит за пределами математики. Американский политолог Р.Аксельрод много лет исследовал проблему и выяснил, что люди, часто сталкивавшиеся с этой дилеммой (и пережившие ее отрицательный опыт) проще и быстрее находят оптимальное решение. А стратегии, где главным мотивом была жадность, даже если и давали какое-то преимущество на коротком отрезке, в долгосрочной перспективе показывали проигрышный результат по отношению к стратегиям, нацеленным на компромисс и создание дружеских отношений. Чтобы избежать дилеммы заключенного при проведении переговоров или выйти из нее были представлены принципы, которых было предложено придерживаться. Стратегии переговоров не должны содержать манипуляций, а сами участники должны отказаться от попыток обмануть оппонента, пока один из них не будет пойман на нарушении данного принципа. Если же сложилась ситуация, когда один из участников предал интересы другого, то тот обязательно должен ответить тем же, чтобы стабилизировать общее положение. После такого «размена», участники снова должны вернуться к сотрудничеству и придерживаться первого принципа. В стратегии переговоров необходимо стремиться к удовлетворению всех интересов в равной степени, без стремления обыграть кого-либо и завоевать больше выгоды. Главный ключ - преодолеть индивидуальные эгоистичные стимулы в пользу общего блага и повторить игру больше одного раза, если не получается сделать это сразу. С течением времени участники смогут выработать стратегии, которые будут поощрять сотрудничество и наказывать за предательство, благодаря чему количество стимулов предавать сократится.

Есть и коллективный альтернативный способ устранения дилеммы заключенного - создавать инструменты и стратегии для избежания деструктивных стимулов и преодоления стереотипов мышления в пользу рациональных, осознанных и взаимовыгодных решений. Но он ресурсозатратен, а также требует честного и добросовестного участия всех участников «игры» в процессе разработки.

Другие пресс-релизы