Теория игр показывает: мы не учимся на собственных ошибках

Звучит немного пессимистично, правда? Как будто мы обречены повторять одно и то же, несмотря на весь наш опыт. Ведь мы же учимся на ошибках, верно? Изучаем историю, чтобы не повторять войны, анализируем кризисы, чтобы строить крепче, и смотрим на экологические проблемы, чтобы жить разумнее. Каждая неудача вроде бы делает нас мудрее.

Но теория игр, которая изучает, как люди принимают решения, когда результат зависит от действий других, рисует другую картину. В таких сложных системах, где все взаимосвязано, понять, что именно было «ошибкой» и какой «урок» из этого извлечь, становится не так-то просто. Дело не в том, что мы глупы, а в том, как устроены эти стратегические игры.+1.

Рациональность и предел контроля

Классическая теория игр оперирует моделью рационального игрока: субъекта, который просчитывает возможные исходы, взвешивает вероятности и выбирает стратегию, максимизирующую ожидаемую выгоду. Однако реальность быстро размывает эту идеальную конструкцию. Экономист Герберт Саймон ввёл понятие «ограниченной рациональности»: наш когнитивный аппарат не способен обрабатывать экспоненциально растущее число переменных, особенно когда другие участники тоже обладают ограниченными, но иными возможностями.

В стратегической среде равновесие Нэша — состояние, при котором ни одному игроку не выгодно менять стратегию при заданных действиях остальных — существует, но его достижение требует знания не только собственных предпочтений, но и убеждений оппонентов. Когда вы «учитесь на ошибке», вы корректируете поведение на основе прошлого опыта. Но прошлое не содержит информации о будущих ходах тех, кто адаптируется параллельно с вами. Ваша новая стратегия меняет ландшафт игры, оппоненты отвечают изменением своей, и вчерашний «правильный урок» превращается в сегодняшнюю уязвимость. Взаимная зависимость решений создаёт движущуюся цель: учиться можно, но фиксировать результат — нельзя. +2.

Парадокс обучения в повторяющихся взаимодействиях

Интуитивно кажется, что многократные взаимодействия должны приводить к накоплению мудрости. Если вас обманули, вы перестаёте доверять; если сотрудничество принесло выгоду, вы его повторяете. Знаменитый турнир Роберта Аксельрода по повторяющейся дилемме заключённого показал, что простая стратегия «око за око» (сотрудничай первым, затем копируй ход оппонента) стабильно выигрывает. Но теория игр раскрывает и обратную сторону медали: в сложных экосистемах стратегий слишком много, и «оптимальное» поведение эволюционно неустойчиво.

Как только большинство игроков переходит к кооперации, возникает ниша для «мутантов»-эксплуататоров, которые извлекают выгоду из доверчивости среды. Те, кто учится на ошибках предшественников, часто становятся жертвами тех, кто учится на их успехах. Обучение не линейно, а циклично: доверие рождает предательство, предательство — недоверие, недоверие — стагнацию, стагнацию сменяет новый всплеск кооперации. Мы не «запоминаем» урок в чистом виде, мы проходим очередной виток спирали, где каждый цикл меняет контекст, а значит, и применимость прошлого опыта.

Информационный туман и природа «ошибки»

Ещё один фундаментальный барьер — асимметрия информации. В реальной стратегии вы никогда не видите полной карты. То, что со стороны выглядит как ошибка, часто является результатом скрытых переменных: неучтённых рисков, ложных сигналов, стохастических колебаний или просто неудачного стечения обстоятельств. В играх с неполной информацией, формализованных Джоном Харшаньи, игроки оперируют не фактами, а вероятностными убеждениями.

Когда вы анализируете прошлый промах, вы реконструируете его через призму того, что знаете сейчас. Это классическая ошибка ретроспективного детерминизма: вы знаете исход, а значит, «видите» путь к нему как единственно верный или единственно ошибочный. Но в момент принятия решения вы действовали рационально в рамках доступных данных. Среда изменилась, оппоненты адаптировались, а значит, ваш «урок» привязан к контексту, которого больше не существует. Теория игр не отрицает обучение, но показывает, что оно всегда локально, контекстуально и никогда не универсально.

Системные ловушки и коллективная слепота

Самый тревожный вывод касается масштабирования индивидуального опыта на уровень общества. Даже если каждый участник учится на своих ошибках, система в целом может оставаться в состоянии субоптимального равновесия. Дилемма заключённого, трагедия общин, гонки вооружений, финансовые пузыри — все эти феномены демонстрируют одно: рациональный выбор на микроуровне часто ведёт к коллективному проигрышу на макроуровне.

Индивидуальное обучение не масштабируется, потому что выигрыш зависит от координации, а не от абсолютной правильности решений. В климатических переговорах каждая страна знает историю экологических кризисов, но стимулы к краткосрочному росту, страх потерять конкурентное преимущество и проблема безбилетника перевешивают коллективную мудрость. Пока структура взаимодействий не меняется, ошибки воспроизводятся не из-за невежества, а из-за логики системы. Теория игр здесь не утешает: институциональные правила важнее личных прозрений.

Что остаётся вместо уроков?

Значит ли это, что обучение бессмысленно? Нет. Но теория игр требует от нас смирить амбиции и пересмотреть само понятие «урока». Мы не сможем научиться на ошибках в смысле выработки вечного рецепта, потому что стратегическая реальность не статична, а реляционна. Успех зависит не от абсолютной правильности, а от относительной адаптивности, скорости обратной связи и способности менять правила самой игры.

Современные исследования многоагентного обучения и эволюционной динамики показывают: устойчивые системы не те, где игроки «запомнили» прошлое, а те, где механизмы делают ошибки менее разрушительными. Прозрачность, децентрализованный контроль, институты, снижающие стимулы к краткосрочной эксплуатации, возможность быстрого экспериментирования — вот что заменяет иллюзию «финального урока».

Теория игр не приговор, а карта. Она показывает, что в мире взаимозависимых решений прошлое не гарантирует будущего, а «ошибка» — это не провал разума, а неизбежный элемент сложной адаптивной системы. И, возможно, именно признание этого факта станет тем самым уроком, который действительно стоит усвоить: не для того, чтобы перестать ошибаться, а для того, чтобы строить миры, где ошибки перестают быть катастрофами.

Dim_Su