IPB

Здравствуйте, гость ( Авторизация | Регистрация )


> Политические стратегии из деловых игр, дилемма заключенного
Адика
сообщение 30.04.2025 - 13:51
Сообщение #1


Почетный
*******

Текущее настроение:

Вст. ник | Цитата

Группа: Супер Стар
Сообщений: 4636
Регистрация: 21.02.2009
Пользователь №: 25462

Награды: 31
Подарки: 70

Имя: Адика
Пол: Ж


Репутация:   582  

Тема по поводу вопросов, которые возникают при прочтении результатов психологических экспериментов Аша (Милгрэм), Стэнфордского эксперимента, где люди представляются в виде животных со стремлением к подчинению или садизму - прав тот, кто сильнее. В теме:
http://tochek.net/index.php?showtopic=24070&st=20

я решила там не продолжать ... честно сказать я просто даже не сразу нашла эту тему

Диле́мма заключённого фундаментальная проблема в теории игр, согласно которой рациональные игроки не всегда будут сотрудничать друг с другом, даже если это в их интересах. Предполагается, что игрок («заключённый») максимизирует свой собственный выигрыш, не заботясь о выгоде других.

Суть проблемы была сформулирована Мерилом Фладом[англ.] и Мелвином Дрешером[англ.] в 1950 году. Название дилемме дал математик Альберт Такер.

В дилемме заключённого предательство строго доминирует над сотрудничеством, поэтому единственное возможное равновесие — предательство обоих участников. Проще говоря, каким бы ни было поведение другого игрока, каждый выиграет больше, если предаст. Поскольку в любой ситуации предать выгоднее, чем сотрудничать, все рациональные игроки выберут предательство.

Ведя себя по отдельности рационально, вместе участники приходят к нерациональному решению: если оба предадут, они получат в сумме меньший выигрыш, чем если бы сотрудничали (единственное равновесие в этой игре не ведёт к Парето-оптимальному решению). В этом и заключается дилемма.

Классическая формулировка дилеммы заключённого такова:

Цитата
Двое преступников — А и Б — попались примерно в одно и то же время на сходных преступлениях. Есть основания полагать, что они действовали по сговору, и полиция, изолировав их друг от друга, предлагает им одну и ту же сделку: если один свидетельствует против другого, а тот хранит молчание, то первый освобождается за помощь следствию, а второй получает максимальный срок лишения свободы (10 лет). Если оба молчат, их деяние проходит по более лёгкой статье, и каждый из них приговаривается к полугоду тюрьмы. Если оба свидетельствуют друг против друга, они получают минимальный срок (по 2 года). Каждый заключённый выбирает, молчать или свидетельствовать против другого. Однако ни один из них не знает точно, что сделает другой. Что произойдёт?


В мировой практике, как правило, разделенные преступники соглашаются предать своего сообщника.

В книге «Эволюция кооперации» 1984 года Роберт Аксельрод исследовал расширение сценария дилеммы, которое он назвал повторяющаяся дилемма заключённого (ПДЗ). В ней участники делают выбор снова раз за разом и помнят предыдущие результаты. Аксельрод пригласил академических коллег со всего мира, чтобы разработать компьютерные стратегии, чтобы соревноваться в чемпионате по ПДЗ. Программы, вошедшие в него, различались по алгоритмической сложности, начальной враждебности, способности к прощению и так далее.

Аксельрод открыл, что если игра повторялась долго среди множества игроков, каждый с разными стратегиями, «жадные» стратегии давали плохие результаты в долгосрочном периоде, тогда как более «альтруистические» стратегии работали лучше, с точки зрения собственного интереса. Он использовал это, чтобы показать возможный механизм эволюции альтруистического поведения из механизмов, которые изначально чисто эгоистические, через естественный отбор.
Аксельрод получил четырнадцать дискет с программами своих ученых коллег, заинтересовавшихся соревнованием. У каждой программы были различные законы поведения (у самых простых код поведения умещался в две строчки, у самых сложных — в сотню строк). Целью было набрать как можно больше пунктов. У некоторых программ правилом было как можно скорее эксплуатировать другого, украсть его пункты, а потом сменить партнера. Другие пытались выкрутиться сами, охраняя свои пункты, избегая контактов со всеми, кто мог их обокрасть. Были и такие правила: «Если другой враждебен, его надо предупредить, чтобы он прекратил это, а потом наказать». Или: «Сотрудничать, а потом неожиданно предать».

Каждая программа была 200 раз противопоставлена каждому из конкурентов.

Всех победила программа Анатолия Рапапорта, оборудованная правилом поведения СВП (сотрудничество, взаимоуважение, прощение).

Более того. Программа СВП, помещенная наугад среди других программ, вначале проигрывала агрессивным программам, но в итоге побеждала и даже становилась «заразной», если ей давали достаточно времени. Соседние программы, видя, что она наиболее эффективна, в конце концов начинали применять тот же подход. Так что в долговременной перспективе правило СВП является наиболее рентабельным. Каждый может это проверить на собственном опыте.

Это значит, что нужно забыть все неприятности, которые вам причиняет коллега по работе или конкурент, и продолжать предлагать ему работать совместно, как будто ничего не произошло. Со временем этот метод обязательно окупается. И это не вежливость, это в ваших собственных интересах. Что и было подтверждено с помощью компьютера

Хотелось бы узнать у форумчан... как вы думаете, какой стратегии в политических играх придерживается Трамп, Путин, Зеленский?


--------------------
Когда я сказала ему, что не хочу его видеть, он взял и выключил свет. А ты бы просто обиделся и ушел, вот поэтому я с ним (с)


--------------------
Подарки: (Всего подарков: 70 )
Подарок
Подарил(а): Буська-бяка
Подарок
Подарил(а): Буська-бяка
Подарок
Подарил(а): Буська-бяка




Go to the top of the pageGo to the end of the page
 
+Quote Post

Сообщений в этой теме


Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 




> Статистика
Board Stats

Подарок форуму

10 евро

100 евро

10000 евро

1000000eur

  


Текстовая версия Сейчас: 5.06.2026 - 8:39