Джон Нэш + Популяризация

С этим тегом используют

2 года назад

Олени и буйволы⁠⁠

Робинзон Крузо и Пятница — охотники на зайчиков каменного века. Однажды вечером, когда они вместе выпивали, между ними завязался разговор о делах. Обменявшись мнениями, они поняли, что, объединив свои усилия, они могут замахнуться на гораздо более крупное животное, например, на оленя или буйвола. Тот, кто охотится в одиночку, не может рассчитывать на то, что сможет убить такого гиганта. Но если бы охотники объединились, каждый день охоты на оленя или буйвола давал бы в шесть раз больше мяса, чем день охоты только на зайчиков. Такое сотрудничество имеет большие преимущества: каждый охотник будет получать в три раза больше мяса от охоты на крупную дичь, чем от охоты на зайца.

Робинзон Крузо и Пятница договорились на следующий день поохотиться на крупную дичь, и каждый вернулся в свою пещеру. К сожалению, накануне они слишком много выпили и оба забыли, на какое животное они должны были охотиться, на оленя или буйвола. Охотничьи угодья для этих животных находятся в противоположных направлениях. Тогда не было сотовых телефонов, и все это было до того, как Робинзон Крузо и Пятница стали соседями. Поэтому они не могли просто вначале встретиться, а потом пойти охотиться. На следующее утро каждый должен был принять собственное решение.

Для того, чтобы решить, куда идти, обоим охотникам придется сыграть в игру с одновременными выбором их стратегий. Если обозначить количество мяса, которое каждый получает в день при охоте на зайчиков (выбранная единица), то доля каждого в случае удачной координации усилий по охоте на оленя или буйвола составит три единицы. Таким образом, платёжная матрица для этой игры выглядит следующим образом:

Олени и буйволы Математика, Книги, Популяризация, Научпоп, Теория игр, Джон Нэш

Эта игра сильно отличается от рассмотренной ранее дилеммы заключенного. Разберем самое главное отличие.

Лучший выбор для Робинзона Крузо зависит от того, что делает Пятница, и наоборот. Не существует оптимальной стратегии ни для одного из игроков, независимо от действий другого. В отличие от дилеммы заключенных, в этой игре нет доминирующей стратегии. Поэтому каждый игрок должен анализировать возможный выбор другого и с учетом этого искать свою оптимальную стратегию.

Робинзон Крузо размышляет подобным образом: «Если Пятница пойдет туда, где пасутся олени, то я получу большую долю добычи, если пойду туда, с другой стороны, я ничего не получу, если пойду на пастбище буйволов. Если Пятница отправится на землю бизонов, должно быть наоборот. Вместо того, чтобы пойти на риск и отправиться в одну из этих областей и обнаружить, что Пятница ушёл в другую, не лучше ли мне самому пойти и поохотиться на зайчиков, как я делал всегда, даже если это приносит мне меньше мяса? Другими словами, не должен ли я взять единицу лута наверняка, вместо того, чтобы рисковать получить три единицы или ничего? Это зависит от того, что, по моему мнению, собирается сделать Пятница, поэтому я должен поставить себя на его место и подумать о том, что он думает. Но он также задается вопросом, что я собираюсь делать, и пытается поставить себя на мое место! » Есть ли конец этим повторяющимся размышлениям о размышлениях?

Показать полностью 1

[моё] Математика Книги Популяризация Научпоп Теория игр Джон Нэш

Eriright

2 года назад

Серия Теория игр для начинающих

Парето-оптимальность⁠⁠

Всем привет! Я продолжаю свою серию постов по популяризации науки :) Пока я выкладываю материалы по теории игр.

Парето-оптимальность

Из двух возможных видов игр мы до сих пор рассматривали только некооперативные, то есть те, в которых каждый игрок является эгоистом и желает максимизировать только свой собственный выигрыш или минимизировать свой проигрыш. Возникает вопрос: почему, например, в дилемме заключённого игроки не могут договориться между собой о том, какие стратегии применять?

Критики игрового анализа дилеммы заключённого считают, что рациональное поведение, приводящее к более выгодным для всех ситуациям, возникает не для отдельных лиц, а для групп. Поэтому они считают, что для отдельно взятого игрока его оптимальная стратегия будет заключаться в достижении оптимальной цели для всей группы в целом. Теория рабочего класса Карла Маркса является проявлением такого мышления.

Вильфредо Парето (1848–1923), итальянский социолог и экономист, внес свой вклад в изучение распределения доходов и анализ индивидуального выбора. Он вводит понятие эффективности и помогает развивать область микроэкономики с помощью таких идей, как кривая безразличия. Возможно, вы уже слышали о «принципе Парето». Также называемый законом Парето, принципом 80-20 или даже законом 80-20, это эмпирическое явление, наблюдаемое в определенных областях: примерно 80% следствий являются продуктом 20% причин. Хотя работы Парето не обязательно подразумевает распределение 80-20, Джозеф Джуран в 1954 году использовал выражение «принцип Парето» для его обозначения.

Другой термин, носящий его имя, связан с теорией игр. Пусть имеется система с несколькими частными показателями. Тогда система достигла оптимальности по Парето (стала эффективной по Парето), если при улучшении любого из показателей достигается ухудшение других.

Сам Парето высказывался так:

«Всякое изменение, которое никому не приносит убытков, а некоторым людям приносит пользу (по их собственной оценке), является улучшением»

Относительно исходной ситуации, улучшение по Парето — это новая ситуация, в которой некоторые агенты выиграют, а ни один агент не проиграет.

Ситуация называется доминируемой по Парето, если возможно улучшение по Парето.

Таким образом, система допускает локальные улучшения до тех пор, пока они не приносят никому вреда.

В своем «Руководстве по политической экономии» Парето рассматривает максимальную полезность для общества как свойство общего экономического равновесия и определяет ее как положение, при котором всякая малая вариация увеличивает полезность одних и уменьшает полезность других.

Полезность относится к полезности товара или услуги, ощущаемой данным экономическим агентом в данное время, в отличие от объективной полезности того же товара или услуги. Например, для путешественника в пустыне стакан воды субъективно будет стоить намного дороже, чем для человека в бассейне.

Таким образом, система допускает локальные улучшения, если они никому не вредят. Общее благо общества по Парето максимально в том состоянии, когда никакое изменение полученного оптимального распределения не наносит вреда благосостоянию хотя бы одного объекта системы. Например, в дилемме заключённых состояние «оба молчат» является Парето-оптимальным.

Но опять же возникает проблема. Философы, которые считают, что этот факт показывает противоречие между некооперативной и кооперативной теорией игр упускают из виду важность предположения в кооперативной теории игр о том, что могут быть сделаны жесткие договоренности. Не имеет значения, что Франкенштейн и Дракула обещали соблюдать соглашение. Они, например, могут договориться, но не сдержать обещания. Или же они могут затратить ресурсы на обеспечение нерушимости договора.

Фонтан с водой и оптимум Парето

Мы обсудим здесь ситуацию, описанную в статье одного французского исследователя.

В административном ресторане есть довольно классический для франции питьевой фонтан, оборудованный двумя кранами, с одной особенностью, которая кажется весьма распространенной: общий поток воды одинаков при работе одного или обоих кранов. Когда два человека приходят наполнить свои графины, они обычно делают это одновременно, используя оба крана. Это действительно хорошая идея?

Парето-оптимальность Математика, Теория игр, Джон Нэш, Парето, Популяризация, Дилемма заключенного, Длиннопост

Представьте себе, что первый человек, Гензель, подходит к фонтану, чтобы наполнить свой графин. Как раз в тот момент, когда он собирается начать налить себе водички, в свою очередь появляется второй человек, Гретель. У последней есть выбор между двумя стратегиями: активировать второй кран, чтобы наполнить ее графин одновременно с Гензелем, или подождать, пока тот не закончит, прежде чем начать делать это.

Когда работает только один из кранов, он наполняет графин примерно за 20 секунд. Когда оба крана открыты, каждый из них наполняет графин за 40 секунд. Если Гретель решит использовать второй кран, она и Гензель проведут у фонтана 40 секунд. Если же она решит подождать, Гензель проведет там только 20 секунд, а она 40 (20, чтобы подождать и 20, чтобы наполнить свой графин).

Таким образом, Гретель абсолютно ничего не выигрывает, если откроет второй кран, а Гензель в таком случае потеряет 20 секунд. Поэтому лучшим общим решением будет подождать и никогда не использовать оба крана одновременно.

В случае, который нас здесь интересует, есть две ситуации: одна, когда Гретель использует второй кран, и другая, когда она ждет, прежде чем наполнить свой графин. Вторая ситуация – оптимум Парето, но не первая, поскольку можно улучшить результат Гензеля (сократить его время у фонтана с 40 до 20 секунд), не ухудшив результат Гретель (у которой и так и так будет 40 секунд ожидания).

На самом деле, единственный плюс двух краников у таких фонтанов – это возможность поболтать с коллегой, пока наполняются графины, поэтому, несмотря на всю их нелогичность, во Франции они всюду =)

Попробуйте вспомнить, с какими примерами подобных ситуаций вы уже сталкивались в своей жизни?

Показать полностью 1

[моё] Математика Теория игр Джон Нэш Парето Популяризация Дилемма заключенного Длиннопост

Eriright

2 года назад

Серия Теория игр для начинающих

Равновесие по Нэшу⁠⁠

Прошлые посты тут:

Игра с природой, или что такое математическое ожидание? : Часть 1, Часть 2

Дилемма заключённого : Часть 1, Часть 2, Часть 3,

Частные и общественные блага: Часть 1, Часть 2

Немного классификации и терминов

Мы с вами уже построили платёжные матрицы в двух играх, проведём немного классификации.

В 1944 году за авторством Оскара Моргенштерна и Джона фон Неймана была опубликована книга «Теория игр и экономическое поведение» («Game Theory and Economic Behavior»), в которой:

- Было сформулировано определение «игры», как деятельности двух и более участников (игроков) имеющей условия некоего «выигрыша» и «проигрыша», в рамках которой все участники могут распоряжаться какими-то ресурсами и взаимодействуют между собой, преследуя цель «выиграть» и принимая решения, основанные на поведении других игроков;

- Был математически описан способ поиска оптимальных стратегий в такой игре (ведущих к «выигрышу» с какой-то определенной вероятностью).

Джон фон Нейман (1903—1957) – американский математик и физик венгерского происхождения. Он внес важный вклад во многие области. Тема упомянутой выше книги скорее связана с экономикой. На самом деле до 1930-х годов экономическая наука (по крайней мере, ее основные направления того времени) использовала большое количество числовых данных, но без какой-либо настоящей научной строгости. Это напоминало физику 17-го века, ожидающую языка и научного метода для выражения и решения своих проблем. В то время как классическая физика нашла решение в исчислении бесконечно малых, фон Нейман предлагает для экономики в характерном для нее аксиоматическом подходе теорию игр и теорию общего равновесия.

Суммой игры называется общий итог выигрышей и проигрышей.

В игре с нулевой суммой выигрыш одной стороны равен проигрышу другой. Некоторые карточные игры – преферанс, покер, бридж – есть игры с нулевой суммой. Игры с отрицательной суммой тоже имеются − например, лотереи (если считать сумму участников и не учитывать организаторов).

Команда, выступающая как единое целое, тоже может считаться игроком.

Антагонистической игрой называется игра двух игроков с нулевой суммой – выигрыш одного игрока оборачивается проигрышем другого.

Первым значительным вкладом фон Неймана в 1928 году стала минимаксная теорема, которая утверждает, что в игре с нулевой суммой при полной информации (каждый игрок знает возможные стратегии своего противника и их последствия) у каждого есть набор предпочтительных («оптимальные») стратегии. В игре между двумя рациональными игроками нет ничего лучше для каждого из них, чем выбрать одну из этих оптимальных стратегий и придерживаться её.

Существуют игры с количеством участников, большим двух. Эти игры можно разделить на два класса – кооперативные, когда разрешено нескольким участникам вступать в коалицию (например, в преферансе при розыгрыше мизера обычно два игрока играют против одного в пределах одной партии). В некооперативных играх каждый участник играет только за себя.

В спортивных играх – командных (футбол, хоккей) или личных (шахматы) каждый матч или партия есть игра с нулевой суммой по результатам (ничья, или же один выигрывает, а другой проигрывает). Хотя в турнирных таблицах фигурируют общие набранные очки, в шахматах, например, считают именно «плюсы» – разницу между выигранными и проигранными партиями. В футболе, в связи с борьбой с ничьими, ничейный результат невыгоден обоим. Но если брать именно набранные очки, то турнир – игра с положительной суммой.

Равновесие по Нэшу

Джон Нэш (John Forbes Nash) (1928-2015) в теории игр был признан второй звездой после фон Неймана. Родился в 1928 г., изучал математику в Принстоне и скоро проявил интерес к теории игр. В своей диссертации (1950) двадцатидвухлетний Нэш сформулировал понятие, которому суждено было изменить теорию игр. Кстати, по мотивам его жизни был снят фильм «Игры разума», весьма советую к просмотру.

Термин «равновесие по Нэшу» настолько популярен, что сам Нэш стал бы миллионером, если бы ему платили по доллару за каждое упоминание о нём. Во всяком случае, профессором MIT он стал. А также Нэш – единственный математик и экономист, удостоенный Нобелевской премии по экономике в 1994 году и Абелевской премии по математике в 2015 году.

Вначале Нэш исследовал игру двух игроков с ненулевой суммой, затем объектом его исследований стали некооперативные игры с тремя и более участниками. Нэш вначале выдвинул понятие о равновесии в таких играх, затем доказал, что оно существует для любых конечных игр с любым числом игроков. До него фон Нейманом было доказано только равновесие в играх двух лиц с нулевой суммой.

Исследования Джона Нэша принесли ему Нобелевскую премию по экономике в 1994 году совместно с Джоном Харсаньи и Райнхардом Селтеном. Нобелевский комитет пояснил, что Харсаньи премирован за «распространение равновесия по Нэшу на класс игр с неполной информацией», а Селтен – за обогащение этого равновесия.

Мы видим, что равновесие по Нэшу привело троих учёных к Нобелевской премии (хотя это была математика, премию дали за экономику, математикам Нобелевские премии не положены). Так что же это такое, равновесие по Нэшу?

Равновесие по Нэшу – ситуация в игре, в которой ни один из игроков не может улучшить свое положение, односторонне изменив свою стратегию, если другие игроки свои стратегии не меняли.

Каждый из игроков в равновесии по Нэшу осведомлён о стратегиях других игроков и в связи с этим выбирает для себя лучшую из доступных ему стратегий. В равновесии по Нэшу действует принцип «оглашения» – если все игроки огласят свои стратегии, ни один из них не захочет изменить свою. Это приводит к выводу, что каждому из игроков невыгодно в одностороннем порядке менять свою стратегию – система находится равновесии. Для его поддержания не требуется внешних сил, каждый из игроков старается реализовать в создавшихся условиях именно свою стратегию, и равновесие нарушать невыгодно каждому из игроков. Именно здесь кроется различие между кооперативными и некооперативными играми – для устойчивости первых могут потребоваться внешние силы (например, обращение в суд), устойчивость вторых же внешних сил не требует.

К сожалению, встречаются такие ситуации, когда такое устойчивое состояние возникает в невыгодной для всех ситуации. Если бы все изменили свои стратегии, система пришла бы к более выгодному состоянию для всех, но для этого необходимо сотрудничество всех, которое невозможно в некооперативных играх, а попытка любого из игроков изменить для себя стратегию приводит к ещё более худшим результатам. Упомянутая ранее дилемма заключённого – один из случаев стабильно плохой по Нэшу ситуации для всех.

Показать полностью

[моё] Математика Теория игр Дилемма заключенного Джон Нэш Популяризация Длиннопост Текст

Посты не найдены