Горячее
Лучшее
Свежее
Подписки
Сообщества
Блоги
Эксперты
Войти
Забыли пароль?
или продолжите с
Создать аккаунт
Я хочу получать рассылки с лучшими постами за неделю
или
Восстановление пароля
Восстановление пароля
Получить код в Telegram
Войти с Яндекс ID Войти через VK ID
Создавая аккаунт, я соглашаюсь с правилами Пикабу и даю согласие на обработку персональных данных.
ПромокодыРаботаКурсыРекламаИгрыПополнение Steam
Пикабу Игры +1000 бесплатных онлайн игр
Пройдите все испытания в игре кальмара второго сезона

Игра в кальмара 2: новые испытания

Аркады, Казуальные, Для мальчиков

Играть

Топ прошлой недели

  • AlexKud AlexKud 38 постов
  • SergeyKorsun SergeyKorsun 12 постов
  • SupportHuaport SupportHuaport 5 постов
Посмотреть весь топ

Лучшие посты недели

Рассылка Пикабу: отправляем самые рейтинговые материалы за 7 дней 🔥

Нажимая кнопку «Подписаться на рассылку», я соглашаюсь с Правилами Пикабу и даю согласие на обработку персональных данных.

Спасибо, что подписались!
Пожалуйста, проверьте почту 😊

Помощь Кодекс Пикабу Команда Пикабу Моб. приложение
Правила соцсети О рекомендациях О компании
Промокоды Биг Гик Промокоды Lamoda Промокоды МВидео Промокоды Яндекс Директ Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня

Популяризация + Стратегия

С этим тегом используют

Наука Научпоп Математика Книги Теория игр YouTube Политика Игры Компьютерные игры Видеоигра Ретро-игры Ищу игру Gamedev Все
7 постов сначала свежее
1
Eriright
Eriright
2 года назад

Последовательные игры- продолжение⁠⁠

Продолжим вопрос о свидании Мата Хари и Мюнхаузена, начатый в предудущем посте из серии.

При внимательном рассмотрении становится ясным, что рассмотренная в игре угроза на самом деле угрозой не является. Ведь очевидно, что как только Мюнхаузен сделает свой выбор, возможными выигрышами Мата Хари могут быть либо 0, либо 1, так что пусть уж это будет 1.

Последовательные игры- продолжение Научпоп, Математика, Книги, Стратегия, Популяризация, Наука, Теория игр, Выбор


Проблема Мата Хари в том, что после того, как Мюнхаузен делает свой выбор, он ожидает рационального поступка от неё. Она могла бы себя связать обязательством съесть суши даже в том случае, если бы Мюнхаузен привёл её в кошерный ресторан, возможно, это могло бы улучшить её настроение.

Связать себя таким обязательством можно, например, позволив кому-нибудь другому сделать за себя. Мата Хари, например, могла бы нанять кузнеца и поручить ему заставить её есть суши в данном случае. Однако, с точки зрения Мюнхаузен, ситуация в этом случае решительно меняется.

Если он знает о договорённости Мата Хари с кузнецом, то он понимает, что если он приведёт Мата Хари не в японское кафе, его вечер будет безнадёжно испорчен. Поэтому для него разумнее пойти на поводу у девушки. В данном случае женский ультиматум помог повысить настроение Мата Хари.

Как вообще назвать равновесие, возникающее в данной игре?

Стратегии и равновесия в этом типе игр изучал барон Генрих фон Штакельберг (1905-1946), немецкий экономист. Конкуренция по Штакельбергу — это модель дуополии. Дуополия Штакельберга асимметрична, то есть две конкурирующие фирмы не обладают одинаковой властью. Мы говорим о фирме-лидере (или фирме-пилоте) и фирме-сателлите, ведомой фирме. Здесь пилот - барон Мюнхгаузен.

Равновесие в этой и ей подобных играх называется равновесием Штакельберга. В таких играх имеется лидер, игрок, который делает первый ход. Лидер может определить стратегии, определяющиеся равновесием Нэша, после каждого из своих ходов. Мы полагаем при вычислении данного равновесия, что ведомый рационален и выбирает стратегии согласно прогноза лидера.

Например, в рассмотренной игре, равновесием Штакельберга является шаурма из кошерного ресторана.

Показать полностью 1
[моё] Научпоп Математика Книги Стратегия Популяризация Наука Теория игр Выбор
2
4
Eriright
Eriright
2 года назад
Серия Теория игр для начинающих

Последовательные игры⁠⁠

До этого мы обсуждали только игры, в которых игроки совершают выбор одновременно. Но есть и другие варианты.

Мало того, такие варианты встречаются достаточно часто.

Рассмотрим следующую игру. Пусть барон Мюнхаузен и Мата Хари собрались на свидание в ресторане, в котором из соображений экономии разделят на двоих одно блюдо. В этой игре функцией полезности каждого игрока будет оценка удовольствия, которое он получил во время этой встречи (как удовольствие от общения с кем-то, так и от выбора ресторана или даже от выбора блюда).

Последовательные игры Математика, Книги, Выбор, Популяризация, Научпоп, Теория игр, Стратегия, Длиннопост

Для того, чтобы никто не обиделся, вначале Мюнхаузен выбирает одно из двух кафе, а потом Мата Хари выбирает одно из двух блюд в нём (блюда в кафе одинаковы, но готовят их по-разному).

Каждая пара исхода принесёт разные выигрыши, выигрышем в данной игре будет полученное удовольствие от поглощения пищи. Так как эти персонажи слишком различны, в своём выборе они руководствуются исключительно эгоистичными соображениями.

Попробуем описать данную игру в стратегической форме.

Последовательные игры Математика, Книги, Выбор, Популяризация, Научпоп, Теория игр, Стратегия, Длиннопост

Заметим, что когда игра представлена в указанной форме, то мы видим два равновесия по Нэшу (суши в японском кафе или шаурма в кошерном ресторане). На самом деле это не так. Проблема заключается в том, что игроки выбирают стратегии последовательно друг за другом, то есть, второй игрок уже знает, какую стратегию выбрал первый. Матрица платежей в привычной форме не даёт об этом представления.

Асимметричность данной игры лучше проявляется не в виде матрицы платежей, а в виде дерева выбора, экстенсивной форме. Решения в этой форме могут быть представлены этим деревом, каждый узел которого связан с игроком, который принимает решение. Каждый вариант представляет собой ветвь. Выигрыши всех игроков связаны с терминальными вершинами или листьями дерева.

Первым делом барон Мюнхаузен должен выбрать между японскими и кошерными ресторанами, а затем Мата Хари должна выбрать, что она возьмёт — суши или шаурму. Но Мата Хари, делая свой выбор, уже знает, в какой ресторан привёл её барон Мюнхаузен на свидание.

Последовательные игры Математика, Книги, Выбор, Популяризация, Научпоп, Теория игр, Стратегия, Длиннопост

Проведём анализ игры, рассмотрев ходы в обратном порядке. Если Мюнхаузен уже сделал свой первый ход и выбрал японское кафе, то, вне зависимости от хода Мата Хари, выигрыш будет составлять (1 ; 9). Если Мюнхаузен выбрал своим первым ходом кошерный ресторан, то ходы Мата Хари уже неравнозначны и для достижения наилучшего результата ей стоит выбрать шаурму, после чего выигрыш будет составлять  (2 ; 1).

Что же выбрать Мюнхгаузену? При выборе японского кафе, результатом игры будет (1 ; 9) и он получит выигрыш, равный 1. Если он выберет кошерный ресторан, то его выигрыш будет равен 2. Это и будет наиболее разумным для него выбором. Это значит, что равновесный выбор — шаурма из кошерного ресторана, что ведёт к выигрышу для Мюнхгаузена в 2 очка, а для Мата Хари –  в 1.

Второе из вроде как равновесий, которое было получено с помощью таблицы, точно не является равновесием, имеющим смысл в данной игре. Очевидно, что в случае выбора Мюнхгаузеном японского кафе, Мата Хари могла выбрать суши, но выбор данной столовой Мюнхаузеном был бы не самым умным поступком.

С точки зрения Мата Хари, свидание складывается не самым удачным образом – она могла бы получить выигрыш в 9 очков удовольствия, а получит всего-навсего 1. Что она может сделать в такой ситуации?

Например, она может угрожать Мюнхаузену, что они всё равно будут есть суши, даже если пойдут в кошерный ресторан. Если Мюнхаузен верит в женские угрозы, то это имеет смысл. В таком случае, японское кафе ему принесёт один балл удовольствия, тогда как суши из кошерного ресторана он вообще не захочет есть и получит 0 очков.

Но является ли эта угроза реальной?

Показать полностью 3
[моё] Математика Книги Выбор Популяризация Научпоп Теория игр Стратегия Длиннопост
1
7
Eriright
Eriright
2 года назад
Серия Теория игр для начинающих

Полковник Блотто и китайские палочки⁠⁠


Аукцион китайских палочек (палочек для еды) происходит, когда в игру пускаются три китайские палочки, у этих аукционов очень специфические и очень строгие правила. У каждого игрока ровно одинаковая сумма. Есть только один раунд, и аукционы секретные, поэтому никто не знает, что предлагают другие. За этот единственный ход каждый из игроков обязан предложить ставку (возможно, нулевую) на каждую из трёх палочек (различимых). Каждый игрок хочет выиграть как минимум две палочки из трех. Действительно, есть только одной палочкой не очень-то и удобно!

Равновесия Нэша для аукциона китайских палочек всегда описываются смешанными стратегиями, но форма этих равновесий просто завораживает. Известное равновесие для трех палочек гласит, что одно из равновесий описывается стратегией, задаваемой равномерным распределением на поверхности тетраэдра в пространстве ставок на три палочки. Недавно было найдено другое равновесие (опять же для трех палочек), которое берет тот же тетраэдр и превращает его во фрактал в духе треугольника Серпинского. Равновесная стратегия в этом случае предполагает равномерное распределение ставок на поверхности этого фрактала.

Чем-то похожим на этот аукцион является игра «Полковник Блотто». Это тип игры с нулевой суммой для двух человек, в которой перед игроками стоит задача одновременно распределить ограниченные ресурсы между несколькими объектами (или полями сражений). В классической версии данной игры игрок, потративший больше всего ресурсов на какую-то битву, её выигрывает, а выигрыш игрока равен общему количеству выигранных полей боя.

Игра была предложена в 1921 году как пример игры, в которой «имеет значение психология игрока». Она изучалась после Второй мировой войны специалистами по исследованиям операций и стала классикой теории игр.

Название игры заимствовано у вымышленного полковника. Его задача — найти оптимальное распределение своих солдат на N полях сражений, зная, что:

  • на каждом поле боя побеждает та сторона, которая выделяет больше солдат, но

  • ни одна из сторон не знает, сколько солдат противоборствующая сторона отправит на каждое поле боя, и:

  • обе стороны стремятся максимизировать количество полей сражений, которые они рассчитывают выиграть.

Давайте представим себе игру, основанную как на китайском аукционе палочек, так и на игре «Полковник Блотто».


В игру «Голодный полковник» играют 2 игрока. Каждый из них может написать 3 числа, но не в порядке убывания. Сумма чисел должна быть 6. Выигрывает игрок, чьи 2 числовые позиции превышают 2 позиции противника.

У каждого игрока есть 3 варианта (игра симметричная) ходов, в том числе (2; 2; 2), (1; 2; 3) и (1; 1; 4). (1; 1; 4) против (1; 2; 3) приводит к ничье, (1; 2; 3) против (2; 2; 2) приводит к ничье, (2; 2; 2) выигрывает (1 ; 1; 4). Итак, (2; 2; 2) — оптимальная стратегия.


Рассмотрите другой вариант аналогичной игры для двух игроков и сыграйте в нее с друзьями:

  • Игровое поле представляет собой доску 3 на 3.

  • У каждого игрока есть армия из 100 маленьких Ктулху.

  • Перед ночным боем каждый игрок тайно размещает свои отряды на 9 клетках. На каждую клетку можно поставить любое целое число Ктулху от 0 до 100.

  • Утром начинается битва новую планету. На каждой из 9 клеток побеждает игрок, у которого больше всего Ктулху на этой клетке. За победу на каждом из 9 квадратов дается 1 очко. Если на какой-то клетке числа соперников были одинаковыми, то бой на этой клетке заканчивается вничью и оба игрока получают по 0,5 очка.

  • Битву выигрывает тот, кто выиграл больше всего полей. Если оба игрока получают по 4,5 очка, битва заканчивается вничью.

Полковник Блотто и китайские палочки Математика, Стратегия, Популяризация, Научпоп, Теория игр, Книги, Длиннопост

Эта игра (разумеется, немного в другой формулировке) проходила в качестве конкурса в 2019 году на сайте Михаила Павкухина. Наилучший результат получил игрок, разместивший Ктулхят согласно следующей таблице: :

Полковник Блотто и китайские палочки Математика, Стратегия, Популяризация, Научпоп, Теория игр, Книги, Длиннопост


Этот игрок обыграл 4121 соперника, проиграл 1011 и сыграл вничью с 216.

Показать полностью 2
[моё] Математика Стратегия Популяризация Научпоп Теория игр Книги Длиннопост
0

Продвиньте ваш пост

Перейти
Партнёрский материал Реклама
specials
specials

Нужно больше внимания к постам? Есть способ!⁠⁠

Иногда даже самый интересный материал теряется в потоке новых записей. Если ваш пост остался незамеченным, измените ситуацию. Для этого на Пикабу есть продвижение.

Все просто: оставьте заявку в форме, добавьте ссылку на пост и выберите подходящий бюджет. Все. Ваш пост покажут во всех лентах на специальных позициях. Ну а вы получите дополнительную аудиторию и отклик пользователей.

Продвинуть пост

Продвижение Посты на Пикабу Текст
11
Eriright
Eriright
2 года назад
Серия Теория игр для начинающих

На один шаг вперёд?⁠⁠

Вспомним «Похищенное письмо» Эдгара По. Процитируем небольшой отрывок, как нельзя точно отражающий суть игр, подобных "игре в монетку" или "камень-ножницы-бумага".

Мне  знаком восьмилетний мальчуган, чья способность  верно  угадывать  в игре «чет и нечет» снискала ему всеобщее восхищение. Это очень простая игра: один  из  играющих  зажимает  в  кулаке  несколько камешков  и спрашивает  у другого,  четное  ли их  количество  он  держит  или нечетное.  Если  второй играющий угадает правильно,  то он выигрывает  камешек, если же неправильно, то  проигрывает камешек. Мальчик,  о котором я упомянул, обыграл всех  своих школьных  товарищей.  Разумеется,  он  строил  свои  догадки  на  каких-то принципах, и эти последние заключались лишь в том, что он внимательно следил за  своим  противником и правильно оценивал степень  его хитрости.

Например, его заведомо глупый противник поднимает кулак и опрашивает: «Чет или нечет?»

Наш школьник отвечает «нечет» и  проигрывает.. Однако  в следующей попытке он выигрывает,  потому что говорит себе: «Этот дурак взял в прошлый  раз четное количество камешков  и,  конечно, думает, что отлично схитрит,  если  теперь возьмет  нечетное  количество.  Поэтому я  опять скажу – нечет!» Он  говорит «нечет!» и выигрывает.

С противником чуть поумнее он рассуждал бы так: «Этот мальчик  заметил, что я сейчас сказал «нечет», и теперь  он сначала  захочет

изменить  четное число камешков на  нечетное, но тут же спохватится, что это слишком просто, и оставит их количество прежним. Поэтому я скажу  «чет!». ». Он говорит  «чет!»  и  выигрывает.  Вот ход  логических  рассуждений маленького мальчика,  которого его товарищи окрестили «счастливчиком». Но,  в  сущности говоря, что это такое?

– Всего  только, – ответил  я,  – уменье  полностью  отождествить  свой интеллект с интеллектом противника.

–  Вот именно, – сказал Дюпен.  –  А  когда я спросил у мальчика, каким способом он  достигает  столь  полного  отождествления, обеспечивающего  ему постоянный успех, он  ответил  следующее: «Когда  я  хочу  узнать, насколько умен,  или глуп,  или добр, или  зол  вот этот  мальчик иди о  чем он сейчас думает,  я стараюсь придать своему лицу точно  такое  же  выражение, которое вижу на  его  лице,  а потом жду,  чтобы узнать,  какие  мысли  или  чувства возникнут у меня в  соответствии  с этим выражением


Потому мальчик из данного рассказа настолько успешен, что он всегда может продумать цепочку «Он думает, что я думаю, что он думает, что....»  ровно на один шаг дальше, чем соперник.

Точно так же и в «камень-ножницы-бумага» нет равновесия Нэша: во всех этих вероятных исходах нет варианта, при котором оба участника были бы довольны своим выбором. Однако чемпионат мира и Всемирное общество ножниц-камень-бумаги (World Rock Paper Scissors Society) собирают игровую статистику. Очевидно, что в этой игре можно повысить свои шансы на победу, зная кое-что об обычном поведении людей.


По данным World RPS Society, камень — самый популярный бросок (37,8%). Бумагой играют 32,6%, ножницами — 29,6%. Итак, теперь вы знаете, что вам нужно выбрать «бумажный» ход. Однако, если вы играете с кем-то, кто тоже это знает, больше не берите бумагу, потому что это ожидаемо. Известен случай: в 2005 году два аукционных дома Sotheby's и Christie's соревновались за право выставить на торги очень крупный лот, в частности, коллекцию Пикассо и Ван Гога по стартовой цене в 20 миллионов долларов. Хозяин пригласил представителей двух домов поиграть в «камень-ножницы-бумагу». Sotheby's без колебаний выбрал бумагу. Победил дом Christie's. На самом деле его представители обратились к эксперту, 11-летней дочери одного из топ-менеджеров. Она сказала: «Камень кажется самым прочным, поэтому большинству людей хочется выбрать его. Но если мы не будем играть с совсем тупым новичком, то он не выберет камень, но будет ждать этого от нас, поэтому, он выберет бумагу. Мы подумаем на один шаг вперёд и выберем ножницы.»

Ящерица? Спок!

Новый вариант игры «камень-ножницы-бумага» популяризировал американский сериал «Теория большого взрыва», изначально созданный Сэмом Кассом и Карен Брайла. Это камень-ножницы-бумага-ящерица-Спок. Здесь действуют классические правила, к которым нужно добавить ящерицу, которая ест бумагу, отравляет Спока, раздавливается камнем и обезглавливается ножницами. Тем временем Спок испаряет камень, ломает ножницы и дискредитирует себя бумагой. Этот вариант, который увеличивает количество комбинаций с 3 до 10, должен уменьшить количество ничей между двумя игроками, которые знают друг друга.

На один шаг вперёд? Математика, Книги, Стратегия, Логика, Теория игр, Камень-ножницы-бумага, Популяризация, Научпоп, Длиннопост
На один шаг вперёд? Математика, Книги, Стратегия, Логика, Теория игр, Камень-ножницы-бумага, Популяризация, Научпоп, Длиннопост


Согласно теории вероятностей, в классическом варианте вероятность выигрыша, проигрыша и повторной игры одинакова и равна 1/3. В улучшенной версии ситуация меняется: вероятность выигрыша и проигрыша составляет по 0,4, а вероятность повторной игры — 0,2. Другими словами, если вы используете улучшенную версию инструмента разрешения споров, то в среднем количество неудачных раундов будет меньше. Тем не менее, между персонажами сериала этот вариант систематически приводит к ничье Спок vs. Спок.

Другой вариант, на этот раз французский, был популяризирован игрой Le Tout (изобретенной Tobiffleurs). Это камень-ножницы-бумага-галактика-клещ. Здесь мы используем классические правила, добавляя галактику, которая дематериализует камень, лист и ножницы, но которая взрывается из-за клеща. Последний может же быть убит камнем, листом или ножницами.

На один шаг вперёд? Математика, Книги, Стратегия, Логика, Теория игр, Камень-ножницы-бумага, Популяризация, Научпоп, Длиннопост


Давайте сравним этот режим игры с другими типами. Вариант «камень-ножницы-бумага-колодец» менее сложен, чем вариант «камень-ножницы-бумага-ящерица-Спок». Есть 4 знака для увеличения количества комбинаций. Это вариант, встречающийся во франкоязычных странах (Франция, Швейцария, Канада) и Германии.

Подробно о дополнительных условиях победы:

  • Ножницы падают в колодец,

  • Камень падает в колодец,

  • Бумага закрывает колодец.


В обычной игре каждый вариант не лучше и не хуже другого. В игре с колодцем, он, конечно же, лучше камня, так он, как и камень, проигрывает бумаге и выигрывает у ножниц, но при их встрече преимущество за колодцем. Таким образом, игрок не заинтересован в использовании камня, потому что, если он вместо этого покажет колодец, его шансы победить любого противника выше. Это означает, что ни один из игроков никогда не будет использовать камень и в игре снова есть три варианта с классическим балансом: колодец, ножницы, бумага. На языке теории игр можно сказать, что колодец доминирует над камнем.

В некоторых местностях и сообществах используются варианты до 9 различных фигур. В шутку на форумах и сайтах также обсуждались варианты до 101 фигуры. Неплохая тренировка памяти и гибкости пальцев, не правда ли?

Показать полностью 3
[моё] Математика Книги Стратегия Логика Теория игр Камень-ножницы-бумага Популяризация Научпоп Длиннопост
1
4
SHER.man
2 года назад
Серия Инновации

Ответ на пост «Игры с повторениями»⁠⁠1

Исходник: Игры с повторениями

0) «... Реальные дуополисты не живут ровно одним решением, а принимают новые и новые решения день за днем. ...»

----

Вообще-то как раз нередко принимают стратегическое решение и далее пытаются просто продавить его силой, или просто тупо бьются как мухи об стекло не понимая есть их фантазии о реальности, а есть объективное столкновение с этой реальностью.

Ловушка безвозвратных затрат (цитаты из научпоп статьи)

... Ловушка невозвратных затрат – одна из форм более широкого когнитивного искажения под названием «эскалация вовлеченности» ...

Но для таких людей как правило: «вся жизнь война», им не важнен результат, для них важней оказаться правым (даже если просто тупо смошенничал исковеркав «игру»).

1) «... Третья стратегия – это делать одну шляпу до тех пор, как ваш противник делает то же самое, но переключится на две шляпы на следующий день после того, как ваш противник первым попытался на вас навариться. Если вы измените свою стратегию, то это потому, что ваш противник сам изменил ее, сделав две шляпы без предупреждения. ...»

---

Можно короче: принцип ведомого (отзеркаливание действий соперника).

Но у этой модели проблема в том что ты ведомый, т.е. реагируешь на ситуацию, а не задаёшь её исход.

2) «... Для однократной игры партнёрам стоит использовать принцип минимакса вне зависимости от того, содержит ли матрица платежей седловую точку или не содержит. Этот же принцип целесообразно использовать и при многократной игре с седловой точкой. ...»

---

Тут проблема в том что игрокам не всегда понятно когда игра разовая.

Вроде отжал «здесь и сейчас» по максимуму свою «львиную долю» пользуясь «правом силы», а игра оказалась в долгую (многократные игры).

И тут в игру вступает новая переменная «память о прошлых играх» (результаты предыдущих взаимодействий).

И оказывается что «никто не забыт, ничто не забыто» и тебе могут выставить «счёт» за прошлое. Аналогично и ты можешь «предъявить» «ты мне - я тебе». По сути с этого момента некооперативная игра начинает приобретать черты кооперативной, т.к. приходится учитывать интересы другого игрока, а не тупо «урвал побольше - убежал подальше», т.к. «куда ты денешься с подводной лодки?»© (мы в этой лодке до конца игры).

В пример см. Процессный подход и совершенствование с пункта «В».

3) «... Поэтому «чем случайнее, тем вернее», именно непредсказуемо случайное чередование стратегий не позволит добиться сопернику выигрыша. ...»

---

В реальности тут скорее начинается «картельный сговор». Игра из однократной превратилась а серию/цикл и чтоб её не порушить своей, или чужой жадностью и безрассудством приходится договариваться о внутренних правилах этой серии игр.

Вилке выигрышев в среднем и максимально для каждого в отдельно взятой игре (самоконтроль), допустимом давлении на оппонента и пр.

Но опять-таки это всё для формально равноправных участников. Если один из игроков (например фирма) думает что «я здесь власть) и купив трудовые услуги человека может его эксплуатировать. ... В реальности в договременоом сотрудничестве человек пользуясь «информационной асимметрией» https://ru.m.wikipedia.org/wiki/Асимметричность_информации (неявным знанием о работе для которой его наняли https://ru.m.wikipedia.org/wiki/Неявное_знание) будет восстанавливать социальную справедливость в меру своего понимания. В основе этой философии поведения лежит https://ru.m.wikipedia.org/wiki/Занавес_неведения и Некооперативные игры. Размышляя над «Ультиматумом» (мой комментарий по поводу игры «Ультиматум»).

4) Как писал чуть ранее неоднократность игры, её переход в серию + память о прошлых играх переводят эту «сериальную игру» в категорию кооперативных, в ином случае исходя из высших побуждений (справедливость) вечно проигрывающий игрок может из неё выйти и тем самым уничтожить оставив всех без выигрыша (см. игра «Ультиматум»).

Ага, я сейчас опять и снова про инновационную сферу и рационализаторскую деятельность.

Фирма считающая себя монополистом на местечковом рынке инноваций демпенгует через закупочные цены и роялти (авторские отчисления) на рацпредложения, изобретения, оптимизации и прочие инновации исходя из логики: «кому ты ткт ещё сможешь продать свои рацухи?, бери сколько заплатили».

Тем более что чиновники принимающие решения считают себя анонимным, организованным единством (говорящим от лица компании), а всех этих «Кулибиных» оголодавшими (финансирование из других источников) которые не умеют думать наперёд (просчитывая свою выгоду), которые не могут посмотреть историю прошлых игр для ретроспективного и проективного анализа инновационной игры чтоб понять какова будет их «гонорар успеха», или просто общаясь в своей среде поспрашивать у тех кто сыграл и сделал выводы уже Делёжка шкуры не убитого медведя (см. комментарии).

Как успехи?

См. https://ru.m.wikipedia.org/wiki/Индекс_глобальной_конкурентоспособности + https://ru.m.wikipedia.org/wiki/Интеллектуальный_капитал. В общем плохо, пока у нас игры «Царь Горы» и попытка урвать сиюминутно в псевдоразовой (однократной) игре, считая что тут игра с нулевой суммой, и готовые загрысть ради «победы». В других местах приоритет отдают долговременному, взаимовыгодному сотрудничеству (кооперативные игры) т.к. понимают что автор «гонорар успеха» потратит на себя в месте обитания, т.е. оставит деньги «на земле» и в экономике, а не законсервирует в золотом унитазе, часах стоимостью в элитную квартиру, океанскую яхту на которой бываешь 1~3 недели в год и прочий «дорого, пафосно и бесполезно».

Классическая https://ru.m.wikipedia.org/wiki/Игра_РП-РџР% где каждый сам за себя и сам по себе что и приводит к https://ru.m.wikipedia.org/wiki/Трагедия_антиобщин в виде проигрыша всех кто в этой «лодке». Ага, оказывается мы все по одну сторону, только на разных уровнях общества и государства, кто-то «как рабы на галерах», кто-то рулевой, кто-то просто разносчик чего-то там и вместо слаженной работы (кооперации) выясняем кто главный, кто-то себе строит плот из обшивки корабля (мне нужнее), кто-то топливо продаёт чтоб купить себе велосипед/трактор, кто-то паруса порезал на воздушный шар. В сумасшедшем доме попытка одиночного побега :-))) В общем, самовыживание без сотрудничества в основе которой «верхи не могут, низы не хотят» что и приводит к внутрикорпоративным войнам на истощение (в живых должен остаться только один).

По некоторым позициям обогнав нас в «эволюционной гонке» прогресса (НТР) на десятилетия (та же микроэлектроника, биоинженерия и пр. промышленное (а не лабораторное) производство).

«Гонка на дно» продолжается.

Показать полностью
[моё] Математика Стратегия Теория игр Книги Популяризация Научпоп Инновации Рационализаторское Изобретения Менеджмент Система вознаграждения Ответ на пост Длиннопост Текст Социальная психология Когнитивная психология Конфликтология Конфликт интересов Сделка с дьяволом
4
11
Eriright
Eriright
2 года назад
Серия Теория игр для начинающих

Игры с повторениями⁠⁠1

Если рациональное сотрудничество невозможно в дилемме заключенных, как же дуополисты в реальной жизни могут договориться? Причина заключается в том, что реальный мир более сложен, чем вымышленные миры. Реальные дуополисты не живут ровно одним решением, а принимают новые и новые решения день за днем. Дилемма заключенных не отражает суть такого продолжающегося экономического взаимодействия, но мы можем создать «игрушечную игру», предполагая, что Алиса и Фантомас должны играть в данную игру дилеммы заключенных каждый день с сегодняшнего дня и до вечности. Их выигрыши в этой новой игре – это просто их средний ежедневный доход.

Когда мы будем изучать повторяющиеся игры серьезно, мы найдем, что Алиса и Фантомас имеют огромное, в общем виде счётное, количество стратегий, но сейчас мы будем просто смотреть на три: одна шляпа, две шляпы, и «я такой внезапный».  Третья стратегия  – это делать одну шляпу до тех пор, как ваш противник делает то же самое, но переключится на две шляпы на следующий день после того, как ваш противник первым попытался на вас навариться.  Если вы измените свою стратегию, то это потому, что ваш противник сам изменил ее, сделав две шляпы без предупреждения. Итак, чтобы не рисковать проигрышем, вы отныне и навсегда будете делать то же самое.

Если использовать только стратегии «1 шляпа» и «2 шляпы», дилемма повторяющихся заключенных будет такой же, как и однократная, но у нас также есть стратегия «я такой внезапный». Когда игрок «я такой внезапный» играет с любителем такой же или одношляпной стратегии, то они всегда делают по одной шляпе, и каждый день оба получают по 14 евро.

Всё становится сложнее, когда игрок «я такой внезапный» наталкивается на двухшляпного. В первый день он сделает одну шляпу, а во второй – две. Но далее каждый игрок будет делать по 2 шляпы каждый день. Тогда каждый получит средний выигрыш в 11 евро, так как выигрыш в первый день не имеет значения при вычислении средних над бесконечным периодом.

Игры с повторениями Математика, Стратегия, Теория игр, Книги, Популяризация, Научпоп

Согласовав полученные значения, мы переходим к матрице выигрышей, указанной на таблице. Данная таблица  – лишь малая часть общей платёжной матрицы повторяющейся дилеммы заключенных, потому что мы рассмотрели только три стратегии из счётного множества. В полной таблице мы сможем наблюдать бесконечное множество равновесий, так какое же необходимо выбрать? Или к какому сойдётся игра? На самом деле, ответ на данный вопрос получить так просто нельзя, поэтому обычно в задачах просят просто найти множество равновесий по Нэшу, или Парето-оптимум, или, опять же, ставят более явный вопрос.

Смешаные стратегии

Если матрица платежей содержит седловую точку, то существуют хорошие стратегии для обоих игроков. Для однократной игры партнёрам стоит использовать принцип минимакса вне зависимости от того, содержит ли матрица платежей седловую точку или не содержит. Этот же принцип целесообразно использовать и при многократной игре с седловой точкой.

Стратегия меняется, как только речь заходит о многократной игре без седловой точки. В этом случае постоянное повторение стратегии может привести к невыгодным результатам. Например, если мы будем играть в «камень-ножницы-бумагу» и ходить всё время только одинаково, то даже если соперник немного умственно неполноценен, успеха нам это не принесёт.

В повторяющихся играх каждая из стратегий однократной игры называется чистой стратегией.

Смешанная стратегия – это присвоение вероятности каждой чистой стратегии.

Это позволяет игроку случайным образом выбирать чистую стратегию. Поскольку вероятности непрерывны, игроку доступно бесконечно много смешанных стратегий. Интерес к смешанным стратегиям объясняется просто – если соперник определит, какая из ваших стратегий будет применяться в очередной игре, он сможет использовать эти знания для улучшения своего результата (и ухудшения вашего). Поэтому «чем случайнее, тем вернее», именно непредсказуемо случайное чередование стратегий не позволит добиться сопернику выигрыша.

Логично, что  чистые стратегии можно представить как частный случай смешанных, например, в том случае, когда частота одной из стратегий – 1, а остальных – 0.

В оптимальных смешанных стратегиях игрок, отклонившийся от своей оптимальной стратегии, изменяет средний выигрыш в невыгодную для него сторону.

Полностью смешанная стратегия – это смешанная стратегия, в которой игрок присваивает каждой чистой стратегии строго положительную вероятность.

Решение игры есть совокупность применения каждым из игроков своих оптимальных стратегий.

Цена игры – результат, достигнутый при решении игры, то есть, средний выигрыш (математическое ожидание выигрыша) при применении оптимальных стратегий обоими игроками.

Те стратегии, которые присутствуют в оптимальной стратегии игрока с ненулевыми частотами, называются полезными (другое название – активными).

В 1928 году фон Нейман доказал, что для каждой игры имеется не менее одного решения. Это решение может находится в том числе в области смешанных стратегий.

Показать полностью 1
[моё] Математика Стратегия Теория игр Книги Популяризация Научпоп
1
5
Eriright
Eriright
2 года назад
Серия Теория игр для начинающих

Повторяющиеся игры: охота на оленя⁠⁠

Как вы уже поняли, главная цель моих постов – познакомить вас с наиболее классическими задачами из теории игр, а так же понять их математику и психологию.

Охота на оленя

Рассмотрим игру «Охота на оленя». В теории игр, охота на оленя — это игра, описывающая конфликт между безопасностью и социальным сотрудничеством. Ее также называют «игра на доверие», «игра на координацию» и «дилемма уверенности».

Впервые описанная Жан-Жаком Руссо в 1755 году, данная  кооперативная симметричная игра, описывающая конфликт между личными интересами и общественными интересами, звучит так:

Если охотились на оленя, то каждый понимал, что для этого он обязан оставаться на своем посту; но если вблизи кого-либо из охотников пробегал заяц, то не приходилось сомневаться, что этот охотник без зазрения совести пустится за ним вдогонку и, настигнув добычу, весьма мало будет сокрушаться о том, что таким образом лишил добычи своих товарищей.

Каждый охотник желает знать.... что он хочет выбрать  – пойти застрелить зайца или застрелить оленя. Каждый игрок выбирает действие, не зная, как поступит второй. Если один выбирает оленя, то он должен стрелять вместе со вторым, чтобы достигнуть успеха. Если зайца человек может застрелить и в одиночку, то на оленя мощности одного выстрела уже не хватит.

Построим платежную матрицу для данной игры. Здесь мы считаем прибылью вес хорошего мяса, которое добудут охотники.

Повторяющиеся игры: охота на оленя Математика, Стратегия, Теория игр, Популяризация

«Охота на оленя» – это игра, в которой есть два равновесия – одно доминирует по риску, другое по выигрышу. Пара «Олень, Олень» доминирует по выигрышу, так как выплаты больше для обоих игроков. С другой стороны, пара «Заяц, Заяц» доминирует по риску, так как если существует неопределенность в отношении действий другого игрока, побег за зайцем обеспечит более высокую ожидаемую отдачу. Чем больше неопределенность игроков о действиях другого игрока, тем больше вероятность, что они будут выбирать аналогичную стратегию.

Мы тут ввели новые понятия доминируемости, что они значат?

Равновесие доминирует по выигрышу в игре, если оно есть Парето-улучшение всех остальных равновесий. Доминирующее равновесие при некооперативной игре даёт каждому из игроков наибольший выигрыш и поэтому каждый игрок использует именно доминирующее по выигрышу равновесие.

Бассейн притяжения равновесия – зона при наличии неопределённости относительно стратегий других участников, в которой игрок выбирает стратегию, ведущую к данному равновесию.

Равновесие, имеющее наибольший бассейн притяжения, доминирует по риску.

Эти концепции доминирования были определены Джоном Харсани и Рейнхардом Сельтеном в 1972 г.

Показать полностью 1
[моё] Математика Стратегия Теория игр Популяризация
2
Посты не найдены
О нас
О Пикабу Контакты Реклама Сообщить об ошибке Сообщить о нарушении законодательства Отзывы и предложения Новости Пикабу Мобильное приложение RSS
Информация
Помощь Кодекс Пикабу Команда Пикабу Конфиденциальность Правила соцсети О рекомендациях О компании
Наши проекты
Блоги Работа Промокоды Игры Курсы
Партнёры
Промокоды Биг Гик Промокоды Lamoda Промокоды Мвидео Промокоды Яндекс Директ Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня
На информационном ресурсе Pikabu.ru применяются рекомендательные технологии