Здравствуйте, гость Правила · Помощь

»  Теория. Алгоритм ловли мизера. Подписаться | Сообщить другу | Версия для печати
      » 17/05/2013, 11:27,  Pochemuk 
isabsent ("17/".$m["май"]."/2013," 11:08)
... = 2 + 0.5у
откуда видно, что как бы ни сносил мизерист, он получит в среднем МИНИМУМ ДВЕ ВЗЯТКИ, а если попытается чудить и сносить что-то кроме дыр, то еще и больше, так как у > 0.

Во! Уже прозвучало ...

У Вас получилось, что зная стратегию ловящих 50/50, мизерист может играть значением y так, чтобы получить наименьшее число взяток в среднем. Т.е. он будет ЭКСПЛУАТИРОВАТЬ эту их стратегию.

А теперь возьмите y=0 и посчитайте, будет ли стратегия 50/50 ловящих оптимальна? Не смогут ли они при другой своей стратегии добиться лучших результатов? Т.е., не смогут ли они в свою очередь ЭКСПЛУАТИРОВАТЬ стратегию y=0?
      » 17/05/2013, 11:52,  isabsent 
Pochemuk ("17/".$m["май"]."/2013," 11:27)
А теперь возьмите y=0 и посчитайте, будет ли стратегия 50/50 ловящих оптимальна? Не смогут ли они при другой своей стратегии добиться лучших результатов? Т.е., не смогут ли они в свою очередь ЭКСПЛУАТИРОВАТЬ стратегию y=0?

с = х(d.gif s.gif) + (1 - х)(s.gif s.gif)
h = z(10d.gif) + (1 - z)(7s.gif), где х,z из [0, 1]
h*c = -хz - (1 - х)(1 - z) + 5х(1 - z) + 5z(1 - х) = 6х + 6z - 12xz - 1
Чтобы в среднем мизерист всегда получил 2 взятки, надо выбирать равновероятно ходы в 10d.gif и 7s.gif (z = 0.5). Тогда с*h = 2 независимо от того что там и как он сносит. То есть, при стратегии ловящих z = 0.5, мизерист может менять свою стратегию (х) как угодно в пределах [0, 1], но свои две взятки на дистанции ему таки впарят. Такая стратегия ловцов и есть неэксплуатируемая - мизеристу невозможно добиться в среднем количества взяток меньше 2-х, что бы он ни делал. Если ловцы отклоняться от стратегии z = 0.5 и выберут, например, стратегию z = 1/3, то мизерист сможет её эксплуатировать - он выберет x = 0 и в среднем понизит свои взятки до 1-ой на дистанции. Значит стратегия ловцов z = 1/3 является эксплуатируемой.

Это сообщение отредактировал isabsent - 17/05/2013, 12:13
      » 17/05/2013, 11:57,  Pochemuk 
isabsent ("17/".$m["май"]."/2013," 11:15)
Хотя я так и не понял, почему Вы заведомо наделяете мизериста способностью посчитать что лучше снести в игре против рока. Вы же не знаете его квалификацию априори, если это первая игра с ним.

Во первых, пока нет сбора статистики и составления манеры игры оппонента, каждый мизер можно рассматривать, как первый единственный с ним. Так, что же? Расчитывать его исходя из неоптимальности сноса? Ну так это и будет, рано или поздно, эксплуатироваться. Не человеком, так другим автоматом.

Во вторых, недооценка противника может помочь выиграть в единичном случае, но на дистанции все равно покажет свою слабину.

И в третьих, мизерист и не обязан знать это. Лучший снос в игре против Рока существует вне зависимости от того, знает ли мизерист его или нет.

Если он его не знает, то оптимальной стратегии он выработать не сможет. А любое отклонение от оптимальной стратегии лучше ему не сделает. Ведь у ловцов стратегия неэксплуатируемая. Следовательно, никакое отклонение от оптимальной стратегии мизерящим не способно принести лучший результат. А вот худший - может. И не только за счет того, что ловящие разгадают эту неоптимальную стратегию и начнут ее эксплуатировать.

Пример: {7 8 9 10 В Д К Т}{7}{Т}{К Т}

Если мизерящий играет оптимально (сносит 2 красные), то у него есть 50% шансов уйти чистым. Если он вдруг решить сделать неоптимальный снос двух пик, то шансов у него не будет никаких даже если ловцы не будут даже предполагать, что он способен на такую глупость. Если снесет трефу и красную, то все равно повысить шансы выше 50% не сможет.

Т.е., неоптимальный снос отличается от "хитрого" тем, что "хитрый" снос способен при некоторой (неоптимальной) стратегии ловящих улучшить МО. Он эксплуатирует наиболее ходовые, но не самые лучшие их стратегии. Неоптимальный снос не сделает этого никогда. И таких неоптимальных сносов в любом мизере - львиная доля. Разве что, кроме многодырочных - там слишком много сносов естественных в т.ч. и "хитрых".
      » 17/05/2013, 12:19,  Pochemuk 
isabsent ("17/".$m["май"]."/2013," 11:52)
Pochemuk ("17/".$m["май"]."/2013," 11:27)
А теперь возьмите y=0 и посчитайте, будет ли стратегия 50/50 ловящих оптимальна? Не смогут ли они при другой своей стратегии добиться лучших результатов? Т.е., не смогут ли они в свою очередь ЭКСПЛУАТИРОВАТЬ стратегию y=0?

с = х(d.gif s.gif) + (1 - х)(s.gif s.gif)
h = z(10d.gif) + (1 - z)(7s.gif), где х,z из [0, 1]
с*h = -хz - (1 - х)(1 - z) + 5х(1 - z) + 5z(1 - х) = 6х + 6z - 12xz - 1
Чтобы в среднем мизерист всегда получил 2 взятки, надо выбирать равновероятно ходы в 10d.gif и 7s.gif (z = 0.5). Тогда с*h = 2 независимо от того что там и как он сносит. То есть, при стратегии ловящих z = 0.5, мизерист может менять свою стратегию (х) как угодно в пределах [0, 1], но свои две взятки на дистанции ему таки впарят. Такая стратегия ловцов и есть неэксплуатируемая - мизеристу невозможно добиться в среднем количества взяток меньше 2-х, что бы он ни делал.

На самом деле может быть и может "как угодно", но захочет ли? Дело в том, что не все йогурты одинаково вредны дырки ловятся с одинаковой вероятностью. Зная, что ловящие применяют стратегию 50/50, он будет применять снос той дырки, которая ловится чаще.

Ведь ситуация, когда ловятся обе дыры, не единственная. Почти так же часто будет получаться, когда ловится только бубна или третья пика.

Если мизерящий нарвется на угадайку, то шансы получить взятку у него не изменятся (стратегия 50/50 это гарантирует). Но если будет ловиться только третья пика или бубна, то он будет постоянно выигрывать такие расклады, оставляя две пики.

Задача Клейна как раз на то, что ход в 10s.gif подсказал ловящим, что надо ловить пику. Если же не учитывать это, то угадайка 50/50 дает мизерящему неплохие шансы. Так что, если не учитывать ум и сообразительность ловцов, а считать их способными только угадывать 50/50, то снос {s.gif d.gif} был бы лучшим.
      » 17/05/2013, 12:35,  isabsent 
Pochemuk ("17/".$m["май"]."/2013," 12:19)
Если мизерящий нарвется на угадайку, то шансы получить взятку у него не изменятся (стратегия 50/50 это гарантирует). Но если будет ловиться только третья пика или бубна, то он будет постоянно выигрывать такие расклады, оставляя две пики.

Но ведь алгоритм ловцов в случае когда по их раскладу ловится только d.gif или только s.gif не останется таким же как и в случае когда ловится и то и то! Если по их раскладу ловится только бубна, то только её они и будут ловить. А поймают или нет - не зависит ни от чего, кроме того снесена она или нет.
      » 17/05/2013, 12:48,  Pochemuk 
isabsent ("17/".$m["май"]."/2013," 12:35)
Но ведь алгоритм ловцов в случае когда по их раскладу ловится только d.gif или только s.gif не останется таким же как и в случае когда ловится и то и то! Если по их раскладу ловится только бубна, то только её они и будут ловить. А поймают или нет - не зависит ни от чего, кроме того снесена она или нет.

Разумеется ... Но если бубна всегда в сносе, то шансы сыграть за счет расклада повышаются. А на исход угадайки фиксированный снос влиять не будет: если ловят с вероятностями 50/50, то МО угадайки не меняется:

()
с*h = 2 независимо от того что там и как он сносит. То есть, при стратегии ловящих z = 0.5, мизерист может менять свою стратегию (х) как угодно в пределах [0, 1], но свои две взятки на дистанции ему таки впарят.


Впарят, если возникнет угадайка. Но если возникнет ситуация ловимости только одной дыры, то будет существовать снос, который будет более выигрышным.

Т.е. за счет неоптимальной стратегии ловящих, играющий может выбрать снос, дающий ему преимущество при игре против Рока и при этом не ухудшающий игру против ловящих.
      » 17/05/2013, 13:11,  isabsent 
Так какой Вы видите выход? Предположим, что по возможным раскладам, если ловится только какая-то одна из дырок, то пика ловится в 2/3 случаев, а бубна в 1/3. Вы хотите как-то изменить вероятности в угадайке в соответствии с вероятностями ловли каждой из дырок по отдельности?

Это сообщение отредактировал isabsent - 17/05/2013, 13:13
      » 17/05/2013, 13:55,  Pochemuk 
isabsent ("17/".$m["май"]."/2013," 13:11)
Так какой Вы видите выход? Предположим, что по возможным раскладам, если ловится только какая-то одна из дырок, то пика ловится в 2/3 случаев, а бубна в 1/3. Вы хотите как-то изменить вероятности в угадайке в соответствии с вероятностями ловли каждой из дырок по отдельности?

Выход я уже Вам предлагал, но он Вам не приглянулся ...

У Вас есть своя Сверхидея: научить алгоритм играть (в т.ч. ловить мизер) без всяких эвристик. Но это, IMHO, нереально.

Если не использовать эвристики, то нужно использовать моделирование и ММК. Но его надо использовать не только для ловящих, но прежде всего для мизериста, чтобы определить перспективные сносы.

Затем, используя множество перспективных сносов (в т.ч. и "хитрых" ) следует вычислить стратегии сноса и ловли, например, при помощи Итеративного метода Брауна-Робинсона или более эффективных численных методов.

Но это еще пол-беды. Надо еще проводить моделирование для стратегии перехвата (она тоже может быть смешанной) и для темной атаки (в т.ч. для блефующей - делается один снос, а атака делается более характерная для другого сноса, например, атака в 8d.gif в мизере {7 8 9 10}{7 8 9 10}{8 К}{(8 К)})

Вобщем, это задача далеко не тривиальная и очень ресурсоемкая, чтобы быть достаточно точно решенной "на лету" на мобильных устройствах.

Так что придется часть работы все же проделывать заранее: классифицировать мизера, определять вероятности ловли дыр (совместные и исключительные) и их паровозности. Создавать эмпирики для сортировки сносов на перспективные и неперспективные ... И потом, имея весь этот эмпирический и заранее обсчитанный багаж, загружать расклад в некоторый матрасчетчик, который обсчитает стратегии сноса/атаки/ловли/перехватов аналитически.

Беда только в том, что матаппарат для такого расчетчика еще не создан. Только наметки существуют. Да и трудно его создать, если нет возможности моделировать и проверять расклады при помощи ММК.

Вот почему и просили Вас, Лев, здешние теоретики сделать калькулятор, способный при помощи ММК вычислять вероятности ловли мизеров с разбивкой на количество ловимых дыр (ни одной, только одна, только вторая, ни одной, обе сразу и т.д.) и среднюю паровозность в каждом случае. Сначала бы шло накопление информации, потом классификация, а потом уже, глядишь, и определилось бы, какие критерии являются важными для расчета стратегий, а какими можно пренебречь. Вот на этой теоретической основе и строить алгоритм.

А Вы сейчас пытаетесь разработать стратегии ловящих, не понимая, что они могут сильно зависеть от вероятностей ловли каждой дыры в отдельности и всех сразу. И не могут быть заданы заранее жестко ... Ни в виде чистых стратегий, ни в виде равновероятных смешанных.

Это сообщение отредактировал Pochemuk - 17/05/2013, 14:12
      » 17/05/2013, 14:50,  Pochemuk 
Послушайте, Лев ... Мне вот в голову пришла вот какая глупость:

На самом деле Ваш алгоритм мог решить задачу Клейна №2 ... Только сам не понял это.

Помните, я просил Вас проанализировать мизер Кери с Преф-Ревю, и алгоритм правильно определил правильную атаку втемную?

Так вот, предположим блефа на атаке нет (скорее всего, это так в 99,999% случаев). Тогда атака в 10s.gif действительно должна быть лучшая для данного сноса.
всего-то надо было рассмотреть все варианты сносов (перспективных, разумеется) и выбрать из них те, для которых атака в 10s.gif является оптимальной или почти оптимальной. А потом рассматривать только эти варианты. Возможно, что шансы ловить пику сушественно бы выросли. Может быть даже до чистой стратегии.
      » 17/05/2013, 14:55,  isabsent 
Pochemuk ("17/".$m["май"]."/2013," 14:50)
Послушайте, Лев ... Мне вот в голову пришла вот какая глупость:

На самом деле Ваш алгоритм мог решить задачу Клейна №2 ... Только сам не понял это.

Помните, я просил Вас проанализировать мизер Кери с Преф-Ревю, и алгоритм правильно определил правильную атаку втемную?

Так вот, предположим блефа на атаке нет (скорее всего, это так в 99,999% случаев). Тогда атака в 10s.gif действительно должна быть лучшая для данного сноса.
всего-то надо было рассмотреть все варианты сносов (перспективных, разумеется) и выбрать из них те, для которых атака в 10s.gif является оптимальной или почти оптимальной. А потом рассматривать только эти варианты. Возможно, что шансы ловить пику сушественно бы выросли. Может быть даже до чистой стратегии.

Да, но тогда мы снова неявно подразумеваем, что мизерист всё точно в состоянии рассчитать (не хуже алгоритма) и что он не собирается первым ходом вводить нас в заблуждение. Чем это лучше "Марьяжа", снос которого всегда предсказуем, если противник умеет считать вероятность ловли имеющихся у "Марьяжа" дырок? Поняв способ, которым алгоритм определяет "оптимальные или почти оптимальные сносы" - по первому ходу и в предположении отсутствия блефа - человек снесет наоборот и никогда не будет пойман.

P.S. До указанного Вами способа действий мы дообсуждались, когда аналогичные вопросы я задавал в случае распасов.

Это сообщение отредактировал isabsent - 17/05/2013, 15:15
« Предыдущая тема | Перечень тем | Следующая тема »
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей)
0 Пользователей: