Преферанс -> Теория. Алгоритм ловли мизера. -> 381-390. Форумы клуба Гамблер

» 17/05/2013, 11:27, Pochemuk

isabsent ("17/".$m["май"]."/2013," 11:08)

... = 2 + 0.5у
откуда видно, что как бы ни сносил мизерист, он получит в среднем МИНИМУМ ДВЕ ВЗЯТКИ, а если попытается чудить и сносить что-то кроме дыр, то еще и больше, так как у > 0.

Во! Уже прозвучало ...

У Вас получилось, что зная стратегию ловящих 50/50, мизерист может играть значением y так, чтобы получить наименьшее число взяток в среднем. Т.е. он будет ЭКСПЛУАТИРОВАТЬ эту их стратегию.

А теперь возьмите y=0 и посчитайте, будет ли стратегия 50/50 ловящих оптимальна? Не смогут ли они при другой своей стратегии добиться лучших результатов? Т.е., не смогут ли они в свою очередь ЭКСПЛУАТИРОВАТЬ стратегию y=0?

» 17/05/2013, 11:52, isabsent

Pochemuk ("17/".$m["май"]."/2013," 11:27)

А теперь возьмите y=0 и посчитайте, будет ли стратегия 50/50 ловящих оптимальна? Не смогут ли они при другой своей стратегии добиться лучших результатов? Т.е., не смогут ли они в свою очередь ЭКСПЛУАТИРОВАТЬ стратегию y=0?

с = х(

) + (1 - х)(

)
h = z(10

) + (1 - z)(7

), где х,z из [0, 1]
h*c = -хz - (1 - х)(1 - z) + 5х(1 - z) + 5z(1 - х) = 6х + 6z - 12xz - 1
Чтобы в среднем мизерист всегда получил 2 взятки, надо выбирать равновероятно ходы в 10

и 7

(z = 0.5). Тогда с*h = 2 независимо от того что там и как он сносит. То есть, при стратегии ловящих z = 0.5, мизерист может менять свою стратегию (х) как угодно в пределах [0, 1], но свои две взятки на дистанции ему таки впарят. Такая стратегия ловцов и есть неэксплуатируемая - мизеристу невозможно добиться в среднем количества взяток меньше 2-х, что бы он ни делал. Если ловцы отклоняться от стратегии z = 0.5 и выберут, например, стратегию z = 1/3, то мизерист сможет её эксплуатировать - он выберет x = 0 и в среднем понизит свои взятки до 1-ой на дистанции. Значит стратегия ловцов z = 1/3 является эксплуатируемой.

Это сообщение отредактировал isabsent - 17/05/2013, 12:13

» 17/05/2013, 11:57, Pochemuk

isabsent ("17/".$m["май"]."/2013," 11:15)

Хотя я так и не понял, почему Вы заведомо наделяете мизериста способностью посчитать что лучше снести в игре против рока. Вы же не знаете его квалификацию априори, если это первая игра с ним.

Во первых, пока нет сбора статистики и составления манеры игры оппонента, каждый мизер можно рассматривать, как первый единственный с ним. Так, что же? Расчитывать его исходя из неоптимальности сноса? Ну так это и будет, рано или поздно, эксплуатироваться. Не человеком, так другим автоматом.

Во вторых, недооценка противника может помочь выиграть в единичном случае, но на дистанции все равно покажет свою слабину.

И в третьих, мизерист и не обязан знать это. Лучший снос в игре против Рока существует вне зависимости от того, знает ли мизерист его или нет.

Если он его не знает, то оптимальной стратегии он выработать не сможет. А любое отклонение от оптимальной стратегии лучше ему не сделает. Ведь у ловцов стратегия неэксплуатируемая. Следовательно, никакое отклонение от оптимальной стратегии мизерящим не способно принести лучший результат. А вот худший - может. И не только за счет того, что ловящие разгадают эту неоптимальную стратегию и начнут ее эксплуатировать.

Пример: {7 8 9 10 В Д К Т}{7}{Т}{К Т}

Если мизерящий играет оптимально (сносит 2 красные), то у него есть 50% шансов уйти чистым. Если он вдруг решить сделать неоптимальный снос двух пик, то шансов у него не будет никаких даже если ловцы не будут даже предполагать, что он способен на такую глупость. Если снесет трефу и красную, то все равно повысить шансы выше 50% не сможет.

Т.е., неоптимальный снос отличается от "хитрого" тем, что "хитрый" снос способен при некоторой (неоптимальной) стратегии ловящих улучшить МО. Он эксплуатирует наиболее ходовые, но не самые лучшие их стратегии. Неоптимальный снос не сделает этого никогда. И таких неоптимальных сносов в любом мизере - львиная доля. Разве что, кроме многодырочных - там слишком много сносов естественных в т.ч. и "хитрых".

» 17/05/2013, 12:19, Pochemuk

isabsent ("17/".$m["май"]."/2013," 11:52)

Pochemuk ("17/".$m["май"]."/2013," 11:27)

А теперь возьмите y=0 и посчитайте, будет ли стратегия 50/50 ловящих оптимальна? Не смогут ли они при другой своей стратегии добиться лучших результатов? Т.е., не смогут ли они в свою очередь ЭКСПЛУАТИРОВАТЬ стратегию y=0?

с = х(

) + (1 - х)(

)
h = z(10

) + (1 - z)(7

), где х,z из [0, 1]
с*h = -хz - (1 - х)(1 - z) + 5х(1 - z) + 5z(1 - х) = 6х + 6z - 12xz - 1
Чтобы в среднем мизерист всегда получил 2 взятки, надо выбирать равновероятно ходы в 10

и 7

(z = 0.5). Тогда с*h = 2 независимо от того что там и как он сносит. То есть, при стратегии ловящих z = 0.5, мизерист может менять свою стратегию (х) как угодно в пределах [0, 1], но свои две взятки на дистанции ему таки впарят. Такая стратегия ловцов и есть неэксплуатируемая - мизеристу невозможно добиться в среднем количества взяток меньше 2-х, что бы он ни делал.

На самом деле может быть и может "как угодно", но захочет ли? Дело в том, что не все ~~йогурты одинаково вредны~~ дырки ловятся с одинаковой вероятностью. Зная, что ловящие применяют стратегию 50/50, он будет применять снос той дырки, которая ловится чаще.

Ведь ситуация, когда ловятся обе дыры, не единственная. Почти так же часто будет получаться, когда ловится только бубна или третья пика.

Если мизерящий нарвется на угадайку, то шансы получить взятку у него не изменятся (стратегия 50/50 это гарантирует). Но если будет ловиться только третья пика или бубна, то он будет постоянно выигрывать такие расклады, оставляя две пики.

Задача Клейна как раз на то, что ход в 10

подсказал ловящим, что надо ловить пику. Если же не учитывать это, то угадайка 50/50 дает мизерящему неплохие шансы. Так что, если не учитывать ум и сообразительность ловцов, а считать их способными только угадывать 50/50, то снос {

} был бы лучшим.

» 17/05/2013, 12:35, isabsent

Pochemuk ("17/".$m["май"]."/2013," 12:19)

Если мизерящий нарвется на угадайку, то шансы получить взятку у него не изменятся (стратегия 50/50 это гарантирует). Но если будет ловиться только третья пика или бубна, то он будет постоянно выигрывать такие расклады, оставляя две пики.

Но ведь алгоритм ловцов в случае когда по их раскладу ловится только

или только

не останется таким же как и в случае когда ловится и то и то! Если по их раскладу ловится только бубна, то только её они и будут ловить. А поймают или нет - не зависит ни от чего, кроме того снесена она или нет.

» 17/05/2013, 12:48, Pochemuk

isabsent ("17/".$m["май"]."/2013," 12:35)

Но ведь алгоритм ловцов в случае когда по их раскладу ловится только

или только

не останется таким же как и в случае когда ловится и то и то! Если по их раскладу ловится только бубна, то только её они и будут ловить. А поймают или нет - не зависит ни от чего, кроме того снесена она или нет.

Разумеется ... Но если бубна всегда в сносе, то шансы сыграть за счет расклада повышаются. А на исход угадайки фиксированный снос влиять не будет: если ловят с вероятностями 50/50, то МО угадайки не меняется:

()

с*h = 2 независимо от того что там и как он сносит. То есть, при стратегии ловящих z = 0.5, мизерист может менять свою стратегию (х) как угодно в пределах [0, 1], но свои две взятки на дистанции ему таки впарят.

Впарят, если возникнет угадайка. Но если возникнет ситуация ловимости только одной дыры, то будет существовать снос, который будет более выигрышным.

Т.е. за счет неоптимальной стратегии ловящих, играющий может выбрать снос, дающий ему преимущество при игре против Рока и при этом не ухудшающий игру против ловящих.

» 17/05/2013, 13:11, isabsent

Так какой Вы видите выход? Предположим, что по возможным раскладам, если ловится только какая-то одна из дырок, то пика ловится в 2/3 случаев, а бубна в 1/3. Вы хотите как-то изменить вероятности в угадайке в соответствии с вероятностями ловли каждой из дырок по отдельности?

Это сообщение отредактировал isabsent - 17/05/2013, 13:13

» 17/05/2013, 13:55, Pochemuk

isabsent ("17/".$m["май"]."/2013," 13:11)

Так какой Вы видите выход? Предположим, что по возможным раскладам, если ловится только какая-то одна из дырок, то пика ловится в 2/3 случаев, а бубна в 1/3. Вы хотите как-то изменить вероятности в угадайке в соответствии с вероятностями ловли каждой из дырок по отдельности?

Выход я уже Вам предлагал, но он Вам не приглянулся ...

У Вас есть своя Сверхидея: научить алгоритм играть (в т.ч. ловить мизер) без всяких эвристик. Но это, IMHO, нереально.

Если не использовать эвристики, то нужно использовать моделирование и ММК. Но его надо использовать не только для ловящих, но прежде всего для мизериста, чтобы определить перспективные сносы.

Затем, используя множество перспективных сносов (в т.ч. и "хитрых" ) следует вычислить стратегии сноса и ловли, например, при помощи Итеративного метода Брауна-Робинсона или более эффективных численных методов.

Но это еще пол-беды. Надо еще проводить моделирование для стратегии перехвата (она тоже может быть смешанной) и для темной атаки (в т.ч. для блефующей - делается один снос, а атака делается более характерная для другого сноса, например, атака в 8

в мизере {7 8 9 10}{7 8 9 10}{8 К}{(8 К)})

Вобщем, это задача далеко не тривиальная и очень ресурсоемкая, чтобы быть достаточно точно решенной "на лету" на мобильных устройствах.

Так что придется часть работы все же проделывать заранее: классифицировать мизера, определять вероятности ловли дыр (совместные и исключительные) и их паровозности. Создавать эмпирики для сортировки сносов на перспективные и неперспективные ... И потом, имея весь этот эмпирический и заранее обсчитанный багаж, загружать расклад в некоторый матрасчетчик, который обсчитает стратегии сноса/атаки/ловли/перехватов аналитически.

Беда только в том, что матаппарат для такого расчетчика еще не создан. Только наметки существуют. Да и трудно его создать, если нет возможности моделировать и проверять расклады при помощи ММК.

Вот почему и просили Вас, Лев, здешние теоретики сделать калькулятор, способный при помощи ММК вычислять вероятности ловли мизеров с разбивкой на количество ловимых дыр (ни одной, только одна, только вторая, ни одной, обе сразу и т.д.) и среднюю паровозность в каждом случае. Сначала бы шло накопление информации, потом классификация, а потом уже, глядишь, и определилось бы, какие критерии являются важными для расчета стратегий, а какими можно пренебречь. Вот на этой теоретической основе и строить алгоритм.

А Вы сейчас пытаетесь разработать стратегии ловящих, не понимая, что они могут сильно зависеть от вероятностей ловли каждой дыры в отдельности и всех сразу. И не могут быть заданы заранее жестко ... Ни в виде чистых стратегий, ни в виде равновероятных смешанных.

Это сообщение отредактировал Pochemuk - 17/05/2013, 14:12

» 17/05/2013, 14:50, Pochemuk

Послушайте, Лев ... Мне вот в голову пришла вот какая глупость:

На самом деле Ваш алгоритм мог решить задачу Клейна №2 ... Только сам не понял это.

Помните, я просил Вас проанализировать мизер Кери с Преф-Ревю, и алгоритм правильно определил правильную атаку втемную?

Так вот, предположим блефа на атаке нет (скорее всего, это так в 99,999% случаев). Тогда атака в 10

действительно должна быть лучшая для данного сноса.
всего-то надо было рассмотреть все варианты сносов (перспективных, разумеется) и выбрать из них те, для которых атака в 10

является оптимальной или почти оптимальной. А потом рассматривать только эти варианты. Возможно, что шансы ловить пику сушественно бы выросли. Может быть даже до чистой стратегии.

» 17/05/2013, 14:55, isabsent

Pochemuk ("17/".$m["май"]."/2013," 14:50)

Послушайте, Лев ... Мне вот в голову пришла вот какая глупость:

На самом деле Ваш алгоритм мог решить задачу Клейна №2 ... Только сам не понял это.

Помните, я просил Вас проанализировать мизер Кери с Преф-Ревю, и алгоритм правильно определил правильную атаку втемную?

Так вот, предположим блефа на атаке нет (скорее всего, это так в 99,999% случаев). Тогда атака в 10

действительно должна быть лучшая для данного сноса.
всего-то надо было рассмотреть все варианты сносов (перспективных, разумеется) и выбрать из них те, для которых атака в 10

является оптимальной или почти оптимальной. А потом рассматривать только эти варианты. Возможно, что шансы ловить пику сушественно бы выросли. Может быть даже до чистой стратегии.

Да, но тогда мы снова неявно подразумеваем, что мизерист всё точно в состоянии рассчитать (не хуже алгоритма) и что он не собирается первым ходом вводить нас в заблуждение. Чем это лучше "Марьяжа", снос которого всегда предсказуем, если противник умеет считать вероятность ловли имеющихся у "Марьяжа" дырок? Поняв способ, которым алгоритм определяет "оптимальные или почти оптимальные сносы" - по первому ходу и в предположении отсутствия блефа - человек снесет наоборот и никогда не будет пойман.

P.S. До указанного Вами способа действий мы дообсуждались, когда аналогичные вопросы я задавал в случае распасов.

Это сообщение отредактировал isabsent - 17/05/2013, 15:15