Здравствуйте, гость Правила · Помощь

»  Теория. Алгоритм ловли мизера. Подписаться | Сообщить другу | Версия для печати
      » 17/05/2013, 00:43,  extasy 
isabsent ("17/".$m["май"]."/2013," 00:31)
extasy ("17/".$m["май"]."/2013," 00:26)
Можете описать это "видение" в алгоритмическом смысле?

Да что же тут описывать? Создаете 12 раскладов со всеми возможными к данному моменту сносами и считаете на открытых картах сколько Вы дадите мизеристу взяток на каждом из них, если пойдёте с Qs.gif. Получаете, что в 3-х раскладах он уходит чистым.

На руке 5карт и 2 неизвестных, это 7 карт. Нужно выбрать 2 карты из 7 - это С(2,7) = 21 возможный снос.
А как понять 12 раскладов? Какие то снысы сразу отбрасываются?

--------------------
the elephant has you..
      » 17/05/2013, 00:52,  isabsent 
extasy ("17/".$m["май"]."/2013," 00:43)
На руке 5карт и 2 неизвестных, это 7 карт. Нужно выбрать 2 карты из 7 - это С(2,7) = 21 возможный снос.
А как понять 12 раскладов? Какие то снысы сразу отбрасываются?

Не рассматриваются эквивалентные сносы. Например, если уже учтен снос ♦J,♥Q, то снос ♦J,♥7 учитывать смысла нет, так как все черви между ♥Q и ♥7 к 6-ой взятке уже отыграны и ничего нового этот снос не даст. Картина розыгрыша с ним будет полностью эквивалентна розыгрышу со сносом ♦J,♥Q (если смотреть с 6-ой взятки).
      » 17/05/2013, 00:57,  isabsent 
Обнаружил неточность - ход с 10d.gif на 6-ой взятке даёт возможность мизеристу уйти чистым при 2-х раскладах из 12-и, а не при 1-ом как я писал раньше...
      » 17/05/2013, 01:00,  extasy 
isabsent ("17/".$m["май"]."/2013," 00:57)
Обнаружил неточность - ход с 10d.gif на 6-ой взятке даёт возможность мизеристу уйти чистым при 2-х раскладах из 12-и, а не при 1-ом как я писал раньше...

Хорошо, Д7 = 3 расклада чистый.
А что можно сказать про ход мелкая бубна и про ход низ пик?
Сколько раскладов и анализ количества взяток на каждом раскладе?

--------------------
the elephant has you..
      » 17/05/2013, 01:11,  isabsent 
extasy ("17/".$m["май"]."/2013," 01:00)
isabsent ("17/".$m["май"]."/2013," 00:57)
Обнаружил неточность - ход с 10d.gif на 6-ой взятке даёт возможность мизеристу уйти чистым при 2-х раскладах из 12-и,  а не при 1-ом как я писал раньше...

Хорошо, Д7 = 3 расклада чистый.
А что можно сказать про ход мелкая бубна и про ход низ пик?
Сколько раскладов и анализ количества взяток на каждом раскладе?

10d.gif - два расклада уходят чистыми
7s.gif - один расклад чистый
"Паровозность" на 10d.gif примерно на 10% выше, чем на 7s.gif
      » 17/05/2013, 01:17,  extasy 
isabsent ("17/".$m["май"]."/2013," 01:11)
extasy ("17/".$m["май"]."/2013," 01:00)
isabsent ("17/".$m["май"]."/2013," 00:57)
Обнаружил неточность - ход с 10d.gif на 6-ой взятке даёт возможность мизеристу уйти чистым при 2-х раскладах из 12-и,  а не при 1-ом как я писал раньше...

Хорошо, Д7 = 3 расклада чистый.
А что можно сказать про ход мелкая бубна и про ход низ пик?
Сколько раскладов и анализ количества взяток на каждом раскладе?

10d.gif - два расклада уходят чистыми
7s.gif - один расклад чистый
"Паровозность" на 10d.gif примерно на 10% выше, чем на 7s.gif

Вот! То, что надо.
Теперь подумаю, как обьяснить почему это не работает нужным образом и что конкретно предложить. Видимо, уже не сегодня.

--------------------
the elephant has you..
      » 17/05/2013, 10:16,  Pochemuk 
isabsent ("16/".$m["май"]."/2013," 22:51)
А как эксплуатировать стратегию ловящих, которую я применил для ловли в обсуждаемой выше 2-ой задаче Клейна? Как должен был снести мизерист, если бы предполагал, что они будут угадывать 50/50 на 6-ой взятке?

Очень просто: мизерящему следовало бы в этом случае придерживаться чистой стратегии: оставлять всегда менее ловимую дыру. И ловящие не могут это использовать себе во благо. Ведь они не интересуются стратегией сноса мизерящего, а тупо используют всегда стратегию 50/50.

Вы, Лев, наверное не осознали всю прелесть введения в игру такого персонажа, как Рок, и не поняли, что дает рассмотрение его в качестве третьей неразумной, но активной силы.

Попробую еще раз ...

По сути, выбор сноса является игрой против двух персонажей: Слепого Рока и ловящих. Рассмотрим ситуации, которые могут получиться в результате выбора того или иного сноса на упрощенном примере двухвариантного сноса:

1. Не ловится ни одна дыра (вероятность P0). Тут никакой игры нет, от сноса ничего не зависит.
2. Слепой Рок подсовывает нам расклад рук ловящих, при котором ловится только одна дыра (вероятности P1+P2). Эту дыру и будут ловить. Если мизерящий ее оставил - получит взятки. Исходя из этого, мизерящий должен всегда оставлять дыру с наименьшей вероятностью ловли.
3. Слепой Рок решил развлечься и подсунул расклад рук, при котором ловятся обе дыры. В этом случае играть приходится против ловящих. И снос должен быть таким, чтобы их запутать в наибольшей степени.
Предполагая, что ловящие не совсем тупые и могут в конце концов раскусить нашу стратегию, она должна быть такая, чтобы они не могли ее эксплуатировать. И это стратегия сносов 50/50. Любая другая стратегия будет эксплуатируемой.

Только всё дело в том, что описанные события происходят с разными вероятностями. И при некоторых вероятностях главенствует игра против Рока (чистая стратегия), а в некоторых - против ловцов.

А теперь рассмотрим такую ситуацию:

Имея некоторую руку с двухвариантным сносом мизерящему выгоднее играть против ловцов (обе дырки одновременно ловятся часто, либо игра против Рока почти равнозначна, но не совсем). И он придерживается стратегии 50/50.
И тут (партий через 100 или 1000) он замечает, что ловцы тупо тоже придерживаются такой стратегии. Что это значит? А то, что ловят они его (при условии угадаечных раскладов) - ровно в 50% случаев!
А что будет, если он сменит стратегию на чистую - будет оставлять всегда дыру с наименьшей вероятностью ловли? Да в игре против ловящих ничего не изменится - они же свою стратегию 50/50 не меняют, поэтому продолжают ловить нас в 50% случаев. Зато теперь мизерящий начинает больше выигрывать у Рока! - чаще получается, что снесена единственная ловящаяся дырка.

Таким образом, стратегия ловли 50/50 является эксплуатируемой точно так же, как и чистые стратегии "Марьяжа". С небольшими отличиями:

1. Неискушенный игрок не так быстро обнаружит стратегию 50/50, как чистую.
2. Переход на оптимальную чистую стратегию сноса даст в этом случае не такое большое преимущество, как в "Марьяже". Но тоже даст.

Что же делать ловящим, если и чистая стратегия и стратегия 50/50 являются эксплуатируемыми? Использовать некоторую другую смешанную стратегию! Конкретные цифры (так же как и само существование такой смешанной стратегии) зависят от вероятностей ловли дырок (обеих сразу и каждой по отдельности). Но такая стратегия в большинстве случаев существует и является неэксплуатируемой.

В этой своей оптимальной стратегии ловящие прии угадайке должны ловить редколовимую дыру несколько чаще. Мизерящему при этом не выгодно переходить ни на одну чистую стратегию. Либо ловящие его будут чаще ловить в угадайке, либо Рок будет подсовывать чаще расклады с единственной ловимой оставленной дырой. Мизерящий вынужден будет придерживаться своей смешанной стратегии.

Все сказанное верно только для класса мизеров без перехватов (нет или нецелесообразны) и практически одинаковой паровозности обоих дыр. Если дыр больше 2-х, возможны перехваты и сильные перекосы в длинах паровозов, то всё это может стать не верным. Но я эти ситуации до конца не рассматривал.

А выкладки я не привожу по простой причине: писанины много, формулы громоздкие, а вместе с тем идея простая - повторить их может любой, владеющий четырьмя действиями арифметики и зачатками познаний в теории игр. Может быть когда-то соберусь и тисну статью на Преф-ревю. Там хотя бы Главбух формулы может покрасивше помочь причесать.
      » 17/05/2013, 10:37,  Pochemuk 
isabsent ("16/".$m["май"]."/2013," 22:58)
То есть Вы хотите строить алгоритм ловли как ответ на "оптимальный" алгоритм сноса? А если мизерист все время сносит неоптимально, а Ваш алгоритм ловли все время пытается его поймать полагая, что он сносит оптимально, поэтому каждый раз выпускает мизериста чистым, то как же такой мизерист проиграет на дистанции?

Здесь противоречие!!!

Если ловящие придерживаются своей оптимальной стратегии, а мизерящий, сменив собственную стратегию на неоптимальную, начинает выигрывать больше (эксплуатировать стратегию ловящих), значит стратегия ловящих является эксплуатируемой. И, следовательно, быть глобально оптимальной никак не может. Она может быть только "локально" оптимальной с учетом манеры игры мизериста.

В том то и свойство оптимальной стратегии автомата, что никакой продвинутый игрок не сможет, сменив собственную стратегию, добиться преимущества. Более того, он рискует, что собственное отступление от оптимальности будет раскушено. Но это уже следующий шаг.

Пока что следует сделать именно за каждую сторону собственные неэксплуатируемые стратегии. И это в большинстве случаев будут не простые стрпатегии, вроде чистых или 50/50. Во всяком случае, для ловцов. Для мизерящего при возможности перехватов - там вообще все запутано. Ведь отказ от перехвата может быть тоже блефом. Особенно при разной фактической паровозности дыр.

()
А по существу - если он всегда будет сносить как попало, а ловцы будут всегда считать, что он сносит оптимально, то это еще очень большой вопрос выиграют ли они его на дистанции. После 10-го выпуска мизериста чистым они должны перестать ловить его исходя из оптимальности сноса и начать полагать что он может сделать любой снос.


Такого просто быть не может ... Если снос "как попало" способен принести дивиденды, значит, стратегия ловящих изначально была заложена неправильно: она была эксплуатируемой и неоптимальной.

Это сообщение отредактировал Pochemuk - 17/05/2013, 10:46
      » 17/05/2013, 11:08,  isabsent 
extasy ("17/".$m["май"]."/2013," 01:17)
Теперь подумаю, как обьяснить почему это не работает нужным образом и что конкретно предложить.

Вроде всё работает как и должно если ходить 50/50 в 10d.gif или 7s.gif.
Рассмотрим возможный снос мизериста с, который с вероятностью х состоит из d.gif s.gif, с вероятностью у состоит из d.gif h.gif и с вероятностью (1 - х - у) состоит из s.gif s.gif
с = х(d.gif s.gif) + у(d.gif h.gif) + (1 - х - у)(s.gif s.gif), где х,у из [0, 1]
и ход второго защитника - равновероятно в 10d.gif или 7s.gif
h = 0.5(10d.gif) + 0.5(7s.gif)

Результатом хода в 10d.gif при сносе d.gif s.gif - обозначим его как (10d.gif)*(d.gif s.gif) - будет пронос оставшейся пики и чистый мизер - то есть -1 взятка мизеристу.
(10d.gif)*(d.gif s.gif) = -1
Результатом хода в 10d.gif при сносе d.gif h.gif будет пронос одной из s.gif, после чего защитник поймет, что есть еще пика и ходом 7s.gif даст мизеристу паровоз на 4 взятки
(10d.gif)*(d.gif h.gif) = 4
Аналогично
(10d.gif)*(s.gif s.gif) = 5
(7s.gif)*(d.gif s.gif) = 5
(7s.gif)*(d.gif h.gif) = 1
(7s.gif)*(s.gif s.gif) = -1
Поэтому для среднего числа взяток при равновероятном ходе h и некотором сносе с получаем :
h*c = -0.5х + 2у + 2.5(1 - х - у) + 2.5х + 0.5у - 0.5(1 - х - у) = 2(1 - х - у) + 2х + 2.5у = 2 + 0.5у
откуда видно, что как бы ни сносил мизерист, он получит в среднем МИНИМУМ ДВЕ ВЗЯТКИ, а если попытается чудить и сносить что-то кроме дыр, то еще и больше, так как у > 0.

Это сообщение отредактировал isabsent - 17/05/2013, 11:54
      » 17/05/2013, 11:15,  isabsent 
Pochemuk ("17/".$m["май"]."/2013," 10:16)
Попробую еще раз ...

Обдумаю еще раз...
Хотя я так и не понял, почему Вы заведомо наделяете мизериста способностью посчитать что лучше снести в игре против рока. Вы же не знаете его квалификацию априори, если это первая игра с ним.

Это сообщение отредактировал isabsent - 17/05/2013, 11:20
« Предыдущая тема | Перечень тем | Следующая тема »
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)
0 Пользователей: