Здравствуйте, гость Правила · Помощь

»  Теория. Алгоритм ловли мизера. Подписаться | Сообщить другу | Версия для печати
      » 14/04/2013, 18:07,  isabsent 
Вадим_Я ("14/".$m["апр"]."/2013," 18:04)
Да, о вистах. Про подпись в курсе.

Мне бы пока сделать так, чтобы он со взятками не косячил. А потом уже буду с вистами разбираться... Их оптимизация еще и от типа игры зависит - Питер, Сочи, Ростов и что там еще? Или для мизеров это всё равно?

Это сообщение отредактировал isabsent - 14/04/2013, 18:08
      » 14/04/2013, 18:17,  Вадим_Я 
Для мизеров всё равно, если речь о гладких конвенциях. А вот распасах есть нюансы, в сочи ноль не так нажорист как в питер.
      » 14/04/2013, 18:28,  isabsent 
Вадим_Я ("14/".$m["апр"]."/2013," 18:17)
Для мизеров всё равно, если речь о гладких конвенциях. А вот распасах есть нюансы, в сочи ноль не так нажорист как в питер.

А что такое "гладкие конвенции"?
      » 14/04/2013, 19:11,  Вадим_Я 
Гладкие = обычный преферанс: Сочи, Питер, Ростов
Не "гладкие": разбойник (заказной преферанс), скачки (игра с призами)
      » 15/04/2013, 07:54,  Pochemuk 
isabsent ("14/".$m["апр"]."/2013," 18:07)
Мне бы пока сделать так, чтобы он со взятками не косячил. А потом уже буду с вистами разбираться... Их оптимизация еще и от типа игры зависит - Питер, Сочи, Ростов и что там еще? Или для мизеров это всё равно?

Тут вопрос не о вистах, как раз, а именно о количестве взяток:

Одна взятка на мизере - это некоторый проигрыш L. Можем принять нормализованную величину L=1, т.е. считать проигрыш не в вистах, а именно в взятках.

Две взятки - проигрыш 2L.
Три - 3L. И т.д.

А вот 0 взяток, это не проигрыш 0L, а выигрыш 1L ...

Таким образом, равновероятностная угадайка на 0/1 взятки эквивалентна, в среднем, не 0,5 взяткам, а (1-1)/2=0.

В рассмотренном же примере с вероятностями 0,6/0,3/0,1 получим приведенное к-во взяток не 0,6*0+0,3*1+0,1*2=0,5, а 0,3*1+0,1*2-0,6*1=-0,1 взяток проигрыша или 0,1 взятки выигрыша.

Удобнее, IMHO, считать именно в выигрышах, а не в проигрышах, приняв за 1 выигрышь от чистого мизера. Тогда в случае взятия взяток выигрыш будет -1, -2, -3 и т.д.

И никакой привязки к вистам. Всё будет инвариантно к количеству игроков, конвенциям и т.д. А целесообразность того или иного выбора уже решается отдельно в зависимости от насущных задач. В одном случае бывает выгоднее дать одну верную вместо угадайки 5/0, а в другом - рискнуть ею в надежде дать всего лишь 2.

Вобщем, резюмтрую, считать в вистах не нужно. Нужно считать по прежнему во взятках, но немного по другому.
      » 15/04/2013, 08:04,  isabsent 
Pochemuk ("15/".$m["апр"]."/2013," 07:54)
isabsent ("14/".$m["апр"]."/2013," 18:07)
Мне бы пока сделать так, чтобы он со взятками не косячил. А потом уже буду с вистами разбираться... Их оптимизация еще и от типа игры зависит - Питер, Сочи, Ростов и что там еще? Или для мизеров это всё равно?

Тут вопрос не о вистах, как раз, а именно о количестве взяток:

Одна взятка на мизере - это некоторый проигрыш L. Можем принять нормализованную величину L=1, т.е. считать проигрыш не в вистах, а именно в взятках.

Две взятки - проигрыш 2L.
Три - 3L. И т.д.

А вот 0 взяток, это не проигрыш 0L, а выигрыш 1L ...

Таким образом, равновероятностная угадайка на 0/1 взятки эквивалентна, в среднем, не 0,5 взяткам, а (1-1)/2=0.

В рассмотренном же примере с вероятностями 0,6/0,3/0,1 получим приведенное к-во взяток не 0,6*0+0,3*1+0,1*2=0,5, а 0,3*1+0,1*2-0,6*1=-0,1 взяток проигрыша или 0,1 взятки выигрыша.

Удобнее, IMHO, считать именно в выигрышах, а не в проигрышах, приняв за 1 выигрышь от чистого мизера. Тогда в случае взятия взяток выигрыш будет -1, -2, -3 и т.д.

И никакой привязки к вистам. Всё будет инвариантно к количеству игроков, конвенциям и т.д. А целесообразность того или иного выбора уже решается отдельно в зависимости от насущных задач. В одном случае бывает выгоднее дать одну верную вместо угадайки 5/0, а в другом - рискнуть ею в надежде дать всего лишь 2.

Вобщем, резюмтрую, считать в вистах не нужно. Нужно считать по прежнему во взятках, но немного по другому.

Принимается! После того как найду все баги - перепишу с учетом этих поправок.
      » 15/04/2013, 10:33,  Pochemuk 
Кстати, алгорит предполагает, что мизерящий добровольно отказывается от перехвата и всегда идет на угадайку, сколько бы взяток в коллективе ему не грозило?

Не сказал бы, что этот подход полностью верный, но может рассматриваться, как частный случай, т.е. как один из вариантов стратегии мизерящего.

На самом деле процесс розыгрыша угадаечного мизера нужно рассматривать, как некооперативную игру более, чем двух игроков. Поясню на несколько упрощенном примере ...

Мы сели за пульку с судьбою,
А третьим пристроился рок.
(С) А. Иванов (?)

1. Игрок принимает решение объявить мизер.

2. Допустим, никто не перебивает.

3. Игрок берет прикуп и на основе каких-то критериев выбирает снос, руководствуясь чистой или смешанной стратегией. Причем, в одних случаях стратегия может быть чистой и угадайки не будет (если она тоже известна ловцам), а в других - смешанной с возможностью угадайки.

4. Кому принадлежит следующий ход? Ловцам? Как бы не так!!! Он принадлежит Року. Дело в том, что на самом деле играется не один мизер, а как бы 4 семейства мизеров с той или иной вероятностью каждое:
4.0. Мизер раскладно чистый.
4.1. Ловится только первая дырка.
4.2. Ловится только вторая дырка.
4.12. Ловятся обе дырки. Причем, число взяток в коллективах может различаться: n1 и n2.
Мизера с большим числом дырок пока не рассматриваем.
И, кстати, выбирая снос, игрок ориентируется в т.ч. на вероятности ловли каждой дырки по отдельности и вместе и на среднюю паровозность каждой. А вот ход Рока заключается в том, что он с определенной вероятностью объявляет, какое именно семейство раскладов из четырех перечисленных будет играться. А в последнем случае так же длины потенциальных паровозов.

5. Вот только теперь ход переходит ловцам. Они выясняют, какое семейство раскладов им попалось и начинают строить игру исходя от этого: бросают карты, ловят единственную ловящуюся дырку или пытаются угадать снос.

6. Но роль играющего в последнем случае еще не окончена. За ним еще один немаловажный ход - выбрать, перехватывать (обычно, на одну взятку) или пропускать на некоторый коллектив. Причем, стратегия такого решения тоже может быть как чистой, так и смешанной, в зависимости от длин паровозов и оптимальной стратегии ловящих.

7. Ну вот только теперь, в конце грамотного розыгрыша ловцы, если перехвата все же не последовало, должны угадать с мастью дырки. И, если для играющего оптимальный снос определяется смешанной стратегией, то оптимальная стратегия ловцов в этом случае тоже, скорее всего, будет смешанной.

И вот на основе знания всех смешанных стратегий этой трехсторонней игры (одна сторона при этом является неразумной - Слепым Роком, а две другие - люди или алгоритмы, обладающие естественным или неестественным интеллектом) и можно вычислить среднее приведенное число взяток на мизере.

Другими словами, даже если мизерящий не перехватывает и идет на угадайку всегда, то для выяснения оптимальной смешанной стратегии ловящих нужно знать оптимальную стратегию сноса мизерящего, которая в свою очередь зависит от стратегий ловящих и Рока. В результате применения всеми сторонами (кроме Рока, разумеется) своих оптимальных стратегий, может получится так, что угадайка приведет не к 50%-ой вероятности взятия паровоза, а к другой - несколько большей.

Разумеется, всё сказанное верно только для случая, когда алгоритмы мизериста и ловцов не имееют корректирующих коэффициентов, на манеру игры противника, либо не получают дополнительной информации из частоты дыхания, тембра голоса или пауз на предложение обойтись одной взяткой.

Это сообщение отредактировал Pochemuk - 15/04/2013, 10:43
      » 15/04/2013, 11:53,  isabsent 
Да, вот сейчас почти что с этими вопросами пытаюсь разобраться... Обнаружил, что алгоритм мизериста перехватывает тогда, когда мог бы еще и подождать - вдруг ловцы еще ошибутся на следующих ходах. Пытаюсь немного сбалансировать его агрессивность.

Не согласен только, что игру нужно рассматривать как некооперативную. Она кооперативная - с неполной информацией. Игрока два - мизерист и ловцы. Рок - это неполнота информации, а не третий игрок.

Возник еще один вопрос:
У мизериста до сноса три проблемные для мизера карты (для примера s.gifД 8 7 c.gifД 8 7 d.gifK 10 8 7 h.gif К 7). Первый ход защитника - он кладёт s.gifТ (почему именно его - не обсуждаем). В ответ мизерист кладёт s.gif8. Занчит ли это что он снёс s.gifД или всё еще надо принимать в расчет и то, что s.gifД может быть на руке?
В более общей формулировке Если мизерист игнорирует предложение избавиться от дырки, то этой дырки у него нет или возможны варианты?
(При условии, что все дырки мизериста ловятся при данном раскладе на руках ловцов).

Это сообщение отредактировал isabsent - 15/04/2013, 12:10
      » 15/04/2013, 12:45,  Pochemuk 
isabsent ("15/".$m["апр"]."/2013," 11:53)
Да, вот сейчас почти что с этими вопросами пытаюсь разобраться... Обнаружил, что алгоритм мизериста перехватывает тогда, когда мог бы еще и подождать - вдруг ловцы еще ошибутся на следующих ходах. Пытаюсь немного сбалансировать его агрессивность.

Не согласен только, что игру нужно рассматривать как некооперативную. Она кооперативная - с неполной информацией. Игрока два - мизерист и ловцы. Рок - это неполнота информации, а не третий игрок.

Возник еще один вопрос:
У мизериста до сноса три проблемные для мизера карты (для примера s.gifД 8 7 c.gifД 8 7 d.gifK 10 8 7 h.gif К 7). Первый ход защитника - он кладёт  s.gifТ (почему именно его - не обсуждаем). В ответ мизерист кладёт s.gif8. Занчит ли это что он снёс s.gifД или всё еще надо принимать в расчет и то, что s.gifД может быть на руке?
В более общей формулировке Если мизерист игнорирует предложение избавиться от дырки, то этой дырки у него нет или возможны варианты?
(При условии, что все дырки мизериста ловятся при данном раскладе на руках ловцов).

Если алгоритм, действительно, слишком агрессивен на перехватах, тогда непонятно, почему так часто получается угадайка в последнем примере? Либо, мы не видим каких-то вариантов, либо алгоритм ловцов проверяет вероятные варианты сносов не лучшим образом и в процессе такой проверки упускает некоторые шансы.

Можно и как игру с двумя участниками и неполной информацией рассматривать. В таком случае, эта неполная информация возникает при сдаче карт и сохраняется до момента вскрытия. Далее она становится полной (за исключением неизвестного сноса). Так не проще ли ее считать, эту самую возникшую полную информацию, как результат хода Рока? Причем, ничто не мешает считать, что ход Рока выполняется уже после нашего сноса, причем выполняется он им по некоторой фиксированной (т.е. не оптимальной, а следовательно, эксплуатируемой) стратегии.

Это всего лишь искусственный прием. Но он позволяет упростить постановку и решение задачи: вместо рассмотрения одной громоздкой задачи с неполной информацией можно разбить ее на 4 гораздо более простых подзадачи, возникающих в результате одного из возможных ходов Слепого Рока. А потом их снова объединить с известными вероятностями.

Нужно продолжать учитывать возможность оставления Дs.gif Но тоже не во всех случаях.

Допустим на правой руке вистующих {Т К х}s.gif т.е. даму все равно не поймаем. Зато игрок снес две червы (хитрый снос). Трефу можно поймать с двумя переходами по бубне. Но своим сносом пиковой фоски играющий хочет составить впечатление, что дама в сносе, следовательно, хоть одна черва оставлена. Одно неосторожное движение и на этой черве он пронесет трефу.

Если же обе дамы ловились, то такой заход кажется странным, т.к. в случае сноса Дc.gifh.gif он выпускал играющего сразу. А это не есть здорово - ему надо дать помучатся, желательно, до момента угадайки.

Или вспомним мизер Ковалевской/Ласкера. Снос любой дырки приводит к ловле второй дырки на 3 взятки. Только снос посторонки позволяет уменьшить паровоз до 2-х вагонов.
Но это касается проноса не в масть.

Это сообщение отредактировал Pochemuk - 15/04/2013, 12:50
      » 15/04/2013, 13:19,  isabsent 
Pochemuk ("15/".$m["апр"]."/2013," 12:45)
Если же обе дамы ловились, то такой заход кажется странным, т.к. в случае сноса Д+К он выпускал играющего сразу. А это не есть здорово - ему надо дать помучатся, желательно, до момента угадайки.

Я это и имел ввиду - просто хотел поменьше слов написать. Тогда более конкретно:
угадайка наступила - тянуть больше некуда. ВСЕ ДЫРКИ ЛОВЯТСЯ.
Защитник кладёт s.gifТ. В ответ мизерист кладёт s.gif8. Занчит ли это что он снёс s.gifД или всё еще надо принимать в расчет и то, что s.gifД может быть на руке?
В более общей формулировке: Если мизерист игнорирует предложение избавиться от ловящейся дырки и ловцы не ошибаются (но могут не угадать), мизерист всегда статистически будет наказан лишними взятками? .

Это сообщение отредактировал isabsent - 15/04/2013, 13:35
« Предыдущая тема | Перечень тем | Следующая тема »
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей)
0 Пользователей: