Здравствуйте, гость Правила · Помощь

»  Теория. Алгоритм ловли мизера. Подписаться | Сообщить другу | Версия для печати
      » 17/04/2013, 20:38,  isabsent 
Клейн ("17/".$m["апр"]."/2013," 20:20)
1. Эмирически  в живой гладкой игре приоритет всегда стоит за ловлей 8-ки пик, а не 50/50.
Игрок-человек это осознаёт.
Если же он сомневается в данном приоритете, то будет идти на угадайку.

(в инет-партии можно предложить "отдаём две взятки" - это ровно середина между +1 и -5).
2. Не хотите ли попробовать вбить второй ход самостоятельно и этот ход будет 10c.gif  и 8c.gif , например?
Что будет?

Всегда 2 взятки (при двух снесенных вальтах). О чём это говорит подготовленному читателю? rolleyes.gif

P.S. Алгоритм мизериста что-то странное делает - забирает дамой крест эти 10c.gif 8c.gif хотя вроде мог бы и подложиться?

Это сообщение отредактировал isabsent - 17/04/2013, 20:47
      » 17/04/2013, 20:48,  Клейн 
isabsent ("17/".$m["апр"]."/2013," 20:38)
Клейн ("17/".$m["апр"]."/2013," 20:20)

2. Не хотите ли попробовать вбить второй ход самостоятельно и этот ход будет 10c.gif  и 8c.gif , например?
Что будет?

Всегда 2 взятки (при двух снесенных вальтах). О чём это говорит подготовленному читателю? rolleyes.gif

Мне было любопытно схватит машина или нет.
Но хотелось бы то же самое увидеть для начального условия задачи (хотя писать результат тут вряд ли имеет смысл).
Потом прочитайте ту ссылку на тему обсуждения сдачи и Вам станет, наверное, более понятно почему там ловили бубну без тени сомнений.

Почему приоритет 8-ки пик?
1. Атака была в 10-ку
2. Пика не представлена непрерывным рядом карт, что дало бы равнозначность сносу при сносе пары пик.
3. Ряд прерывен - есть пробел/дыра в ряду и этот пробел 9-ка.
4. Если Вы видите на столе карту более старшую из изначально присутствующих, а пробел/дыра ряда представлена 9-кой или 10-кой, то вероятность нахождения в руке играющего более мелкой карты резко увеличивается.
5. Ваша же прога даёт им равные шансы, а мне кажется их надо несколько сместить.
      » 17/04/2013, 20:54,  isabsent 
isabsent ("17/".$m["апр"]."/2013," 20:38)
P.S. Алгоритм мизериста что-то странное делает - забирает дамой крест эти 10c.gif 8c.gif хотя вроде мог бы и подложиться?

Подложился - получилось 55% - 0 взяток и 45% - 5 взяток.
      » 17/04/2013, 20:56,  isabsent 
Клейн ("17/".$m["апр"]."/2013," 20:48)
Мне было любопытно схватит машина или нет.
Но хотелось бы то же самое увидеть для начального условия задачи (хотя писать результат тут вряд ли имеет смысл).

Вы хотите сказать, что алгоритм пропустил вариант посадить мизериста на 2 взятки, а увидел только вилку между 0 и 5 при неизмененных условиях задачи?
      » 17/04/2013, 23:34,  Клейн 
isabsent ("17/".$m["апр"]."/2013," 20:56)
Вы хотите сказать, что алгоритм пропустил вариант посадить мизериста на 2 взятки, а увидел только вилку между 0 и 5 при неизмененных условиях задачи?

Я хочу сказать, что Вы изначально предполагаете желание мизерящего идти на угадайку невзирая на потери.
Большинство игроков так не поступают - преферанс игра на минимизацию потерь.
Вы не можете выиграть столько-то в эту игру лишь потому что желаете это сделать - это не в ваших силах.
Но вы способны проиграть столько-то, если желаете и это не противоречит Року - то есть вы можете углубить ямку, но не способны прыгнуть выше головы.
Всё это "понимает" и Ваша машинка, когда занимает позицию мизерящего.



всё что ниже, написано в основном для экстези smile.gif

Собственно, всё вышесказанное легко объясняется с позиции и в терминах формальной логики.
Однако, при неполной информации у ловящих, они не вправе использовать лишь классическую логику, что они и делают в реальном времени (осознают это они или нет - значения не имеет).

Возможно, экстези занимает боксёрскую стойку, когда я ему предлагаю формализовать собственные рассуждения во время игры и превратить их в математические выражения потому, что он, как мне кажется, воспринимает слово "формализовать" лишь с привязкой к формальной логике.
Но ведь есть ещё целый ряд неклассических логик.

Многозначные логики (например, трёхзначная с её "истина", "случайность", "ложь" ), если я верно помню, могут быть заданы матричным способом.
Множество модальных логик с их "известно, что"...
В конце концов, есть паранепротиворечивая логика, "в которой логический принцип «из противоречия следует все, что угодно», не имеет места".
Вот что пишут о последней:
"Уже построен целый ряд паранепротиворечивых теорий множеств, в которых расселовское множество существует. Более того, если формализованную арифметику строить на основе паранепротиворечивой логики, то истинное Гёделево предложение может быть доказуемо вопреки результату Гёделя (первая теорема о неполноте). Паранепротиворечивая логика имеет применение в естественных и социальных науках, в квантовой механике, в вероятностных и индуктивных рассуждениях, в теории нечетких понятий, в деонтической логике (моральные дилеммы), в доксатической логике (системы полагания). Особенно важно применение паранепротиворечивой логики в компьютерных науках, где возникает задача логической обработки противоречивой информации, напр. поступающей из различных источников."

Это сообщение отредактировал Клейн - 17/04/2013, 23:37
      » 18/04/2013, 01:20,  extasy 
Я, кстати, в теме о распасах описывал моделирование поведения соперников и построение оптимальных алгоритмов на основе статистики.

Пусть у нас есть модуль, который занимается анализом поведения игроков. Он должен состоять из 2 частей:
- первая часть собирает статистику всех игроков во всевозможных игровых ситуациях;
- вторая часть собирает статистику уже отыгранных сдач тех игроков, с которыми мы играем в данный момент.

Допустим, у нас есть оптимальный по МО алгоритм. Этот алгоритм будет пользоваться помощью "модуля поведения" для расчета оптимальной игры с учетом человеческого фактора. В тех ситуациях, в которых нет доступной статистики для конкретных игроков (слишком мало сыграно) - будет браться общая статистика по игрокам схожей категории.


--------------------
the elephant has you..
      » 18/04/2013, 06:40,  isabsent 
Клейн ("17/".$m["апр"]."/2013," 20:20)
1. Эмирически  в живой гладкой игре приоритет всегда стоит за ловлей 8-ки пик, а не 50/50.
Игрок-человек это осознаёт.
Если же он сомневается в данном приоритете, то будет идти на угадайку.

(в инет-партии можно предложить "отдаём две взятки" - это ровно середина между +1 и -5).
2. Не хотите ли попробовать вбить второй ход самостоятельно и этот ход будет 10c.gif  и 8c.gif , например?
Что будет?

Посмотрел, почему алгоритм ловцов ведёт дело к угадайке между 0 и 5, а не выбирает гарантированные две взятки. Дело в том, что на второй взятке после хода 10c.gif алгоритм всегда кладёт Кc.gif, а не 8c.gif не оставляя возможноси мизеристу перехватить Дc.gif и добрать 8s.gif чтобы зафиксировать 2 взятки и уйти с миром. А причина, по которой ловец всегда хочет взять на Кc.gif состоит в том, что посчитав все возможные исходы от ходов Кc.gif и сравнив их с ходом 8c.gif ловец видит, что среднее количество взяток мизериста при ходе Кc.gif существенно больше - поэтому он и выбирает этот ход. Имеется ввиду среднее по всем возможным сносам, полученное в предположении что игроки ИГРАЮТ НА ОТКРЫТЫХ КАРТАХ.

Если бы алгоритм мог посчитать это среднее при ИГРЕ НА ЗАКРЫТЫХ КАРТАХ, (что может сделать человек, так как он помнит, чем статистически заканчивался такой ход во всех сыгранных за последние 100 лет таких партиях), то выбор Кc.gif был бы не так однозначен, потому что он включал бы угадайку на первом ходе 6-ой взятки и, соответственно, 0 взяток вместо 5-и если угадать не удалось, что сильно понизило бы шансы выбора хода Кc.gif в пользу хода 8c.gif. Но на первом ходе 2-ой взятки при ИГРЕ НА ОТКРЫТЫХ КАРТАХ угадайки не видно, а виден только хороший паровоз на почти 5 взяток в среднем.

Можно ввести некоторое расстояние (которое будет измеряться во взятках) и говорить, что если разница средних между двумя ходами при ИГРЕ НА ОТКРЫТЫХ КАРТАХ меньше этого расстояния, то такие ходы надо тоже включать в рассмотрение, а не отбрасывать как это сделано сейчас. Но это уже эмпирика, которой хотелось бы избежать...

Это сообщение отредактировал isabsent - 18/04/2013, 07:44
      » 18/04/2013, 07:53,  Pochemuk 
isabsent ("18/".$m["апр"]."/2013," 06:40)
... причина, по которой ловец всегда хочет взять на Кc.gif состоит в том, что посчитав все возможные исходы от ходов Кc.gif и сравнив их с ходом 8c.gif ловец видит, что среднее количество взяток мизериста при ходе Кc.gif существенно больше - поэтому он и выбирает этот ход. Имеется ввиду среднее по всем возможным сносам, полученное в предположении что игроки играют на открытых картах.

А учитывается ли при этом, что 0 взяток, это не проигрышь 0 взяток, а выигрышь, эквивалентный проигрышу 1 взятки, но с противоположным знаком?

И, кстати, обычно (но не всегда) ловящие пользуются критерием не максимакса (дать взяток побольше при лучшем стечении обстоятельств), а, все же, максиминный (дать побольше взяток в худшем случае). Т.е. предпочитают дать хоть 1 взятку, чем выпустить в погоне за паровозом.
      » 18/04/2013, 08:34,  isabsent 
Pochemuk ("18/".$m["апр"]."/2013," 07:53)
1.А учитывается ли при этом, что 0 взяток, это не проигрышь 0 взяток, а выигрыш, эквивалентный проигрышу 1 взятки, но с противоположным знаком?

2.И, кстати, обычно (но не всегда) ловящие пользуются критерием не максимакса (дать взяток побольше при лучшем стечении обстоятельств), а, все же, максиминный (дать побольше взяток в худшем случае). Т.е. предпочитают дать хоть 1 взятку, чем выпустить в погоне за паровозом.

1. Пока нет, но это несложно дописать.
2. В каком-то смысле желание "дать побольше взяток в худшем случае" учитывается, так как ход сначала выбирается из соображения чтобы он не дал мизеристу уйти без взяток (на открытых картах). Если это невозможно, то тогда делается ход, который допускает минимальное количество сносов при которых мизерист остается без взяток. Но это все на открытых картах - поэтому 0 взяток у мизериста может быть и не виден из-за возможной угадайки на более глубоких ходах.
      » 18/04/2013, 20:49,  Pochemuk 
Вывел на досуге формУлу смешанных стратегий сноса и ловли для такого семейства мизеров и тактики мизерящего:

1. Мизер с дырками в двух мастях.
2. Мизерящий не использует хитрые сносы - сносит только из этих мастей. Одна масть остается дырявой на 1 взятку при перехвате.
3. Если ловится только масть дырки, то, разумеется, перехватывает. Иначе, если ловятся обе, идет на паровозную угадайку.

Для упрощения (существенного) считал, что паровозность обоих дыр одинакова и постоянна. Это, конечно, грубо, но до сих пор не знаю, как бы попроще обсчитать более общие случаи.

Так вот, логичное следствие такой тактики: Чем длиннее светит паровоз, тем ближе стратегии сноса/ловли к 50/50. Оно и понятно: игра против ловцов с угадайкой становится более существенным элементом, чем игра против Рока с какой-то там одной взяткой. Поэтому, алгоритм уже почти не должен смотреть на вероятности ловли дыр, а выбирать снос почти равновероятный. Это, конечно, в том случае, если у него нет доп-информации, о смешанных/чистых стратегиях ловцов (т.е. об их манере игры).
« Предыдущая тема | Перечень тем | Следующая тема »
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей)
0 Пользователей: