Игра против соперников с коротким стеком. Часть 1 - префлоп (продолжение)

Тема в разделе "Кеш", создана пользователем Фрироллы пароли, 24 июл 2013.

  1. Фрироллы пароли

    Фрироллы пароли Критик

    0
    1.142
    +60 / -0
    Равновесие Нэша

    В играх с нулевой суммой ожидания с двумя и более игроками и неполной информацией (таких как покер) можно применять различные стратегии. Любой игрок действует согласно определенной стратегии, которая описывает, что он должен делать в каждой конкретной ситуации. Мы разбираем наш случай – блайнд против блайнда. Стратегия для малого блайнда предписывает, как ему следует поступать в каждой раздаче со своим спектром (пуш или фолд). Стратегия большого блайнда заключается в выборе между коллом и фолдом в ответ на пуш от игрока на малом блайнде. Выделяются два типа стратегий:
    • «чистые» стратегии;
    • «смешанные» стратегии.
    Чистая стратегия даёт полную определённость, каким образом игрок продолжит игру. Например, игрок на малом блайнде может идти в олл-ин с А:club: 7:heart: и всегда сбрасывать А:club:6:heart:

    Смешанная стратегия является указанием вероятности каждой чистой стратегии. Это означает, что игрок выбирает одну из чистых стратегий, в соответствии с вероятностями заданными смешанной стратегией. Выбор осуществляется перед началом каждой игры и не меняется до её конца. Каждая чистая стратегия является частным случаем смешанной, когда вероятность данной чистой стратегии 1 и у всех других нулевая вероятность. Например, малый блайнд может идти в олл-ин с А:club: 8:heart:с вероятностью 1, с А:club: 7:heart:с вероятностью 0,5, а с А:club: 6:heart: с вероятностью 0.

    Когда в игре два участника, то цель каждого из них заключается в том, чтобы выиграть как можно больше денег. Соответственно его противник должен проиграть как можно большую сумму денег (как описано в «Фундаментальной теореме покера» Дэвида Склански).


    Фундаментальная теорема покера (англ. The Fundamental theorem of poker) - теорема, впервые введенная профессиональным игроком в покер и одним из главных покерных математиков Дэвидом Склански в его книге The Theory of Poker.

    Теорема:
    Каждый раз, когда вы играете руку отлично от того способа, каким сыграли бы, если бы видели карты оппонента - он выигрывает; каждый раз, когда вы играете руку тем же способом, если бы видели карты оппонента - он проигрывает.
    И наоборот, каждый раз, когда оппонент играет руку отлично от того способа, каким сыграл бы, если бы видел ваши карты - вы выигрываете; каждый раз, когда оппонент играет руку тем же способом, если бы видел ваши карты - вы проигрываете.


    Распознав стратегию своего оппонента, игрок может приспособить собственную стратегию, чтобы максимально увеличить свою прибыль. В сущности, этим мы занимались ранее, когда разбирали, с какими руками можем отвечать на олл-ины на префлопе. Однако сейчас каждый из игроков может постоянно изменять свою стратегию, делая конкретные подстройки в ответ на подстройки оппонента. Это все выглядит как замкнутый круг стратегий по эксплуатированию соперника: каждый раз игрок изменяет свою стратегию, чтобы эксплуатировать стратегию противника, а другой игрок делает то же самое…

    К счастью, известный математик Джон Нэш доказал, что существует пара неэксплуатируемых стратегий. Ситуация, в которой оба игрока придерживаются этих стратегий, называется «Равновесие Нэша». Неэксплуатируемая стратегия подразумевает, что когда игрок действует по этой схеме, то другой игрок не может извлечь большую прибыль, придерживаясь иной стратегии, а не игре по равновесию. Это означает, что нельзя противодействовать стратегии равновесия с большим ожиданием, кроме как играть по самой стратегии равновесия. Применим это к покеру. Здесь цель игрока в том, чтобы придерживаться неэксплуатируемой стратегии до тех пор, пока он не заметит конкретных ошибок в игре соперника, которые уже можно использовать согласно Фундаментальной теореме Дэвида Склански.

    Разберем один пример, чтобы лучше понять сущность оптимальных стратегий. Это некая адаптированная версия «Дилеммы узника».

    Полиция допрашивает двух подозреваемых. Они могут молчать, либо дать показания. Если оба из них будут держать язык за зубами, то им придется заплатить только штраф размером 250$. Если они оба все расскажут, то им также придется только заплатить штраф в 250$. Однако, если один молчит, а другой говорит, то последнего выпустят просто так, а «молчуна» обяжут заплатить 500$. Они не могут договариваться о своем выборе. Сведем возможные исходы в таблицу.

    short-tabl-1.jpg

    Сейчас представьте, что вы находитесь на месте одного из этих заключенных. Стали бы вы молчать и рисковать 500$, если ваш соучастник подло проговорится? Или вы бы все рассказали в надежде, что он будет молчать?

    Это классическая проблема теории игр, которая наглядно иллюстрирует суть Равновесия Нэша. Если ваш оппонент изменяет стратегии равновесия, то это для вас хорошо. Очевидно, что стратегия обоих соучастников должна заключаться в даче показаний. Если подозреваемый «А» всегда говорит, а подозреваемый «B» решает молчать, то участник «B» будет терять деньги. Признания обоих подозреваемых и будут неэксплуатируемой стратегией.

    Равновесие в покере

    Сейчас мы разберем, как можно применить эти ситуации равновесия к вышеописанной раздаче, в которой малый блайнд мог повышать или сбрасывать, а большой блайнд отвечать или падать. Прошу заметить, что у обоих игроков есть выверенная стратегию, по которой они собираются действовать. Наша цель найти пару стратегий, от которых ни один оппонент не мог бы уклониться под страхом потери денег.

    Назовем малого блайнда игроком А, а большого блайнда игроком В. Мы можем обозначить стратегии игроков как проценты рук, которые они разыгрывают. Назовем процент рук, с которым игрок А пойдет в олл-ин как «r», а процент рук, с которыми игрок В будет принимать этот пуш как «с». Наша цель найти равновесные выгоды для «r» и «с».

    Мы можем составить таблицу, состоящую из общего EV игрока А для различных пар стратегий. Вот формула EV.

    short-form-1.jpg

    Эквити диапазона «r» против «с» это вероятность того, что руки, с которыми повышает игрок А, бьют руки, с которыми отвечает игрок В.

    Учитывая, что мы рассматриваем игру с нулевой суммой, то

    EV игрока В = - EV игрока А.

    Предположим, что эффективный стек равен 200$, и, опираясь на данные вычисления, мы можем заявить, что верный диапазон пуша игрока А составляет от 5% до 50% рук, а правильный диапазон колла игрока В составляет от 5% до 30% рук. Сейчас, используя компьютерные подсчеты, мы можем составить таблицу выплат по вышеприведенной формуле. Для эквити, используемого в формуле, мы будет подставлять компьютерные вычисления эквити диапазона «r» против эквити диапазона «с». Вот данная таблица.

    short-tabl-2.jpg

    Игрок А желает до максимума довести свое EV, поэтому он хочет выбрать стратегию «r» с максимальным EV. Игрок В также стремится до максимума увеличить свое EV, а для этого ему надо минимизировать EV игрока А. Таким образом, он хочет подобрать стратегию «с» с наименьшим максимумом EV для игрока А.

    Очевидно, что не имеет значения, какой стратегии будет придерживаться игрок В. EV игрока А всегда будет выше, когда он играет 40% своих рук, чем когда он разыгрывает 5%, 10%, 20%, 30% рук. Мы можем сделать вывод, что стратегия розыгрыша 40% рук «доминирует» над тайтовыми стратегиями. Учитывая, что розыгрыш 40% рук будет всегда лучше, независимо от игры большого блайнда, то игрок А никогда не будет выбирать стратегии с рейзом 5%, 10%, 20% или 30% рук, поэтому их можно убрать из таблицы.

    short-tabl-3.jpg

    Игрок В сейчас видит, что колл с 20% рук всегда лучше (так как EV игрока А всегда ниже в этих случаях), чем колл с 5% или 10%. Таким образом, мы тоже можем убрать их из таблицы.

    short-tabl-4.jpg

    Сейчас игрок А понимает, что стратегию розыгрыша 40% рук лучше, чем вход в банк с 50% рук.

    short-tabl-5.jpg

    Соответственно, игрок В представляет, что должен отвечать с 20% лучших. Таким образом, мы находим равновесие Нэша, которое составляет «r» = 40%, а «с» = 20%, что выливается в следующие диапазоны.

    Малый блайнд идет в олл-ин с: 44+, А2s+, K2s+, Q4s+, J7s+, T7s+, 97s+, 87s+, A3o+, K7o+, Q8o+, J8o+ и Т9о.

    Большой блайнд должен отвечать с: 66+, A4s+, K8s+, Q9s+, J9s+, T9s, A9o+, KTo+, QTo+ и JTo.

    Конечно, это только одно приблизительное вычисления. Правильные диапазоны составляют примерно 40% и 20% рук, но все-таки они достаточно точны.

    Используя компьютерную программу, мы находим, что верные диапазоны равны 40,6% и 21,7%. Однако эти спектры состоят из немного других рук, отличающихся от стандартного ранжирования. Вот эти диапазоны:

    Малый блайнд пушит с: 22+, A2s+, K4s+, Q6s+, J7s+, T6s+, 96s+, 85s+, 75s+, 64s+, 54s, A2o+, K9o+, Q9o+, J9o+, T9o, 98o.

    Большой блайнд отвечает с: 33+, A2s+, K9s+, QTs+, A5o+ и КТо+.

    Различия могут казаться весомыми, но в плане EV эти диапазоны далеко не отошли.

    Колл олл-ина

    Когда вы играете против «коротыша», то вам приходится постоянно сталкиваться с различными ситуациями, в которых стоит выбор между коллом олл-ина и фолдом. В данном параграфе мы разберем один особый случай, в котором шортстек пушит на ваш оупен-рейз. С небольшими изменениями эти математические концепции можно использовать и в других покерных ситуациях, в которых вам требуется ответить на олл-ин.

    Математика для колла олл-ина довольно проста. Когда ваш оппонент пушит, то вам необходимо выбрать между двумя опциями: колл и фолд. Ожидаемая выгода фолда всегда равняется 0, так как в этом случае вы ничего не теряете и не приобретаете. Вот как рассчитывается EV колла.


    «эквити» - это вероятность, с которой наша рука окажется лучшей против спектра «коротыша».

    Переведем эту формулу в словесный вид. «Ожидаемая выгода колла равна нашей доле общего банка, которую мы можем выиграть, минус сумма, которую мы можем проиграть в результате колла». Общий банк равняется двум стекам «коротыша», так как он вкладывает туда все деньги, а мы уравниваем его ставку. Плюс не стоит забывать о блайндах. Если «коротыш» располагался на блайндах, то мы не включаем их сумму в формулу, так как они уже входят в его стек. Сумма, которую нам нужно доставить для колла его олл-ина, равняется размеру его пуша за вычетом нашего первоначального рейза.

    Мы можем подставить некоторые числа из стандартной кэш-игры 5$/10$.

    EVколла = [5$ +(2)(200$)] (Эквити) – (2004 – 35$)

    Как вы уже поняли, мы прибавили только 5$ за блайнды, так как «коротыш» располагается на большом блайнде. Упростим это уравнение до:

    EVколла = (405$)(Эквити) – 165$.

    Нам необходимо 0,41 эквити, чтобы сделать наш колл нулевым.

    short-form-2.jpg

    Таким образом, чтобы ответить на олл-ин от «коротыша» на большом блайнде, нам нужно, по крайней мере, 41% эквити против его диапазона. Нам необходимо знать диапазон 3-бета шортстека, если мы желаем эксплуатировать его стратегию. Для получения этой информации вы можете обратиться к программам по сбору статистики, и разобрать диапазоны хороших «коротышей».

    Например, возьмем следующий приблизительный диапазон:

    22+, А2s+, K9s+, J9s+, T8s+, 98s, A2o+ и KJo.

    Это около 26% лучших рук. Затем нам надо найти слабейшую руку, которая бы имела 41% эквити против данного диапазона. Это легко выполнить при помощи программы «PokerStove» или другой подобной. Итак, мы можем обнаружить, что одномастные валет-девять имеют 41,29% эквити против этого диапазона, являясь при этом слабейшей рукой, с которой вы отвечаете на олл-ин. Целиком диапазон колла с эквити больше 41% включает в себя следующие руки:

    22+, A2s+, K9s+, Q9s+, J9s+, T9s, A5o и KJo.

    Итак, используя вышеприведенный метод, вы можете изучить, как отвечать на олл-ины от «коротышей» прибыльно и эффективно. Сейчас вам наверняка кажется, что это очень трудоемкая работа, но выделите хотя бы день, чтобы найти оптимальные диапазоны против большинства шортстеков, которые часто играют за вашими столами. Таким образом, вы сведете к минимуму преимущество «коротышей» над вами и, возможно, даже отучите их садиться за ваши столы.

    Ре-рейз

    Мы будем использовать схожие математические методы для оценки того, как нам прибыльно ре-рейзить открывания шортстеков. Когда мы выбираем между рейзом (пушем) и фолдом, то подсчитываем ожидаемую выгоду рейза и находим требуемое эквити, которое сделает наше EV больше нуля.

    Мы будем применять формулу, в которой исключено, что ответить на олл-ин могу ещё другие игроки.

    EVрейза = (Рколла){[блайнды + (2)(стек)](Эквити) – (Стек – блайнд)} + (1 – Рколла)(Банк),

    где «Рколла» представляет вероятность, что оппонент ответит на олл-ин;

    «Блайнды» - это сумма блайндов, которые были поставлены вами или вашими соперниками;

    «Банк» - это деньги, которые в текущий момент находятся в поте, т.е. блайнды и рейз «коротыша»;

    Все остальное идентично предыдущему уравнению.

    Представим, что игра проходит с блайндами 5$/10$, эффективные стеки 200$, а оупен-рейз равен 30$. Таким образом, у нас получается следующее уравнение.

    EVрейза = (Рколла)[(405$)(Эквити) – 190$] + (1 – Рколла)(45$)

    Упростим до:

    EVрейза = (Рколла)[(405$)(Эквити) – 235$] + 45$

    Сейчас нам необходимо подставить вероятность того, что «коротыш» будет отвечать на наш олл-ин, а также на эквити после его колла, чтобы найти EV рейза. Отличной идеей будет заглянуть в базу, чтобы изучить диапазоны шортстеков, с которыми вы чаще всего встречаетесь. Затем вы можете использовать эти уравнения для нахождения оптимальных спектров ре-рейза (все руки с положительным EV), а потом выучить или переписать в блокнот эти диапазоны.


     
    Последнее редактирование модератором: 13 ноя 2018
  2. MrTwister

    MrTwister Продвинутый

    0
    965
    +132 / -0
    Спасибо, полезная статья!