GTOポーカークイズチャレンジ   第4部 答え

Posted by / Blogs

キャプチャ

第16問(4点):3人が3maxのNLHEを3ハンドプレイします。(BTN、SB、BBを1回ずつ。)2人はGTO戦略を使い、1人は使いません。必然的にGTO戦略を使っている2人の合計期待値は0以上で、GTO戦略を使っていないプレイヤーの合計期待値は0以下ですか?
答え:No
説明:全員がGTO戦略を使っている時はどのプレイヤーも自分の戦略だけを変えることで期待値を上げることができません。しかしナッシュ均衡の定義は誰かが逸れた時に他のプレイヤーがどう影響されるかについては何も語っていません。
2人しかいない場合は片方のプレイヤーが逸れたら期待値が変わらないか下がるかの可能性しかなく、ゼロ和ゲームなので下がった場合はその失われた期待値が必然的にもう片方のプレイヤーのものになります。例えば、両方のプレイヤーがナッシュ均衡をプレイしている時の期待値は2人とも100だとします。もし1人が逸れて期待値が80になったら、もう1人の期待値は120にならざるを得ません。
3人以上いる場合はこのような保証はありません。逸れた人の期待値が上がることはありませんが、他のプレイヤーはGTO戦略を使っていても他の人の悪いプレイで自分も悪影響を受けることが可能なのです。例えば、3人のプレイヤーがナッシュ均衡をプレイしている時の期待値は全員100だとします。もし1人が逸れて期待値が80になったら、残りの2人の期待値が60と160になることが可能です。2人のゼロ和ゲームとは違って3人以上の時は「相手の期待値が下がるイコール自分のGTO戦略の期待値が上がる」が本当ではなくなってしまうのです。
ちなみに、GTOの有効性はHUゲームに限られず、多人数ゲームの中で2人だけの状況になった場合も相手がどんな戦略を使おうと最低限の期待値を保証する特性は保たれます。
正解率:42%

第17問(4点):3人が3maxのNLHEを3ハンドプレイします。(BTN、SB、BBを1回ずつ。)3人はそれぞれ単独で(別々で)計算したGTO戦略を使っています。誰かが自分だけ戦略を変えることで期待値を上げることが可能という状況は可能ですか?
答え:Yes
説明:プレイヤーが3人以上いるポーカーのシチュエーションでも複数のナッシュ均衡の存在が可能です。しかし3人が異なるナッシュ均衡を使っても、そのポジションごとの部分的な戦略のコンビネーションがナッシュ均衡になるとは限りません。例えば、A、B、Cの3つの異なるナッシュ均衡(それぞれがBTN、SB、BBでの戦略を定めている)があり、BTNの戦略にはA、SBの戦略にはB、BBの戦略にはCを採用して新たな戦略の組み合わせを構成しても、これがナッシュ均衡になる保証はありません。2人だけの場合はこのように異なるナッシュ均衡を部分的に組み合わせれば必ずナッシュ均衡になります。(そうでなければ、組み合わせられた戦略のIPかOOPのどちらかの期待値が下がった→実は搾取が可能だった→そもそもGTOではなかった、という矛盾が生まれるからです。)3人以上いる場合は「組み合わせることによって期待値が下がったから戦略がもともとGTOではなかった」ということにはならないので、全員が別々で計算したナッシュ均衡が異なるものであれば、搾取されることが可能なプレイヤーがいることも可能です。
ポーカーではありませんが単純な例を挙げます。3人がバーに行くか行かないか決めます。(他の人が何を決めたかは行くまで知ることができません。)2人だけ行くと楽しく時間が過ごせますが(EV +2)、3人行くと窮屈になって最悪の事態(EV -1)、1人だけでバーに行くのもできれば避けたくて(EV 0)、1人で家に残っていた方が良いです(EV +1)。このゲームには幾つかのナッシュ均衡がありますが、そのうちの3つは3人のうち2人がバーに行ってもう1人は家に残るものです。全員がその3通りあるナッシュ均衡の中から自分がバーに行くものを選べば全員バーに行くことになります。しかしその状況では誰もが戦略を変えて家に残れば期待値を上げることができます。(これはゼロ和ゲームではないので戦略を変えることによって相手の期待値も上がりますが、ポーカーでは自分の期待値が上がるのであれば他のプレイヤー全員の期待値も上がることは不可能です。)
正解率:33%

第18問(4点):友達が3maxでのNLHEの2つの戦略XとYをあなたに見せ、両方GTOだと主張します。全員のプレイヤー(BTN、SB、BB)がXを使った時の期待値と、全員がYを使った時の期待値をポジションごとに計算してみました。SBの期待値はXの時の方がYの時よりも期待値が高く、BBの期待値はYの時の方がXの時よりも期待値が高いことが判明しました。XとYが両方GTOであることは可能ですか?
答え:Yes
説明:これも2人だけの場合と違い、3人以上いる場合はナッシュ均衡のポジションごとの期待値が異なることが可能です。例えば、あるナッシュ均衡ではBTNでプレイするのが比較的不利で、違うナッシュ均衡ではBTNをプレイするのが比較的有利になり得るのです。3人のうち1人がXとYの2つのナッシュ均衡から選ぶことができ、自分にとっての期待値は両方同じでありながらも、Xが残りの2人のうちの1人にとって有利で、Yがもう1人にとって有利というような状況なども可能です。
正解率:58%

第19問(5点):リバーでOOPのレンジのエクエティは50%です。OOPのレンジの中の特定のハンドに対してIPが負けるハンドでコールすることがなく、勝っているハンドでフォールドすることがなく、ショーダウンで引き分けになることが不可能な状況です。OOPがこの特定のハンドをベットすることがGTOであることは可能ですか?
答え:Yes
説明:リバーでバリューを取りに行くこととブラフで相手を降ろす以外のもう一つのベットする理由は、こちらのレンジを理想の形に構成し、相手のベットサイズの選択肢を制限するためです。要するにブロックベットです。OOPでレンジに強いハンド、ブラフキャッチャー、エアーの3つが含まれていれば小さくベットするのが最適なシチュエーションが存在します。強いハンドは相手のブラフキャッチャーのチェックバックを防ぎながらレイズされた時によりバリューを取ることができて、エアーは小さなベットでブラフができて、ブラフキャッチャーは強いハンドの存在によってチェックした時と比べてより多くのエクイティがリアライズできます。要するに強いハンド、ブラフキャッチャー、エアーの割合を丁度良くバランスしたベットレンジを構成することで、チェックした時と比べてブラフキャッチャーを攻撃しにくくしているのです。これは相手がこちらのブラフキャッチャーに対して完璧に反応するにもかかわらずです。このようなシチュエーションの存在は「The Mathematics of Poker」の中で紹介されている「AKQ game #5」(p. 165)で初めて厳密に証明されました。本を持っていない方も多いと思うので、ピオソルバーで確認できるリバーのシチュエーションを用意しました(無料バージョンでも可能):https://pastebin.com/JYujUPcZ
正解率:42%

第20問(5点):GTO戦略がナッツをフォールドすることは可能ですか?
答え:Yes
説明:ナッシュ均衡のペアは均衡経路という、その二つのナッシュ均衡がプレイした時にゼロでない確率で起こるシチュエーションの集合を定めます。ナッシュ均衡は均衡経路外ではそこから始まるシチュエーションのGTO戦略をプレイしなくてはいけないという制約はありません。例えば、HUNLHEの中にある特定のシチュエーションで72oでリバーにたどり着くことがGTOではないとします。その場合、HUNLHE全体のGTO戦略がそのシチュエーションで72oを持っているプレイヤーに対して最適ではないプレイをすることが可能です。
でも均衡経路外なら何でもありという訳でもありません。相手が期待値を上げるために均衡経路から逸れることを動機付けるほど悪くあってはいけません。そうなった場合、相手は戦略を変えて期待値を上げることができてしまうので、ナッシュ均衡ではなくなってしまいます。
例えば、第8問の答えの説明で出たナッツ&エアー対ブラフキャッチャーのシチュエーションでOOPのプレイヤーがブラフキャッチャーを持っていれば、GTO戦略はベットすることがありません。ナッツにコールされ、エアーにフォールドされてしまうので、損するだけです。しかしもしポットサイズベットしか残っていなく、ナッツ&エアーのIPのプレイヤーがオールインに対してナッツを20%フォールドしてくれたらどうでしょう。この部分ゲーム(OOPがベットした時点から始まるゲーム)の中でナッツをフォールドすることは明らかにGTOではありませんが、最初から計算してみるとこれでもOOPはチェックの期待値がベットの期待値より高いことが分かります。つまりOOPは100%チェックするGTO戦略を変えても、このナッツをフォールドする戦略に対して期待値を上げることができません(むしろ下がります。)結果、ナッシュ均衡の条件を満たしているので、これはGTO戦略の一部であることが可能なのです。
このシチュエーションをピオソルバーで再現し、ノードロックでナッツを20%フォールドさせるようにしました:
FoldingTheNutsもちろん、ナッツをフォールドしてくれる頻度を上げていけば、OOPのベットの期待値がチェックの期待値より高くなるほど悪いプレイになり、GTO戦略の一部であることが不可能になります。
ナッツをフォールドすることがGTOであることが可能なのは、OOPがGTO戦略をプレイした場合、IPがナッツをフォールドできるシチュエーションが均衡経路外で、そもそもその状況にたどり着くことがないからです。
これを読んで「均衡経路外ならGTOはいらない、どんな戦略もあり」という誤解がないように気を付けてください!実戦では相手がGTOが一切しないプレイをすることはよくあることなので、その状況での最適戦略を把握することは大事です。
最後に、部分ゲーム完全均衡というゲーム理論における解概念があります。これはゲーム内の全ての部分ゲームでの戦略がナッシュ均衡である均衡です。なので部分ゲーム完全均衡はナッシュ均衡ですが、ナッシュ均衡が部分ゲーム完全均衡とは限りません。そして部分ゲーム完全均衡ではナッツをフォールドすることはありえません。このようなナッシュ均衡を精緻化した解概念は他にも存在します。
正解率:33%

今週の上位者(22/22):
わんわん

Tagged With: