GTOポーカークイズチャレンジ   第2部 答え

Posted by / Blogs

2

第6問(2点):AさんとBさんがHUで2ハンドをプレイします。(SBとBBを1回ずつ。)AさんはGTOに近い戦略をとっており、Bさんは完璧なGTO戦略をとっています。Aさんは、GTOが特定のアクションしか使わない場合、1%の確率でアクションをランダムで選んでしまうというリークがあります。AさんとBさんのこの2ハンドにおいての合計期待値が同じであることは可能ですか?
答え:No
説明:Aさんがアクションをランダムで選んだ時にGTOと同じアクションを選ぶ可能性もあるのでYesと答えた方もいるかもしれませんが、問題はGTOと同じようにプレイする可能性があるかではなく、要は期待値がGTOと同じになるかを問うています。Aさんのリークを通してどのような間違いを犯すことになるのかを考えてみると答えは明らかになります。例えばAさんがSB(HUではBTN)でAAを配られたらフォールドしてしまう可能性があります。これはGTOと比べて期待値が遥かに低いプレイです。二人ともリーク無しで2ハンドプレイすれば合計期待値は0です。ナッシュ均衡の定義から、Aさんのランダムなプレイが期待値を上げることは不可能ですが、期待値を下げることは(純粋戦略の場合は)必然なので、Aさんの合計期待値はマイナスになり、Bさんの合計期待値はプラスになります。
正解率:60%

第7問(2点):あなたはあるシチュエーションのGTO戦略を計算しました。友達が同じシチュエーションでのある戦略をあなたに見せ、GTOだと主張します。あなたの計算したGTO戦略と友達の戦略は幾つかのハンドの戦略が異なっています。友達の戦略がGTOであることは可能ですか?
答え:Yes
説明:ナッシュ均衡は必ずしも唯一解ではありません。つまり一つのシチュエーションで複数のナッシュ均衡が存在することが可能なのです。しかし証明はされていないものの、ポーカーで複数のナッシュ均衡があったとしても、重要な違いは基本的に無いと一般的に考えられています。例えば、あるナッシュ均衡では100%ベットするハンドがもう一つのナッシュ均衡では100%チェックする、というようなことはありえないということです。さらに、戦略は異なっていてもHUでは保証される最低限の期待値はナッシュ均衡によって変わることはありません。
正解率:76%

第8問(2点):二人のプレイヤーが50%エクイティのレンジでリバーにたどり着いてリバーからGTO戦略を使えば、IPのプレイヤーの期待値がOOPのプレイヤーの期待値より低くなることは可能ですか?
答え:Yes
説明:この問題のカギとなるのが50%のエクイティがどのようにレンジに分配されているかです。例えば、全てのハンドが50%エクイティのレンジと、半分0%エクイティと半分100%エクイティのハンドに分けられているレンジとでは、レンジの平均エクイティが同じでありながらも最適の戦略は大きく異なります。通常は不利であるOOPのプレイヤーにエクイティが0%と100%のハンドに分けられているレンジを与え、IPのプレイヤーのレンジが50%エクイティのハンドだけであれば、OOPのプレイヤーの期待値の方が高くなります。このナッツ&エアー対ブラフキャッチャーのシチュエーションはGTO入門GTO Basic Concepts SeriesGTO的バランシングで詳しく説明しています。また、ピオソルバーで再現してみたい人のためにそのシチュエーションを用意しました(無料バージョンでも可能):https://pastebin.com/YFbTHUJC
正解率:51%

第9問(3点):二人のプレイヤーがお互いにGTOをプレイしている中、片方のプレイヤーがナッシュ均衡から逸れた場合、そのプレイヤーの期待値が下がらないことは可能ですか?
答え:Yes
説明:GTOが混合戦略を使うことがあれば、その混合戦略が使う選択肢の期待値が同じということになるので、アクションを選ぶ頻度を変えても期待値は影響されません。例えばGTOがあるハンドを75%ベット・25%チェックしているのであれば、そのハンドの戦略を100%チェックに変えたとしても期待値は下がりません。ただし、バランスが取れていない状態になってしまうので、GTOとは違い搾取されることが可能な戦略になります。
正解率:47%

第10問(3点):二つのボットがスタック1000bbのプッシュ・オア・フォールドをプレイしています。あなたは無限大のサンプルでボット1がボット2のオールインを0.1%以下の確率でコールしていることを観察しました。この二つのボットが両方GTO戦略を使っていることは可能ですか?
答え:Yes
説明:1000bbでのプッシュ・オア・フォールドのナッシュ均衡はAAだけでオールインし、AAだけでコールする戦略です。AAは(4/52)*(3/51)=1/221の確率で配られるので、1/221>0.1%以下の確率でコールしているのなら時々AAをフォールドしていることになるかと思うかもしれませんが、お互いにGTOをプレイしているのであればオールインされた時に相手はAAを持っているということになるので、コール頻度は(2/50)*(1/49)=1/1225<0.1%になります。このように、観察した頻度だけで相手の戦略やアクションの利益を正確に計算することはできません。レンジのブロッキング効果も考慮する必要があるのです。これはもちろんこの問題のようなプリフロップのシチュエーションだけではなく、ポストフロップでもそうです。プリフロップではタイトなプレイヤー、UTGのオープン、4ベットなど、ポストフロップでは複数のレイズがあった場合やリバーなどでレンジが比較的狭くなり、狭くなればなるほどブロッキング効果が重要になってきます。
1000bb (1)正解率:47%

今週の上位者(12/12):
glass100
ふかつ
zak
たつ
tamonten

Tagged With: