ゲーム理論・GTOの利点 (Part 1)

Posted · コメントを追加する

gto1

そもそもGTOのどこが良くてなぜ重要なのかよく分からない人も多いんじゃないかと思うので、ゲーム理論の利点をまとめてみることにしました。

ナッシュ均衡は心理的な作戦に頼らない

ポーカーは読み合いのゲームだとよく言われます。相手の思考レベルの一つ上のレベルで作戦を練ることにより、常に相手より一歩先じる。

この考え方は理論上では成り立つものの、実際的応用には問題があります。相手が極めて単純であれば、自分の思考レベルを意識しない上にいつも同じレベルで考えるので、搾取は簡単です。しかしほとんどの相手はそうではなく、全体的に下手でも自分なりに相手にアジャストしようとします。いつまでも同じレベルで考えている保証はありません。さらに、手強い相手の場合は相手も自分より一つ上のレベルで考えようとするので、相手の考えているレベルを予想して当てようとするただの当てっこになってしまいます。これは戦略的なアプローチとは言えません。

それに比べて、ナッシュ均衡は相手に自分の戦略を教えたとしても、相手はその情報を利用して搾取することができません。相手の戦略や思考レベルに関係なく最低限の期待値を保証してくれます。

GTO戦略は変わることがない

最近までのポーカーの歴史の中での戦略の進化は前世代のプレイスタイルに勝つプレイスタイルを選ぶようなものでした。人間は大抵ルースにプレイするのが好きなので、まず最初に生まれた作戦がタイトアグレッシブでしょう。強い役ができたら大きくベットやレイズしてルースな相手を陥れるという単純な作戦です。その戦略に気づいた人は、ちょっと違ったルースなプレイスタイルでカウンターするようになりました。相手がアグレッシブではない時だけプレッシャーを掛け、相手が強さを示したらすぐ諦める作戦です。大きいポットは勝ち取れないものの、小さいポットはたくさん獲得できます。もちろん、これをカウンターする戦略も生まれ、この成り行きは全体的にどんどん細かくなっていきました。

ソルバーが開発された今ではGTO戦略が計算できるようになり、プレイスタイルは昔のように進化しなくなってきています。なぜなら、GTOが基準の戦略となり、相手の戦略の搾取方法はGTOからどう逸れているのかを見ることから始まります。搾取が不可能な基準がなかった昔は勘に頼る他なかったものの、今ではどう搾取すればいいのかが細かく計算できるようになりました。そしてGTO戦略は決して変わることがないので、一度覚えてしまえば相手がどんな戦略を使おうと、どう対応すればいいのかがわかります。

上達への近道

ポーカーは勉強せずに只々たくさんプレイすれば腕が上がるという考え方があります。これは確かにそうで、実際世界のトップに立つプレイヤーの中でほぼ全く勉強しないでそこまで至った人は幾人かいます。

しかしポーカーの運の要素がこの上達方法を困難にしています。囲碁やチェスなどの運が組み込まれていないゲームでは間違えを犯せば相手がそれを搾取し結果が100%良くないので自分の選択が悪かったとすぐ学べますが、ポーカーでは間違ったプレイをしても結果が良い、または良いプレイをしたのに結果が悪いことはよくあるのでそうもいきません。

例えば、プリフロップでオールインをAAでコールして相手がKKを持っていたがリバーでKが出て負けてしまった。また、リバーでポットサイズのベットに対して相手が99%の確率で降りるシチュエーションでブラフして相手にコールされてしまう。実際この二つの例では運が悪かっただけですが、結果を見て「間違ったプレイをしてしまった」と考えてしまう人がいます。

これらは極端な例なので「私はさすがにそんな間違った考え方はしませんよ」と思うかもしれませんが、現実ではもっとわかりにくいです。よくある例が「利益を出しているからこれは良い選択だ!」と考えてしまうことです。ある選択が利益を生むからと言って、一番利益を生む選択とは限りません。それに気づくには他の選択肢を試すか、どちらの期待値が高いか直接計算してみるしかありません。

ポーカーのシチュエーションは表が51%出る百円玉でコイントスの賭けをしているようなものです。コインを何回も投げ落として結果を観察すればその内に表が出やすいコインだと気づきますが、コインを分析して表が出る確率を正確に計算することができれば、その方が間違って裏に賭けることなく最初から表に賭けることができます。複数のアクションの期待値の差が小さければ小さいほど、何回もそのシチュエーションを経験することで正しい答えを導き出すことが難しくなりますが、数学的に正しい答えを求めるときは期待値の差は難易度に何の影響もありません。

結論としては、たくさんプレイすれば腕はもちろん上がりますが、ゲーム理論を通してなら何千回も同じ状況を経験しなくても数学的な答えが出せるのでもっと早く、確実に上達できます。

Part 2