現在、ゲーム理論はポーカーの世界でちょっとしたブームを起こしていて、特にテキサスホールデムではトッププレイヤーの戦略の改善方法の最先端にあると言えます。ポーカーに関するゲーム理論の基本的な知識が広がりつつある中、最適戦略を計算するソフトの正確さや計算が可能な範囲も広がっています。日本のポーカー界ではゲーム理論がまだあまり普及していませんが、本当に上達したいと思っている人にとってゲーム理論は学ばなければついて行けなくなってしまう存在になりつつあります。
しかし、そもそもゲーム理論やGTOとはいったい何なのかと思っている方が多いんじゃないかと思います。PTJPのビデオで出てくるピオソルバー(PioSOLVER)というソフトもありますが、それで計算している戦略は具体的にどういう意味で最適なのか。
そこで、今回はゲーム理論の基礎を説明したいと思います。
ゲーム理論は数学の分野の一つで、ポーカーでもっとも役に立つゲーム理論の概念はナッシュ均衡というものです。ナッシュ均衡は以下の条件を満たす全プレイヤーの戦略の組み合わせです:
*それぞれのプレイヤーが他のプレイヤーの戦略を知っている
*それぞれのプレイヤーが他のプレイヤーの戦略に対して期待値を極大化している(又は)どのプレイヤーも自分の戦略を変えることで期待値を上げることができない
もう少し分かりやすく説明します。AさんとBさんがポーカーをしています。AさんはBさんのプレイを観察していく内にBさんの戦略を把握します。その戦略を搾取すべく、Aさんは自分の戦略を変えます。しかし、時間が経つとBさんはそれに気づき、Aさんの戦略を搾取するように自分も戦略をアジャストします。このように戦略の調節を行っているうちに、もう調節してもお互いに何も得るものがない戦略で安定します。現在の戦略から逸れる動機がない組み合わせに達したら、それがナッシュ均衡です。
実際はプレイヤーがお互いの戦略を知っていることなんてあり得ないのだから、ナッシュ均衡なんて役に立たないと思う人もいるかもしれません。しかしポーカーを含む2プレイヤーのゼロ和ゲームのナッシュ均衡にはある特性があります。相手がどんな戦略を使おうと、ナッシュ均衡は一番高い最小限の期待値を保証します。ナッシュ均衡以外の戦略は、それに対してナッシュ均衡が保証する期待値以下の期待値にされてしまう相手のカウンター戦略が存在します。ヘッズアップの場合、このナッシュ均衡の特性が有効であるには相手の戦略を知る必要も、相手が自分の戦略を知る必要も一切ありません。
ちなみに、ナッシュ均衡に沿ったプレイを英語で俗にGTO(game theory optimal)と言います。「このプレイはGTOだ」、「それはGTOに反している」などのように使えます。