ゲーム理論まとめ｜ナッシュ均衡・囚人のジレンマ・支配戦略を図解で整理 | 中小企業診断士1次試験経済学・経済政策

コンビニ3社が同じような新商品を同じタイミングで出す理由って何だろう、とずっと気になっていた。調べてみると、ゲーム理論で説明できると知って——そこから利得行列・ナッシュ均衡・囚人のジレンマを一気に整理しました。

ゲーム理論とは、複数の意思決定者が互いの行動を意識しながら選択を行う状況を数学的に分析する手法です。企業の価格設定、国際交渉、軍事戦略など幅広い分野に応用され、診断士1次試験では寡占市場の分析ツールとして頻出です。

3要素プレイヤー・戦略・利得

ナッシュ均衡戦略的均衡の基本概念

頻出経済学・経済政策

ゲーム理論とは｜戦略的相互依存の分析

ゲーム理論は「自分の結果が相手の行動にも依存する」状況の分析です。まず3つの基本要素を押さえます。

プレイヤー

意思決定者

ゲームに参加する主体。企業・国家・個人などが該当します。複数のプレイヤーが互いの行動を意識して意思決定を行います。

例：企業A・企業B、囚人A・囚人B

戦略

取り得る行動の選択肢

各プレイヤーが選択できる行動の全集合。価格設定なら「高価格」「低価格」など、具体的な選択肢として列挙します。

例：高価格 / 低価格、協調 / 裏切り

利得

戦略の組み合わせで得られる結果

すべてのプレイヤーが戦略を選んだ結果として得られる利益・効用。利得行列に数値で表すことで分析が可能になります。

例：利益10億円、懲役1年

利得行列｜ゲームを表で整理する

利得行列は、各プレイヤーの戦略の組み合わせに対応する利得を一覧にした表です。（企業Aの利得, 企業Bの利得）の形式で読みます。

	企業B：高価格	企業B：低価格
企業A：高価格	（10, 10）	（2, 15）
企業A：低価格	（15, 2）	（5, 5）

ティール背景（10,10）＝高価格・高価格のとき双方が最も高い利得を得る組み合わせ。グレー背景（5,5）＝ナッシュ均衡（後述）。

利得行列の読み方

企業Aが低価格・企業Bが高価格を選ぶと、Aは15・Bは2の利得になります（右上セル→左の数字がA、右の数字がB）。
このように、2人のプレイヤーと2つの戦略があれば、組み合わせは2×2＝4パターンになります。

支配戦略とナッシュ均衡

支配戦略

相手の行動に関わらず常に有利な戦略

相手がどの戦略を選択しても、自分にとって常に利得が高くなる戦略を支配戦略といいます。

上記の例では、企業Aは相手がどう動いても「低価格」の方が利得が高い。
・B が高価格 → A：低価格15 > 高価格10
・B が低価格 → A：低価格5 > 高価格2

よって「低価格」がAの支配戦略。同様にBも「低価格」が支配戦略となります。

常に最善の選択肢

ナッシュ均衡

誰も単独で逸脱する誘因がない状態

すべてのプレイヤーが自分の戦略を一方的に変えても、利得が改善しない戦略の組み合わせがナッシュ均衡です。

上記の例では（低価格, 低価格）＝（5, 5）。
・A が単独で高価格に変えると 5→2（改善しない）
・B が単独で高価格に変えると 5→2（改善しない）

どちらも逸脱の誘因がないため、これがナッシュ均衡です。

支配戦略均衡はナッシュ均衡の特殊ケース

各プレイヤーの支配戦略を特定する

相手の各戦略に対して自分の最適応答を確認し、常に同じ戦略が最適なら「支配戦略あり」と判断する。

支配戦略の交点を確認する

全プレイヤーに支配戦略がある場合、その組み合わせが「支配戦略均衡」。支配戦略がない場合は次のステップへ。

ナッシュ均衡を確認する

各セルで「一方が単独で戦略を変えると利得が下がるか」をチェック。どちらも逸脱しない組み合わせがナッシュ均衡。

ナッシュ均衡は必ずしも全員にとって最善の結果ではないのが面白いところです。（高価格, 高価格）＝（10, 10）の方が双方の利得合計は高いのに、「裏切られるリスク」があるため誰もその状態を維持できず、（低価格, 低価格）＝（5, 5）に落ち着いてしまう。個人の合理性が全体最適を生まないことがある——という話でした。

囚人のジレンマ｜合理的行動が非効率を生む

囚人のジレンマは、ゲーム理論の最も有名な応用例です。2人の囚人が別々に尋問され、黙秘するか自白するかを選択します。

	囚人B：黙秘	囚人B：自白
囚人A：黙秘	両者：懲役1年	A：懲役10年 B：無罪
囚人A：自白	A：無罪 B：懲役10年	両者：懲役5年

ティール背景（両者黙秘）＝全体最適。グレー背景（両者自白）＝ナッシュ均衡（支配戦略均衡）。

各囚人の支配戦略

「自白」が支配戦略

Bが黙秘 → Aが自白なら無罪（黙秘なら1年）
Bが自白 → Aが自白なら5年（黙秘なら10年）

Bの行動を問わず、Aは「自白」の方が常に刑期が短い。同様にBも「自白」が支配戦略。
→ ナッシュ均衡：両者自白（懲役5年）

支配戦略均衡＝ナッシュ均衡

社会的含意

個別合理性が社会的非効率を生む

「両者黙秘（懲役1年）」が全体利益は最大。しかし互いの合理的行動の結果、「両者自白（懲役5年）」に落ち着いてしまいます。

カルテルの崩壊：協調して高価格を維持した方が双方有利でも、抜け駆けの誘因がある。
軍備競争：互いに軍縮した方が安全・経済的でも、相手の増強リスクで競争が続く。
共有地の悲劇：環境資源の過剰利用・CO₂排出削減交渉の困難さにも同じ構造が。

個別合理的 → 社会的非効率

繰り返しゲームと協調の可能性

1回限りゲーム

合理的プレイヤーは裏切る

ゲームが1回きりであれば、将来への影響がないため支配戦略に従って行動するのが合理的です。相手も同様に行動するため、ナッシュ均衡（社会的非効率）に収束します。

協調は維持されない

繰り返しゲーム

将来の利得が協調を支える

無限回または終了時点が不確定な繰り返しゲームでは、将来の利得を割り引いた総和を最大化しようとします。「今裏切って短期利得を得ると、以後ずっと報復される」という計算が成り立てば、協調がナッシュ均衡になりうるのです。

フォーク定理：協調が均衡に

しっぺ返し戦略（Tit-for-Tat）

コンピュータ・トーナメント実験で最も成績がよかった戦略として知られます。

ルール：初回は協調、2回目以降は「前回の相手の行動」をそのままコピーする。
・相手が協調 → 次も協調
・相手が裏切り → 次は報復（裏切り）

応用例：コンビニの価格競争（値下げしたら追随）、OPEC加盟国の産油量調整、国際貿易交渉の報復関税。繰り返し関係があるほど、しっぺ返し戦略が協調を支えます。

過去問で確認する

ゲーム理論のナッシュ均衡に関する記述として、最も適切なものはどれか。

ア　ナッシュ均衡はすべてのプレイヤーにとって最も高い利得をもたらす状態である
イ　ナッシュ均衡では、いかなるプレイヤーも単独で戦略を変更しても利得を改善できない
ウ　すべてのゲームにおいてナッシュ均衡は唯一存在する
エ　支配戦略均衡はナッシュ均衡よりも広い概念である

正解：イ　／　解説

ア→ナッシュ均衡は必ずしも全体最適ではない（囚人のジレンマの「両者自白」が反例）（×）。ウ→ナッシュ均衡は複数存在することがある（×）。エ→支配戦略均衡はナッシュ均衡の特殊ケース（より狭い概念）であり、「支配戦略均衡ならばナッシュ均衡」が成立するが逆は成立しない（×）。正解はイ。ナッシュ均衡の定義そのもの——「どのプレイヤーも単独で逸脱する誘因がない」状態です。

囚人のジレンマに関する記述として、最も適切なものはどれか。

ア　囚人のジレンマのナッシュ均衡は両者が協調する結果である
イ　両プレイヤーの支配戦略は「黙秘」である
ウ　囚人のジレンマでは、個別合理的な行動の結果、社会的に非効率な結果が生じる
エ　囚人のジレンマは1回限りのゲームでのみ発生し、繰り返しゲームでは生じない

正解：ウ　／　解説

ア→ナッシュ均衡は「両者自白（懲役5年）」であり、協調（両者黙秘）は均衡にならない（×）。イ→支配戦略は「自白」。黙秘は支配戦略ではない（×）。エ→繰り返しゲームでもゲーム構造自体は囚人のジレンマとして存在するが、将来の利得を考慮することで協調が維持されやすくなる（×）。正解はウ。個々の合理的行動（支配戦略）の帰結が社会的に非効率な結果（「両者自白」）になること——これが囚人のジレンマの本質です。

まとめ

ゲーム理論理解チェックリスト

ゲーム理論の3要素はプレイヤー・戦略・利得。利得行列で（A の利得, B の利得）の形式で整理する。
支配戦略は相手の選択に関わらず常に自分に有利な戦略。全員に支配戦略があるとき、その交点が「支配戦略均衡」。
ナッシュ均衡は「単独で逸脱しても利得が改善しない」状態。支配戦略均衡はナッシュ均衡の特殊ケース（逆は成立しない）。
囚人のジレンマ：個別合理的な支配戦略（自白）を取った結果、社会的非効率（懲役5年）が生じる。カルテル崩壊・軍備競争・共有地の悲劇に応用される。
繰り返しゲームでは将来利得が加味され、しっぺ返し戦略などにより協調がナッシュ均衡になりうる。コンビニ価格競争・OPECに応用。

Uのメモ

最初は「ナッシュ均衡＝全員が最善策を取っている状態」と勘違いしていました。でも囚人のジレンマを見ると、個別合理性のぶつかり合いが全体非効率を生む——という構造がはっきりわかります。「なぜカルテルは崩れるのか」「なぜ軍縮は難しいのか」が同じ1枚の利得行列で説明できる。過去問では「ナッシュ均衡の定義」と「支配戦略均衡との関係（広い・狭いのどちらか）」を問うパターンが多いので、ここを確実に押さえておく必要があります。