ゲーム理論・ナッシュ均衡 | 中小企業診断士1次試験 経済学・経済政策

U

「コンビニって、なぜ同じ交差点の角に2店舗並んで出店するのでしょう?」——この疑問を解くのがゲーム理論です。過去問で「ナッシュ均衡」という言葉が出てきたとき、利得行列が読めれば一瞬で解けるとわかって、急に好きになりました。今回は囚人のジレンマからビジネス応用まで、整理してみます。

この記事でわかること
・ゲーム理論とは何か(なぜ経営に使うのか)
・利得行列の読み方とナッシュ均衡の見つけ方
・支配戦略・囚人のジレンマ・協調ゲームの違い
・繰り返しゲームとトリガー戦略
・診断士1次試験での出題パターンと解法
目次

ゲーム理論とは:「相手の行動を読んで自分が動く」世界の分析

基本概念

通常の経済学では「他のプレイヤーの行動は自分に影響しない(完全競争市場)」と仮定します。でも現実のビジネスでは、自分の選択が相手の結果に影響し、相手の選択が自分の結果に影響する場面が多い。値下げ競争、広告戦略、交渉——全部「相手の出方次第」ですよね。

ゲーム理論は、こうした相互依存的な意思決定の状況(ゲーム)を数学的に分析する理論です。1994年のノーベル経済学賞を受賞したジョン・ナッシュが発展させた「ナッシュ均衡」が中心概念として知られています。

プレイヤー
意思決定する主体。企業・個人・国家など。2人(企業A・B)が基本形。
戦略
プレイヤーが選べる行動の選択肢。「値下げする/しない」「広告を打つ/打たない」など。
利得(ペイオフ)
各プレイヤーの戦略の組み合わせで決まる結果(利益・効用)。利得行列で表現する。

利得行列の読み方:2×2の表を攻略する

利得行列

利得行列(ペイオフマトリクス)は、2人のプレイヤーの戦略の組み合わせごとにそれぞれの利得を整理した表です。各セルの数字は「(行プレイヤーの利得, 列プレイヤーの利得)」の順で書かれます。

企業B
値下げする 値下げしない
企業A:値下げする (3, 3)
★ナッシュ均衡
(6, 1)
企業A:値下げしない (1, 6) (5, 5)

(例)価格競争の利得行列。数値は各社の利益(億円)

読み方の手順:
① 企業A(行)の立場で考える:「Bが値下げするなら、Aは値下げした方が良い(3>1)」「Bが値下げしないなら、Aは値下げした方が良い(6>5)」
② どちらの場合も「値下げする」が有利→Aの支配戦略は「値下げする」
③ 同様にBも「値下げする」が支配戦略
④ 結果:(値下げ, 値下げ)=(3,3)がナッシュ均衡(一方が動くと損をする状態)

注目すべきは、(値下げしない, 値下げしない)=(5,5)の方が両社にとって良いのに、独立して合理的に行動すると(3,3)に落ち着いてしまうことです。これが「囚人のジレンマ」の構造です。

ナッシュ均衡と囚人のジレンマ:なぜ「最善」を選べないのか

ナッシュ均衡とは
定義:各プレイヤーが相手の戦略を所与として、自分の戦略を変える誘因がない状態
特徴:必ずしも「全員にとって最良」の結果ではない。「誰も一方的に動けない」均衡点
存在:ゲームにはナッシュ均衡が1つ以上存在することがナッシュの定理で証明されている
囚人のジレンマとは
定義:両者が協力すれば最良だが、独立して合理的に行動すると最悪な結果になるゲーム
特徴:「裏切る(競争する)」が支配戦略→ナッシュ均衡は(裏切る, 裏切る)
現実例:価格競争・軍拡競争・環境問題(温暖化対策)・広告費競争
囚人のジレンマが生まれる条件:
① 各プレイヤーに「裏切り(競争)」が支配戦略として存在する
② でも両者が「裏切り」を選ぶと、全員協力した場合より悪い結果になる
③ 1回きりのゲームでは協力が成立しないが、繰り返しゲームでは協力が維持できる場合がある
U

囚人のジレンマは、コンビニの価格競争やガソリンスタンドの値下げ合戦に重ねて考えると「あるある!」となりますよね。お互い値下げしなければ両社とも儲かるのに、相手が値下げしたら自分だけ損するのが怖くて、結果的にみんな値下げしてしまう。まさにジレンマです。

繰り返しゲームとトリガー戦略:なぜ協力が生まれるのか

繰り返しゲーム

1回きりのゲームでは「裏切り」が合理的でも、同じプレイヤーと何度もゲームを繰り返すと話が変わります。

戦略の種類内容特徴
トリガー戦略
(引き金戦略)
最初は協力し、相手が一度でも裏切ったら永久に報復(非協力)する戦略 厳しいが効果的。「一度裏切ると永遠に敵対される」という脅しで協力を維持
しっぺ返し戦略
(Tit for Tat)
最初は協力し、前回相手がとった行動をそのまま真似る戦略 「やられたらやり返す・協力には協力で返す」。現実的で長期協力を維持しやすい
常時協力戦略 常に協力を選び続ける 相手に搾取されるリスクがあり、非合理的になりうる
繰り返しゲームの重要な含意:「ゲームが無限に続く(または終わりが不確実)」場合、協力が合理的な均衡として成立します。これが長期的なビジネス関係・業界内の暗黙の協調が成立する理由のひとつです。

コーディネーションゲームと協調の失敗

囚人のジレンマとは逆に、お互いが同じ選択をすることで利得が大きくなるゲームもあります。これを「コーディネーションゲーム(協調ゲーム)」といいます。

企業B
規格Xを採用 規格Yを採用
企業A:規格Xを採用 (10, 10)
★均衡①
(0, 0)
企業A:規格Yを採用 (0, 0) (10, 10)
★均衡②

業界規格の標準化問題(例:VHS vs Betamax)

このゲームにはナッシュ均衡が2つあることがわかります。どちらの均衡も「同じ規格を採用する」ですが、問題は最初にどちらへ収束するかが不確実なことです。歴史的なVHS vs Betamaxの規格争いがよく例として挙げられます。

ゲーム理論のビジネス応用例

ビジネス応用
ビジネス場面ゲームの構造均衡・含意
価格競争 囚人のジレンマ型。値下げが支配戦略だが、全員値下げでは利益が低下 繰り返しゲームで協調価格(暗黙の協調)が維持されることも
業界標準化 コーディネーションゲーム。同じ規格を選ぶと双方に利得 先行者利益・ネットワーク効果で一方の規格に収束する傾向
広告費競争 囚人のジレンマ型。広告を打つのが支配戦略だが、全員打つと効果が相殺 タバコ業界でのCM禁止が「協力均衡」への政策的介入として分析される
交渉・入札 情報の非対称性が関係。相手の「最低ライン」を読んで提示価格を決める コミットメント(拘束力のある約束)で交渉力を高められる

診断士1次試験の出題パターン

試験対策
出題論点ポイント・引っかけ
ナッシュ均衡の特定 利得行列が与えられ、「どのセルがナッシュ均衡か」を問う。「各プレイヤーが一方的に動く誘因がない」セルを見つける
支配戦略の有無 「相手の戦略に関わらず常に有利な戦略(支配戦略)があるか」を問う。囚人のジレンマでは両者に支配戦略がある
囚人のジレンマの判別 「この利得行列は囚人のジレンマか」。両者が協力する均衡が個人の合理性と相反するか否か
繰り返しゲームの効果 「繰り返しゲームで協力が維持される条件」「トリガー戦略の意味」を正誤で問う
選択肢の引っかけ 「ナッシュ均衡は必ず1つ」(×→複数ある場合もある)「ナッシュ均衡はパレート最適である」(×→必ずしもそうでない)

まとめ

  • ゲーム理論は「相手の行動が自分の結果に影響する」状況の分析。利得行列でプレイヤー・戦略・利得を表現
  • ナッシュ均衡:各プレイヤーが相手の戦略を前提に、自分の戦略を変える誘因がない状態(複数ある場合も)
  • 囚人のジレンマ:裏切りが支配戦略だが、全員が裏切ると協力より悪い均衡になる構造
  • 繰り返しゲームでは、トリガー戦略・しっぺ返し戦略により協力均衡が維持される場合がある
  • 試験では利得行列からナッシュ均衡を特定する問題と、囚人のジレンマの正誤判定が頻出
Uのメモ
利得行列を見たとき、「行プレイヤーがどちらの戦略を選んでも、列プレイヤーは同じ選択が最善→支配戦略あり」という確認が素早くできると、設問に迷わなくなります。「ナッシュ均衡は必ずしも社会的最適ではない」「繰り返しゲームで協力が成立しやすい」という2点は、正誤問題で必ず出てくる頻出ポイントです。
よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

中小企業診断士試験勉強中のアラフィフシングルマザーです。
大学卒業後から現在まで、数々の失敗をしながらずっと自営業として試行錯誤を重ねてきました。
もっときちんと経営やビジネスの知識を身につけて、将来は他の事業者の方のお役にも立てたらいいな、と思うようになり、中小企業診断士の試験に挑戦中です。

目次