++[ゲーム]【囚人のジレンマ】(「ゲーム理論の思考法」より)
[ゲーム]【囚人のジレンマ】(「ゲーム理論の思考法」より)
【ゲーム理論の基礎となる「囚人のジレンマ」】
[引用](p.46) ●ゲーム理論を学ぶうえで、最初に知っておくべきは「囚人のジレンマ」という【ゲーム構造】です。とても有名で代表的なゲームの一つです。
【囚人のジレンマ:ゲーム本文】
強盗をした二人の囚人(A[緑]とB[赤])が逮捕されました。しかし、有罪を確定するには証拠が不十分なので、警察はAとBをそれぞれ別の部屋に入れて、次のような取引を持ちかけます。(A・Bには同じ条件を提示する)
(1)君が自首して、相棒が黙秘したら、君は無罪にしてあげよう。(相棒は懲役3年)
(2)君が黙秘して、相棒が自白したら、君は懲役3年とする。(相棒は無罪)
(3)君と相棒の両方が自白したら、2人とも懲役2年とする。
(4)君と相棒の両方が黙秘したら、2人とも懲役1年とする。
強盗をした二人の囚人(A[緑]とB[赤])が逮捕されました。しかし、有罪を確定するには証拠が不十分なので、警察はAとBをそれぞれ別の部屋に入れて、次のような取引を持ちかけます。(A・Bには同じ条件を提示する)
(1)君が自首して、相棒が黙秘したら、君は無罪にしてあげよう。(相棒は懲役3年)
(2)君が黙秘して、相棒が自白したら、君は懲役3年とする。(相棒は無罪)
(3)君と相棒の両方が自白したら、2人とも懲役2年とする。
(4)君と相棒の両方が黙秘したら、2人とも懲役1年とする。
ゲーム本文を読んだ後に、この記事で始めに示した図(↑)を見てください。 囚人A・囚人Bは、それぞれ「自白か」「黙秘か」の選択をすることができるので、その結果は2×2=4通り。 その4通りの結果の内容は、囚人A・Bそれぞれが「懲役?年」を受けるかによって、その利益を「0,-1,-2,-3」と示してあり、「0は懲役0年(無罪放免)」を表し、「-3は懲役3年」を表す、といった【ルール】になっています。 表の各マスに書かれた数値は、左側の緑の数値が「囚人Aの利益(受ける懲役年数分の不利益)」を表し、右側の赤い数値も同様に、「囚人Bの利益」を表しています。 例えば、囚人Bが「黙秘」を選んだ場合、囚人Aにとっては「自白」と「黙秘」、どちらが「トク」か?? (1)囚人Aも「黙秘」を選んだ場合、囚人A・Bともに「懲役1年」となる。 (2)囚人Aが「自白」を選んだ場合、囚人Aは「懲役0年」、囚人Bは「懲役3年」となる。 ここで、↓次の図を見てください。
オレンジ色で塗った部分が、今説明した囚人A・Bの利益です。 それぞれの数値を比較すると、囚人A(緑)にとって、「どちらの選択が得か」をすぐに判断できます。 『囚人Bが黙秘したと仮定すると、囚人Aは「黙秘する(-1)よりは自白した方(0)が得」』という結論が出るので、緑の0に丸を付けておきます。 同様に、「囚人Bが自白した場合」を考えると、囚人Aは「黙秘する(-3)よりは自白した方(-2)が得」という結論が出るので、緑の-2に丸を付けておきます。 では次に、囚人Bの立場からも考えて見ましょう。 次の図(↓)を見てください。
今度は囚人Bが主人公です。 囚人Bも、Aとは別の部屋で取調べを受けているので、Aが「黙秘」「自白」のどちらを選択したかは分かりません。 【ゲーム本文】で与えられた【ルール】が分かっているだけの状態です。 では、もし、囚人Aが「黙秘」を選んだと仮定したら、囚人Bはどんな行動をとるべきでしょうか???(オレンジ色で塗った部分の”赤い数値”に注目してください。) (1)自分も「黙秘」⇒懲役1年。 (2)自分は「自白」⇒懲役0年。 よって、自白した方が有利なので”赤い0に四角印”を付けておきます。 同様に、囚人Aが「自白」を選んだ場合、 (3)自分は「黙秘」⇒懲役3年。 (4)自分も「自白」⇒懲役2年。 よって、自白した方が有利なので”赤い-2に四角印”を付けておきます。
以上より、囚人A・囚人B双方とも、「自白した方が有利」なので、「二人とも自白するマス」にはふたつの数値共に印がつきました。 【ゲーム本文】には、他の条件は示されていないので、この場合は「A・B二人とも自白する、という結果が予想される」、ということになります。 囚人A・囚人B双方とも、「(自分の利益のため)最善の行動を取り合っている」ので、ノーベル経済学賞を受賞したジョン・フォーブズ・ナッシュ[John Forbes Nash(Jr)]にちなんで『ナッシュ均衡』と呼ばれています。 表全体を見れば、「A・B両人が黙秘を選択」する方がお互いの利益が大きいことが分かりますが、「プレイヤー本人の立場」から見れば、二人は別々の部屋に入れられて相談することができないので、「各々自分の利益を計算した上で、二人とも”自白”を最善手として選ぶだろう」というのが今回の『ゲームの結論』=【予測】となります。
ジョン・フォーブス・ナッシュ・ジュニア(John Forbes Nash, Jr. 1928年6月13日 - )は、アメリカ人の数学者。専門分野はゲーム理論と微分幾何学。1994年、彼は他の二人のゲーム理論の専門家、ラインハルト・ゼルテン、ジョン・ハーサニとともにノーベル経済学賞を受賞した。また、ハリウッド映画『ビューティフル・マインド』は、彼の数学者としての偉業と成功及び後の統合失調症に苦しむ人生を描いた作品であり、このため世間での彼の知名度は高い。