HPO機密日誌

自己をならふといふは、自己をわするるなり。

囚人ゲーム、チキンゲーム、タカハトゲーム

プログラムが落ち着いてきたので、いくつかバリエーションを試してみた。

囚人ゲームのバリエーションをいくつか考えてみた。まず「囚人」の戦略を、赤の「裏切者」、緑の「お人好し」(常に信頼)、青の「過去に拘る」(一定数負けが混むまで信頼、負けかかると裏切り)、薄青の「前回に拘る」(前回勝てば信頼、負ければ裏切り)、薄緑の「ランダム」(3分の1の確率で裏切る)の5つのタイプと変更した。「裏切者」以外は特別に大きな差があったようには見えなかった。「対戦」したあとは「裏切者」を覚えるという設定にすれば、また違った結果がでるかもしれない。これは今後の私のプログラミングの課題としたい。

- Prisoner Game 03 - YouTube

当たり前だが、名前の通り「囚人」であることは大切だ。強調しても、得るものはない。失うものを減らすことができるだけの状況なのだ。シミュレーションの画面を見ていて、あらためてこれを感じた。実際、双方が信頼する場合で無理矢理に多少プラスの報酬を得るように設定していたが、現実にあわせてこれを「−1/−1」にしただけで、いくつかできていた「コロニー」が全く形成されなかった。ま、協力しても得るものがないのだから当たり前。取引すればするほど、「死亡」しやすくなる。

- Prisoner Game No Cooperation - YouTube

双方信頼を「1/1」にした時と見比べるとその差はあきらかだ。ちなみに、ここを「2/2」、「10/10」などとしてみたが、あまり様子は変わらなかったように想う。双方信頼の報酬が高いと、若干、赤のセルの「裏切者」を「コロニー」が「養う」ようにもみえる現象が多少起きたように観察された。

次に、囚人のジレンマゲームのバリエーションをWikipediaで探してみた。まずは、「エデンの東」(東のエデンではないよ)で有名なチキンゲーム。自動車を真っ向から運転してどちらが先に降りるかというあれだ。もちろん、おりなければ両方とも正面衝突するだけ。

キンゲームは、交渉における重要な基本原理であり、譲歩する猶予が与えられた各プレイヤーの戦略として記述される。そして双方のプレイヤーの少なくとも一方が譲歩しない限り、悲劇的な結末は避けられない。

スクリーンショット 0026-01-05 21.45.06

チキンゲーム - Wikipedia


この場合、特徴的なのが「裏切者」は生き残れないということだ。もっとも自動車のチキンゲームの場合、最後まで降りないということを意味するので、この場合は「裏切者」というより「蛮勇」とでも呼ぶべきなのだろうが。いずれにせよ、ゲーム理論上の「双方裏切」は圧倒的な被害をもたらす。ちなみに、いくつかのサルの集団で見られる若いオスが群れを追い出されるが、リーダーにリベンジして返り咲くケースなどはこれに近いのかもしれない。

もうひとつWikipediaに載っていた「タカハトゲーム」も試してみた。

まず二人のプレイヤーそれぞれが求めている資源(食料、配偶相手など)を同時に見つけたと仮定する。双方は攻撃的なタカとして振舞うか、温和なハトとして振舞うかを決定する。もし双方のプレイヤーがタカ戦略を選択した場合、資源を奪うために戦い傷つくために双方の点数はマイナスである。一方がタカ戦略を選択し、もう一方がハト戦略を選択した場合、タカ戦略が資源を独占するが、ハトは速やかに逃げ出すために何も失わない。双方のプレイヤーがハト戦略を選択した場合、しばらく威嚇しあった後に資源を対等に分け合うと仮定する。

Eagle-Pision Game

チキンゲーム - Wikipedia

これは双方裏切りでないと、「被害」が出ないので、「コロニー」に寄生する「裏切者」が多く見られた。

- Eagle Pigion Game - YouTube

この状態は、マット・リドレーの「徳の起源」に書かれた「フリーライダーに寛容な人間の集団」というのに近いのかもしれない。いくつかの事例をあげて、リドレーは人間の集団が狩りの分け前を寛容に配分することがいかに「利己的遺伝子」に適合するかを立証していた。

徳の起源―他人をおもいやる遺伝子

徳の起源―他人をおもいやる遺伝子

ま、そもそもこのプログラムを組む直接の動機は本書を読んで、紹介されているシミュレーションをやってみたくなったからなのだから、適合するのは当たり前といえば、あたりまえなのだが。