HPO機密日誌

自己をならふといふは、自己をわするるなり。

繰り返し囚人のジレンマゲームと道徳感情とべき乗則

ブログは素晴らしい。自分では忘れてしまっている思考の後がたどれる。「徳の起源」を読んで、以前「人は原子、世界は物理法則で動く」を読んで学んだことを再発見できた。

本書の分析によれば、「スタンフォード監獄実験」において学生に囚人と看守を演じさせる実験が制御不能になったのは、狩猟採取の時代から、人は近くの人に大きな影響を受け、まねをするようにプログラムされているためだという。このために、反倫理的で長期にわたる集団秩序の維持とは矛盾する行動でも、周囲の人が行っているのを見ると影響され、簡単に受け入れ、自ら実行するようになるのだという。

人は人の欲しがるものを欲しがる。ゆえに、ボスニアでは7000人が処刑され、ルワンダでは100万人が虐殺された。 - HPO:機密日誌

人は原子、世界は物理法則で動く―社会物理学で読み解く人間行動

人は原子、世界は物理法則で動く―社会物理学で読み解く人間行動

「徳の起源」では、「人は原子」では詳細に触れていなかった繰り返し囚人のジレンマゲームの最強戦略について詳細に書いてある。

徳の起源―他人をおもいやる遺伝子

徳の起源―他人をおもいやる遺伝子

安冨先生の「貨幣の複雑性」の中で触れられていたアクセルロッドの「しっぺ返し戦略」が実際いかなるものであるかもよく分かった。山形浩生さんの批判もよくわかる。

時間がないので、結論を急いでしまえば、「前回成功すれば同じ戦略。失敗すれば別の戦略」をとる「パブロフ戦略」、もしくは「まぬけ戦略」が最終的な勝利者になったと「徳の起源」には記されている。これは、「人は人が欲しがるものを欲しがる」という人間の傾向に等しい。道徳的人間の間で育てられれば道徳的に人を尊重して生きるだろうし、マシンガンで敵を殺すことのみが美徳だと育てられれば人の命をごく軽いものとして扱うだろう。注意すべきはいずれも同じ人間に本来的にそなわった「道徳感情」いよって引き出され、強化されている行動である点だ。「人は原子」で紹介されたエピソードもそのことを裏付けている。

一定の空間に様々な戦略を持つ「個体」を配置し、「進化」させていくと、同じ戦略を持ち、互恵的関係になる「個体」のいわばコロニー、アリの巣ができた結果も報告されている、らしい。私の読み方が悪いのか、明確に書けない。「裏切り者戦略」、「タダ乗り戦略」の個体の侵入によって一時的に乱されることがあっても、安定するのは互恵的な「個体」群であったと。

私にできたのは繰り返し囚人のジレンマよりもはるかに単純なセルシミュレーションであった。しかし、べき乗則的に一定の傾向による「山」ができる様子を見れた。非互恵的なセルゲームでは、カオス的状況になるのも分かった。

しかも、べき乗則的な「山」の状態であっても、決して静的な状態なのではなく、常に「個体」が入れ替わっているダイナミックな過程の結果にすぎない。これは、「しっぺ返し戦略」、「パブロフ戦略」のコロニーも常に「裏切り者戦略」の侵入があることに相当するのかもしれない。

かくして、道徳感情を持つ人間が作る社会というものは、似た傾向、似た戦略を持つ集団がべき乗則的に、ダイナミックに形成されるので、道徳律、社会集団をお互いに大事にする互恵性がそこに普遍的に存在するという主張が、私には自然なものだと感じられる。そして、道徳感情が「利己的遺伝子」から導かれるという主張が本書の最大の主張だ。

あー、もっと時間が欲しい!今日はこれまで!