囚人のジレンマについて教えてください!

このエントリーをはてなブックマークに追加
1超初心者もいいとこ
囚人のジレンマ・ゲーム(しっぺ返し戦略・統制条件)で予想される結論って何なんですか?
というより、予想つけられるんですか?
全員が全員協力するわけやないはずなのに・・・
ほんとわけわかんないです!知りたくても何の資料も手元にない!
夜が明けないうちに知りたいんです!お願いします!
とりあえず詳しく説明してみ?
3名無しさん@お腹いっぱい。:02/05/05 06:24
非協力ゲームにも、最大利益を上げる結論ってあるらしい。
映画の「ビューティフル・マインド」とか参考になるかも。
4XYZ:02/05/05 15:00
宿題か?
5名無しさん@お腹いっぱい。:02/05/05 22:03
>>1
夜が明けてまた夜が来たから手遅れかも知れないが,
とりあえずここへ逝ってみてごらん。

An Introduction to Game Thoery
http://www.geocities.co.jp/WallStreet-Bull/6161/
6超初心者もいいとこ:02/05/06 00:09
おおっ。
ちょっと見てみますー。
ありがとです。
はい。宿題です。
実験はしたけど、失敗したのです。
二人の囚人が、窓から外を見た。
一人は星を見た。一人は泥を見た。
>>7 ジョジョ?

2人のギャングA,Bが逮捕され、刑務所に拘留されている。2人は互いに話をしたり、
メッセージを交換したりすることが絶対にできない状態で、独房に入れられている。
警察は、2人を重罪で有罪にするだけの十分な証拠は持っていない。
そのため、別の罪で、ともに一年の禁固刑に処す意向を持っている。
警察は同時に、二人の囚人に次のような取引をもちかける。


相手に不利となる証言をすれば釈放する。ただしその相手は5年の禁固刑
に処せられる。
両方が相手に不利となる証言をした場合は、2人とも3年の刑となる。
両方が相手に不利となる証言をしなかった場合は、証拠不十分で二人とも
1年の刑となる。

2人の囚人は考える時間をほんの少しだけ与えられるが、自分が最終的な結論を
下すまでは、相手がどう決めたかを知ることは決してできない。ともに、相手も
同じ取引を持ちかけられていることをしらされている。
2人とも自分の刑期をできるだけ短くすることしか考えていない。

まぁ、オールオアナッシングよりも50/50を選択するってこと

9名無しさん@お腹いっぱい:02/05/06 00:30
>>6
いずれにせよ1に書いてる情報だけじゃ詳しい話は
できないね。一回限り?繰り返しあり?後者の場合、
有限回?無限回?合理的人間を仮定するの?2人とも
しっぺ返し戦略を使う場合、何が起こるのかを予測したいの?

もし2人が「厳密に」しっぺ返し戦略を取っているならば、
単に協力−協力が続くだけよ。だって定義により
「最初は協力。それ以降は相手の前回の手をそのまま
繰り返す」から。

10XYZ:02/05/06 00:31
ごめん。俺がバカだったビローン
11名無しさん@お腹いっぱい:02/05/06 00:32
>>10 ???
12名無しさん@お腹いっぱい。:02/05/06 00:53
帝京大学?
13名無しさん@お腹いっぱい。:02/05/06 00:58
心理学で囚人のジレンマの実験とかやったりするの?
昔、似たようなことを政治学の授業でやったことがあったけど…
やっぱり、成績評価を賭けての勝負なのかな
14XYZ ◆rdoLtdew :02/05/06 00:59
>>11
ああ,すまんすまん.>>10はオレを騙るクズだ,
しゃぁねぇし,当分トリップつけるわ.
15PPP:02/05/06 01:06
>>14
もっと個性的で面白ぇ対応できねぇのかよ。
トリップつけるくらいならサルでもできるぜ。
16名無しさん@お腹いっぱい。:02/05/06 01:08
>>14
ホントだよ。もっと頭つかえYO!
17XYZ ◆rdoLtdew :02/05/06 01:15
学部レポートなら,絶対有利な戦略,ナッシュ均衡,アクセルロッドの実験
あたりを絡めればレポートの1本くらいすぐだろ.
……って,ここまで書いたが>>5のサイトにほとんどすべて書かれてあった
ことに気がついて鬱.
18XYZ:02/05/06 01:17
>>15
ん?酔っ払った頭では,芸のある対応ができんなあ.
ちと考えてみるわ.
19ロボ ◆iROBOsc. :02/05/06 01:23
トリップにも個性。
などと言ってみる実験

20XYZ ◆XYZ/EQlg :02/05/06 02:26
しかし,Game Thoeryと心理学って,そんなに相性良いのかな?
心的力動を数値解釈するのに有効な気もするんだけど,あまり心理系で
派手に取り上げられているのを見たことない気がする.
囚人のジレンマというと,心理学の実験系基礎教育のなかでは,
Bランクくらいの準必須アイテムですね。
22名無しさん@お腹いっぱい。:02/05/06 15:04
俺は50人くらいのクラスの概論の講義で
デモンストレーション実験をやったことがあるよ。
ナンバーを振った2色のカードを配り,
同じ番号の異なる色のカードを持ったもの同士が2人の囚人であるという想定で
相手もわからず交渉もない状態で自白か否認かの選択をカードに書かせる。
番号順にそれぞれの選択を答えさせていくと,
共貧に陥る組が結構出てきて面白いよ。
コミュニケーションの重要性に気づかせるという教育的効果もある。
23名無しさん@お腹いっぱい。:02/05/06 15:21
>>22
同じクラスの気心の知れたメンバーでやる場合と
寄せ集めた被験者集団でやる場合では結果が違ってくるだろうね。
心理学者はゲーム理論が捨象している外的要因の影響など
合理と非合理の界面に興味があるのよ。
だからこの分野はゲーム理論ではなくゲーム・モデルと呼ばれる。
24名無しさん@お腹いっぱい。:02/05/06 15:36
アクセルロッド主催のコンテストで最強だった
しっぺ返しプログラムの作成者ラパポートは心理学者だよね?
25名無しさん@お腹いっぱい。:02/05/06 21:55
ゲーム理論の実験てさ、何も賭けてないと
各プレーヤーが自分の得点を最大にしようと行動してくれないのでは?
タルいから適当にやる、というのはともかくとして、
協調ばかりだと馬鹿みたいなので裏切りを狙う人も多そうだし。
耳を賭けろ、とは言わんがせめて金ぐらい賭けないと。
26名無しさん@お腹いっぱい。:02/05/06 22:56
最初に被験者に実験の謝礼をあげてから,
その金でゲームさせる,という研究をよく
みるような気がします。
27名無しさん@お腹いっぱい。:02/05/07 02:16
>>26
それだと結局ゼロ和ゲームになってしまうような気が…
でも、実際に謝礼を増減させたらタイーホだろうしな
日本じゃなきゃできるか?
28名無しさん@お腹いっぱい。:02/05/11 02:53
なんか面白いネタはないかな。
29名無しさん@お腹いっぱい。:02/05/11 03:07
じゃあ、
2chのジレンマについて考察してみてください。
30名無しさん@お腹いっぱい。:02/05/11 12:51
http://yasai.2ch.net/psycho/kako/993/993457948.html
もうあの頃の常連は戻って来ない…逝っとけ
>>27
やり方しだいだろ。
32XYZ:02/05/14 16:34
>>30
そのスレは,タイトルこそ囚人のジレンマだが,内容は3囚人問題だという罠.
あああぁ やっとツッコミいれてくれる人を三日も待った…
と言ってみるテスト
34名無しさん@お腹いっぱい。:02/05/18 14:36
アクセルロッドのしっぺ返し戦略についての本で「協力」の選択をとるグループが混ざると、
そのグループが最強、みたいなことが書いてあったと思うんだけど、
それを職場に当てはめてみてもホーソン実験にあるように同じグループ内での協調が
大切だということがわかる。
でも、グループ内での協調、集団への帰属意識を大切にするのは第二次世界大戦の
日本やドイツみたいな負け組に良くみられる。
もちろんそれだけが敗因じゃないってことはわかるんだけど、
現代においても負け組ほど集団内の協調を大切にして、能率が大して良くないのに対し
勝ち組は必ずしも各個人の忠誠心は高いといえないにもかかわらず、
管理システムが洗練されてて強い。
これは何故だろう?なんか関連がありそうな気がするんだけど。
35名無しさん@お腹いっぱい。:02/05/18 14:46
>>1
本屋いけば、いろんなゲーム理論についての本ありますよ。
文庫もあるし、
36名無しさん@お腹いっぱい:02/05/18 17:04
>>34
山岸俊男の本を読めや。答えは全部彼の本のなかにあるぞ。
37名無しさん@お腹いっぱい。:02/05/18 18:32
なぜゲーム理論での「協調」が
現実での「協力」に当たるのか分からんのだが。
その辺をはっきりさせずに現実に適応してもねえ。
武藤滋夫著
[経済学入門シリーズ]
『ゲーム理論入門』
日本経済新聞社
39名無しさん@お腹いっぱい。:02/06/03 19:34
マトモスレあげ。
40名無しさん@お腹いっぱい。:02/06/03 22:47
現実でこういう状況ってある?
41名無しさん@お腹いっぱい。 :02/06/04 00:51
怪しい自己啓発セミナーが
囚人のジレンマに似たやつ使うんだよなー確か。
いや、あれは非ゼロ和じゃないんだっけか。
進化ゲーム論的アプローチでは
結局どの戦略が生き残るかは初期条件で決まる。
だから「しっぺ返し=最強」であるとは即座には言えない。
当たり前のことだが。
43没個性化されたレス↓:02/07/08 20:48
a
44没個性化されたレス↓:02/08/22 04:03
保全しておく。
>>42
まず「均衡」、「侵入」、「安定均衡」の3つの違いを知るべし。
46没個性化されたレス↓:02/10/27 06:29
age
47没個性化されたレス↓:02/11/04 21:56
もう一花咲かせましょう。
48没個性化されたレス↓:02/11/04 23:38
これは経済学じゃないの?
49没個性化されたレス↓:02/11/04 23:42
心理学者がノーベル経済学賞取る時代に
なに言ってんだか。
50没個性化されたレス↓:02/11/04 23:56
経済学者が人間を使って実験やってる時代に
なに言ってんだか。
51名無しさん:03/01/02 18:53
        / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄\
Λ_Λ  | 君さぁ こんなスレッド立てるから          |
( ´∀`)< 厨房って言われちゃうんだよ             |
( ΛΛ つ >―――――――――――――――――――‐<
 ( ゚Д゚) < おまえのことを必要としてる奴なんて         |
 /つつ  | いないんだからさっさと回線切って首吊れ     |
       \____________________/

(-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ…
(∩∩) (∩∩) (∩∩)

(-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ…
(∩∩) (∩∩) (∩∩)

(-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ…
(∩∩) (∩∩) (∩∩)
>>51
なぜ煽りながら、沈んでたスレを
ageるのかな?
53山崎渉:03/01/06 23:57
(^^)
54177:03/01/10 20:02
PDよりもNPDです。
教えて下さい……と書きつつ、来る時に備えて保全。
56ステ助:03/02/03 00:15
NPDまで行き着けない罠(独り言・・。

推移確率行列とか定常分布やらも調べはじめたら、
そーいえば行列や確率ってどんなだっけ?と記憶呼び起こす為に
高校数学まで戻ってしまった罠。

高校時代の自分に会えたなら、数学ちゃんとやっとけと小一時間(略
57177:03/02/03 01:05
その辺なら小一時間勉強すればなんとかなると小一時間
58ステ助:03/02/03 23:29
ガ━━━(゚Д゚;)━━━ン

一々証明しなければ気になってしまい公式が使えない。
しかし全部証明できる程の頭もない。
数学の貧者の悲劇でつ……。
試験前にしぶしぶ公式を暗記し、気持悪いながら使いますた…。
試験中も空き時間に、空きスペースに証明始めたりして。。
当然その後は忘れてしまいますた(涙。

と愚痴をたれる前に、数学やり直せと小一時間言われそ(略。
59177:03/02/03 23:52
でも証明をしようとするのはとてもよいことです。
60177:03/02/09 21:22
とりあえず、ここはゲーム論関連の質問スレってことにしましょう。
61ステ助:03/02/09 23:53
今ハケーンしますた。
お願い致します…(涙。
62177:03/02/09 23:59
ども。このスレも活用しましょう。
63ステ助:03/02/10 00:17
高校数学から戻っているのでつが(汗
分からない点あったらマターリ質問させて頂きやす(涙。
ところで祝新スレ。
トリップお願いしてみますたw
上手くできたかしら・・
64ステ助:03/02/10 00:17
高校数学から戻っているのでつが(汗
分からない点あったらマターリ質問させて頂きやす(涙。
ところで祝新スレ。
トリップお願いしてみますたw
上手くできたかしら・・
65177 ◆rBWlMpeA6. :03/02/10 00:19
つけてみますた。
66ステ助:03/02/10 00:30
ありがとうございまつ(ニコリ。
これで探しやすくなりますたw
(ストーカーに非ず 汗)
新しいスレ期待大でつ。
67ステ助:03/02/10 22:42
学習とゲーム理論スレ、行動厨さん、190氏も入っていい感じに
なってきますたね。
まずは多分野のモデルや用語の刷り合わせ大変そぉですが、
オペラント心理学とゲーム理論の相性はかなーり良さそう…。

時間が空いたらまたーり教えて頂きたいのでつが、これなのでつ。。↓

---------------------------------------------------------------
779 :177 :03/02/09 11:02
>>775
見定め戦略(A戦略)とブルジョア戦略(B戦略)のダイナミクスは
次のようになります。仮に資源の価値4、闘争のコスト6、として
利得行列を書くと

  強者\弱者 | A     B  
 −−−−−−−−−−−−−−−−−−−
      A   |4,0  1.5,-3.5
      B   |3,1  2,2

となります(先着・後着は強さと独立、強いほうは確率3/4で勝つと仮定)。
strict Nash均衡は(A,A)と(B,B)なのでこれらがいずれも
レプリケーターダイナミクスの漸近安定点になります。
ただし、収束の流域面積は(A,A)の方が広いので、強いほうも
弱いほうも見定め戦略を採る見定め卓越型社会の方が一般には
生じやすい・・と。
----------------------------------------------------------
68ステ助:03/02/10 22:42
基本的なところから、なんで、E(A,A)=(4,0)みたいに、「4,0」に
数字が二つも出てきちゃってるんでつか(涙。
とゆーか、強者A戦略者と弱者A戦略者が対戦した場合、それぞれの
獲得適応度が4,0になるという事でつか?

もしそうであれば、強者B戦略者vs弱者A戦略者が、3,1になるのは何故?

B戦略者は強かろうが弱かろうが、先着が後着かでタカ戦略を取るか
ハト戦略を取るか決めるので、弱者A戦略者の方が弱くても見破れない。
一弱者A戦略者は見定めするので、先着だろうか後着だろうが、
強者B戦略者に対しては、ハト戦略を取る。
よって、強者B戦略者は、タカ=1/2,ハト=1/2の確率で戦略を取る。
一方弱者A戦略者はハト一本やり。
対戦はしないので、両者Cはゼロ。 
Vは、強者B戦略者のV=1/2*4+1/2*2=3。
弱者A戦略者のV=4-3=1


強者A戦略者vs弱者B戦略者の場合は、
強者A戦略者は、常にタカ戦略一本やり。
弱者B戦略者は、タカ1/2,ハト1/2の確率で戦略を選択する。
よって強者A戦略者のV=(4-6)/2*1/2+4/2=-1/2+2=1.5
弱者B戦略者のV=(4-6)/2*1/2+0*1/2=-1/2+0=0.5
となってしまって、弱者B戦略者のVが、上の表の-3.5にならないのでつ(涙。

ど、どうしてなんでげしょ・・・。
69177 ◆NgGAMEeuew :03/02/11 00:05
>強者A戦略者と弱者A戦略者が対戦した場合、それぞれの
獲得適応度が4,0になるという事でつか?

その通りです。

>もしそうであれば、強者B戦略者vs弱者A戦略者が、3,1になるのは何故?

強者B戦略者が確率1/2でタカとハト、弱者A戦略者は常にハトをとるので
確率1/2でタカVSハト(4,0)、確率1/2でハトVSハト(2,2)が
生じるので期待値が(3,1)になります。

って、あってますよw
70177 ◆NgGAMEeuew :03/02/11 00:22
1.5,-3.5の方は、タカvsタカの時、強いほうが1/4、弱いほうが3/4の
確率で6のダメージを受けて資源をあきらめ、そうでないほうが資源4を
獲得と考えているためです。したがってタカvsタカの利得は
 強い方 3/4×4−1/4×6=1.5
 弱い方 1/4×4−3/4×6=-3.5
となります。

でも、上の利得行列はこのままのっけてしまってますね。
これは間違いなので訂正します。
確率1/2でタカタカ(1.5,-3.5)、確率1/2でタカハト(4,0)
なので、利得は(2.75、-1.75)ですね。

  強者\弱者 | A     B  
 −−−−−−−−−−−−−−−−−−−
      A   |4,0  2.75、-1.75
      B   |3,1  2,2

なので、(A、A)のみが唯一の漸近安定状態ですね。
ごめんなさい、間違ってました。
71ステ助:03/02/11 01:00
>69
書いた後に、もう一回やってみたら出来ますた(涙
文訂正し忘れたのでつが、
教えて頂いた考え方はすっきりスマートでつ(喜!
なるほどでつ・・!

72ステ助:03/02/11 01:15
>70
わ、わかりやすい・・(涙

A戦略強者タカ vs B戦略弱者タカの勝率が3:1という設定忘れてますた(汗

ところでこの設定は、何故ですか・・?タカ vs タカとなっても前者は後者より強いので、つい4,0としてしまいそうなのですが実際の勝負になったら分からない
という事なのですね・・
みーつけた(^^;;

生徒第2号希望ログ用カキコ
スレ読んだ.生徒希望の前に>>5のリンク先に行かねばならぬと悟った.
スレ汚し失礼.
75177 ◆NgGAMEeuew :03/02/15 00:19
まあ、あそこもおもしろいですが、あんまり系統だってはいませんからね。
分からないことがあればここで聞いてください。
>>75
お優しきお言葉ありがとうございます.
ただ.質問ばかりの「教えてクン」になるのも気が引けて....

いずれまた.....
77ステ助:03/02/15 22:21
…ドナ先生ハケーン!!

例によって、教えて厨になりに来ますた。。 
お時間のある時教えていただければ幸いです(汗。

学習心理学スレ>92-94の計算で質問でつ…(涙。

>行プレーヤーの安定状態はA:B=5:4(0.55:0.44)になります。
>これを所与として列プレーヤーの安定状態を求めると
とりあえず()内の数字は使わずに行くと、
行プレイヤーがAを取る時、列プレイヤーは(A,B)=(4,1)
行プレイヤーがBを取る時、列プレイヤーは(A,B)=(1,3)
なので、
行プレイヤーがAを取るのは、4×5/9+1×4/9=24/9
行プレイヤーがBを取るのは、1×5/9+3×4/9=17/9
なので、A:B=24:17となりますが、
これを所与として、列プレイヤーの安定状態を求めようとすると
ここから先が分からず…。

列プレイヤーがAを取るのは、4×24/41+1×17/41=113/41
列プレイヤーがBを取るのは、1×24/41+3×17/41=75/41
なのでA:B=113:75になっていまい、
A:B=0.62:0.38とは全然違う値になってしまいます。

これは暗算ではない数式を使ってるのでしょうか・・(汗。
数学の貧者の道は侘しひ…(涙。
78177 ◆NgGAMEeuew :03/02/16 00:29
上のスレで細かい計算まで書くと、話が見えにくくなるので
計算はこちらに書いておきましょう。

収束先の計算は次のようになります。列プレーヤーの0.5:0.5から
初めて対応法則で安定状態を求める手続きをt回繰り返したときの
A:Bの比率がx:1−xになったものとします。

          x    1−x
  行プ\列プ | A     B  
 −−−−−−−−−−−−−−−−−−−
      A   |4,4  1,1
      B   |1,1  3,3

このとき、行プレーヤーがAをとったときの強化は
     4x+(1−x)=3x+1
Bをとったときの強化は
     x+3(1−x)=−2x+3
となります。
79177 ◆NgGAMEeuew :03/02/16 00:42

            x    1−x
  行プ\列プ | A     B  
 −−−−−−−−−−−−−−−−−−−
      A   |4,4  1,1  強化= 3x+1
      B   |1,1  3,3  強化=−2x+3

ここで、行プレーヤーが対応法則に従ってAとBをとる比率を決めると
すると

      A:B=3x+1:−2x+3

となるはずですが、全体の中でAをとる割合をもとめると

      (3x+1)/(3x+1−2x+3)
     =(3x+1)/(x+4)

となります。もしA:Bの比が収束するとすると、この値は列プレーヤーが
Aをとる割合xと等しくなっているはずです。したがって

    x=(3x+1)/(x+4)

分母を払って整理すると2次方程式になりますが、それをとくと

    x=(−1+√5)/2
     ≒0.62

となります。



80ステ助:03/02/16 18:58
>>77訂正致します。 
 大変失礼しました(ペコリ。
× 学習心理学スレ>92-94の計算で質問でつ…(涙。
○ 学習とゲーム理論スレ>92-94の計算で質問でつ…(涙。


>78-79 なるほどでつ。
2次方程式の解の公式をやっと思い出しいますた(汗。
√5の値は、2.2360679(富士山麓オウム鳴く)ですたね。

なるほどでつ。
なんともスマート……(思わず、ためいき。
81177 ◆NgGAMEeuew :03/02/16 22:16
数列の収束は昔は数2で習ったのですが、今はどうなんでしょう。
基礎解析ってのも一時期ありましたが、科目名変わりすぎ。
ちなみに、収束についての厳密な話は大学の1年くらいの数学の
授業でならいます。私は出ませんでしたがw
82ステ助:03/02/18 09:21
大学に入ったら般教でも数学はなかったでつ・・。
高校の時はやりますたが、収束は覚えてない・・(汗
マジでやばいでつ。

高校の生物の授業でメンデルの法則を確かめるべく
3世代くらいショウジョウバエを試験官で育てた記憶ならあるのでつが・・

ゲーム理論スレ、学習心理学の所でストップしてしまタ。。
83XYZ ◆64XYZ/EQlg :03/02/19 22:27
>>82
ばっくり言うと,変化の割合が少なくなっていけば収束.そうでなければ発散.
その程度で話についていって,わからなくなったら軽く数式書いてみてもらって,
自分でなぞれば大丈夫だと思われるので,オレの分までがんがってくだちい.
84ステ助:03/02/20 01:09
>83
ありがとうこざいます・・
しかし、俺の分までって・・(涙
デスマ中でありますたか。。

学習心理学というか行動分析学と、ゲーム理論はマジで勉強したくなってきますた。
数学の貧者なのに(涙。

あのスレ行動厨さんらいらっしゃらないと進まない罠。
オペラント条件づけの本かじり読みでは、にゃんとも・・(汗
85行動厨:03/02/20 10:08
>>84
>オペラント条件づけの本かじり読みでは、にゃんとも・・(汗
参考までに。どんな本を読まれてるんですか?
86ステ助:03/02/20 22:37
>85
オペラント心理学 その基礎と応用(岩本隆茂・高橋雅治 勁草書房 1994)ですが…。
ルール行動支配等は索引には入っておりませんでした。
87行動厨:03/02/21 00:06
>>86
入門書ならこれがおすすめ。話し言葉でかかれていて、実験や臨床の実例も多い。
ルールの話も出ています。誇大広告的な物言いが少々鼻につくけど。

行動分析学入門 産業図書
http://www.amazon.co.jp/exec/obidos/ASIN/4782890303/ref=sr_aps_b_/249-8090278-7849138
88ステ助:03/02/21 00:18
>87
多謝でつ・・・!
89177 ◆NgGAMEeuew :03/02/22 11:11
【調整ゲームにおける遺伝型ダイナミクスについて】

進化心理学2スレ981の質問についての回答です。
まず、調整ゲームとは

  自分\相手 | A     B  
 −−−−−−−−−−−−−−−−−−−
      A   |3,3  0,0
      B   |0,0  2,2

のように、お互いの戦略がそろっているときには両者の利得が高く
戦略が食い違っているときには利得が低くなるゲームです。
A、Bは左側通行、右側通行とか思ってもらって結構です。
(一般性を持たせるためAAの利得と、BBの利得が変えてありますが
 右側通行、左側通行のような場合は、ほとんど違いはないでしょう)

遺伝型モデルの場合の「利得」は適応度(fitness)の(1からの)増減を
示します。たとえば3は適応度3%増し、2は2%増しのように考えて
ください。

90177 ◆NgGAMEeuew :03/02/22 11:30
ここで戦略が遺伝により親子で一致すると仮定したときに、集団中の
A、Bのシェアがどのように変化していくかを考察したときに生じる
ダイナミクスが遺伝型ダイナミクス(=レプリケーターダイナミクス)
となります。

例えば、集団中にAが0.5、Bが0.5の割合で存在している場合から
はじめると次のようになります。プレーヤーがランダムに対戦して
いることを仮定するとAの対戦相手がAである確率は0.5、Bである
確率も0.5となり、Aの平均利得は3×0.5+0×0.5=1.5となります。
同様にBの平均利得は0×0.5+2×0.5=1となります。
91177 ◆NgGAMEeuew :03/02/22 11:41
このとき、Aの適応度は1+0.015=1.015、Bの適応度は1+0.01=1.01
となります。これは今の世代でAが1000人、Bが1000人いると
すると次の世代でAが1015人、Bが1010人いることを意味して
いますので、次世代でのAのシェアは今の世代のシェアより若干増加します。

このように一般に遺伝型ダイナミクスでは「平均利得(平均適応度)の
高い戦略のシェアは増加し、低い戦略のシェアは減少する」という命題が
成立します。
上の調整ゲームの場合、集団中のAのシェアxがx>0.4のときに
Aの利得>Bの利得となりますので、x>0.4の初期値からはじめた
ダイナミクスではxは増加を続け、x=1に収束します。
つまり集団全体がA戦略をとるようになった状態で安定します。
92177 ◆NgGAMEeuew :03/02/22 11:45
一方、集団中のAのシェアxがx<0.4のときには
Aの利得<Bの利得となりますので、x<0.4の初期値からはじめた
ダイナミクスではxは減少を続け、x=0に収束します。
つまり集団全体がB戦略をとるようになった状態で安定します。

このように、調整ゲームでは初期値によって収束先が異なります。
AがすぐれていたからAに収束したとか、Bがすぐれていたから
Bに収束した、というロジックではない点に注意をしておいてください。
93177 ◆NgGAMEeuew :03/02/24 18:59
90スレくらい、まとめてdat落ちしましたね。
このスレは危うく免れましたw
94没個性化されたレス↓:03/02/24 19:48
このスレは保全しておいた方がいいですね。
保全するのにあげる必要はないんだよ、ばか。
96177 ◆NgGAMEeuew :03/02/24 20:50
なーんであげるかなあ。
97没個性化されたレス↓:03/02/24 21:33
とりあえず、
初めは友好的に
やられたら、怒りを表明して、やりかえす
これが長期的に見て一番、おりこうさんな戦略ということみたいね

「怒り」「不快感」を相手に伝えないと、なめられる事になるからね
正直スマソ

でも何でそんなに陰でやりたがるのか分からない
9998:03/02/24 21:36
納得
(`・ω・´)ガンガン100ください。
101177 ◆NgGAMEeuew :03/02/24 21:41
付録は巻末と相場が決まっているのでいす。
102ステ助:03/02/24 22:52
>98 どんまい。

>101 妙に納得させられてしまいますたw
103XYZ ◆64XYZ/EQlg :03/02/25 00:30
TFT戦略の説明で,「相手から協調を引き出す戦略」というのがあるけど,ありゃ違うよなといつも思うですよ.
TFTがESSだっちゅうのも,初期条件によっては当てはまらないし/*ESSそのものが無いっちゅう説も見た気が……*/
たしかTFTは,常に協調する「お人よし」戦略の進入には無力だったはず.
104177 ◆NgGAMEeuew :03/02/25 00:39
>>103 TFTにはACが平衡侵入します。したがってESSではありません。
アクセルロッドが「集団安定」という怪しげな安定性概念を立てたのもその
ためです。

>TFT戦略の説明で,「相手から協調を引き出す戦略」というのがあるけど,
>ありゃ違うよなといつも思うですよ.

TFT相手の最適反応は「上品」なスーパー戦略一般ですので、
相手がTFTを知った上で最適反応する、という仮定をおく限りで
間違ってはいません。ただし、相手が最適反応する保障はありませんので
その限りでは間違いといえるでしょう。
105XYZ ◆64XYZ/EQlg :03/02/25 00:50
>>104
自分の理解が大筋で間違っていなかったようで,安心しました.

TFTが「相手の協調を引き出す」効果があるという説明自体には違和感を覚えないのですが,
本来の性質を考えると,「非協調的な戦略に対して選択的に適応しにくい環境要因として働く」という点だと思うのですが如何でしょう?
因果が逆転しているというか……そんな感覚を覚えるのですが.
106177 ◆NgGAMEeuew :03/02/25 01:11
CにはCをDにはDを返す戦略ですから、ADが搾取しにくいのは
事実ですが、「因果が逆転している感覚」の方がよく分かりません。
「本来の」因果関係では、何が原因で何が結果であるべきだと
お考え(あるいはお感じ)でしょうか?
107XYZ ◆64XYZ/EQlg :03/02/25 07:56
どうもわかりにくい表現をしてしまって申し訳ありません.

TFTの側に「協調を引き出す」という意図は無いのではないかという,非常に言葉尻だけにこだわった感覚です.
TFTに対応するにはCでないといけない→結果的にDが淘汰される という説明のほうがしっくりする感じがします.
108177 ◆NgGAMEeuew :03/02/25 08:51
なるほど。進化ゲーム理論では「結果として」トクであった戦略が
広まる、という考え方をしますので

>TFTに対応するにはCでないといけない→結果的にDが淘汰される 
>という説明のほうがしっくりする感じがします.

というのは適切な理解だと思います。
その意味で、協力を引き出す「ために」TFTを採用するようになった、
というのは誤った表現といえるでしょう。
109190:03/02/25 08:58
TFTに関する諸解釈は、それが置かれた文脈に依存しているのでは?

TFT集団に少数のALL-Dが進入する状況:「非協調的な戦略に対して選択的に適応しにくい環境要因として働く」
All-DとTFTが混在している状況:「TFTは同じ戦略と対戦したとき相手から協調を引き出せる。All-DがTFTと
対戦しても共貧に陥るだけなのに」

このように、TFTの「解釈」は文脈に依存してなされているように思います。
110ステ助:03/03/19 23:20
保全。 NPDだぁ。。 まだ、そこまでも辿りつけない・・。
111没個性化されたレス↓:03/03/23 20:40
あげてみよう。
112山崎渉:03/04/17 09:32
(^^)
113山崎渉:03/04/20 04:42
   ∧_∧
  (  ^^ )< ぬるぽ(^^)
114没個性化されたレス↓:03/05/01 03:37
ただいま保全あげ祭り実施中。
115山崎渉:03/05/21 22:19
━―━―━―━―━―━―━―━―━[JR山崎駅(^^)]━―━―━―━―━―━―━―━―━―
116山崎渉:03/05/28 15:23
     ∧_∧
ピュ.ー (  ^^ ) <これからも僕を応援して下さいね(^^)。
  =〔~∪ ̄ ̄〕
  = ◎――◎                      山崎渉
117山崎 渉:03/07/15 12:51

 __∧_∧_
 |(  ^^ )| <寝るぽ(^^)
 |\⌒⌒⌒\
 \ |⌒⌒⌒~|         山崎渉
   ~ ̄ ̄ ̄ ̄
118没個性化されたレス↓:03/08/20 21:48
なんとなくあげてみる。
119ステ:03/10/16 22:00
hosh
保守
。。。
122没個性化されたレス↓:04/04/09 04:41
囚人のジレンマの話の狙いはさあ、
裏切ると得だと、思う人を増やすことなのだろうか。
>>122
少しでもゲーム理論を学んでから意見を言えよ、サルが。
124没個性化されたレス↓:04/04/09 21:21
ウザコテをまだ駆逐できてないんだな
誰のこと?
126没個性化されたレス↓:04/04/09 22:36
囚人のジレンマ状態なんて実生活において存在するのか?
あるなら書け
人に物を頼むときには丁寧語を使え。躾されていないサルめ。
パパとママの愛情が足りなかったのか?
>123
俺は「1回限りか有限回数反復なら裏切った方が得か」と思いましたが何か?
41 :名無しさん@お腹いっぱい。 :02/06/04 00:51
怪しい自己啓発セミナーが
囚人のジレンマに似たやつ使うんだよなー確か。
いや、あれは非ゼロ和じゃないんだっけか。


超亀レスだが、自己啓発セミナーのライフダイナミックス
あたりでは利得表をいじって常に協調が有利になるようにした
反復囚人のジレンマゲームをやらせて「協調の素晴らしさ」を啓蒙してるらしい。
裏切りの誘惑がないのですでに「ジレンマ」とは呼べないが・・・。
思いっきり非ゼロ和だよ。
130XYZ ◆64XYZ/EQlg :04/04/13 23:22
>>128
利得のマトリクスによる気がするが。
相手の戦略次第によっては,協調戦略が特になることもあるんでないか?
131757 ◆42ifSNqgWw :04/04/14 00:04
>>128
123ではありませんが(念為)、Hirshleifer and Rasmusen (1989)で、
有限回のゲームでも協力行動が起こるという結論を出したモデルがあるそうです。

その条件については、
・財を協力して生産しているグループを想定
・非協力的な行為に及んだプレーヤーは、1期限り排除される
・排除されていないプレーヤーをメンバーと呼ぶ
・メンバーのみでPDゲームが行われる
・社会的便益をメンバー間で等分する
・グループ内にいることで一定の効用を得る(ゼロと基準化)

私も詳しくは全然知らないので、良いページがあったら
教えてくだちぃ。
131の名前欄は、消し忘れです。 すまそ。
>>131
その論文には問題があり、良く知られています。「コストをかけずに排除できる」
という前提です。しかし、「集団にいたい」といすわる人間を、誰がコストを
負担してまで排除できるでしょうか?皆が合理的に考えて「他の人が排除して
くれるのを待とう」としたら、結局、非協力者は排除されません。

結局、排除することもサンクションの一形態であることを考えれば、その
コストを巡って、第二のジレンマが生じます。ここから先は、進化心理スレ
を参照あれ。
>133
ご説明ありがとうです。
進化心理学スレはロムしておりましたが、この理論で想定されている
村八分のような罰を施行する場合、コストがかからないとするのは問題でしょうか?
村八分というのは小学校の社会科の時間に習った気がしますが、
本当に秩序維持をするよう機能していたのか
ふと気になりました。
コストの低そうなサンクションだという気もしますが
(よく分かりませんけれども)。
また、この理論を提唱した方々は、「有限回で協力行動が生まれる」結論を
導くことを目的にしていたのかどうかを知りたかったのですが
どうなんでしょう?

私はそれほど関心はないのですが、利得がからまずに協力行動が
発生するというモデルを探している人たちは多いのでしょうか?
「コストが少ない」のと「コストがない」のとでは
原理的には大いに異なります。

「利得がからまずに協力行動が発生するというモデル」
というのは意味が不明です。
曖昧な言い方をしてしまい、すみません。
「村八分」の場合は、フリーライダーを見つけたら「無視をする(例えば村の行事を連絡しない、困っている姿を見ても助けない、
村全体の協力で得た資源を分配しない等)」をする事だと解釈したのですが、
無視するのにコストはかからないと設定できるかもしれないと
まず考えました。
でも「無視する」ことで本当にコストがかからないとして良いのか
迷いも生じた為に、「殆どかからない」等と書いてしまいました。
もう少しよく考えてみたいです。

サンクションの進化については、進化心理学スレで今やっている
モデルのほうがすっきりしていて説得力があるかなとは思いますが、
村八分型のサンクションについても前から気になっていたので
考えてみたくなりました。

「利得がからまない協力行動」とは、直接的にも間接的にも自分
の利得とならないのにそのプレーヤーが協力行動を選択
することです(だろうと思います)。
そういう事を仰っていた方がいたので、そういうモデルを
探している人はどのくらいいるのかなと聞いてみたくなりました。
それだとゲーム理論の前提と矛盾するものを探そす事になる気が
するので、奇妙な話だと思ったのですが。
村八分型のサンクションが機能しそうな条件として、
村八分(資源の分配がなくなる)事で受けるダメージが大きく
なる状況を考えると、ある集団から排斥された後、ほかに行き先がない
(ほかの集団に参加できない)場合
などが挙げられそうです。
移動に厳しい制約があって移動しにくい時は、村八分型の
サンクションは上手く機能しそうです。(これも曖昧な書き方ですが。)

と書いていて、箱根にあった関所の資料館(?)を思い出しました。
そこには、思わず、目を覆いたくなるような、拷問器具とその
説明がいっぱいでして。
許可のない村人の関所越えには、拷問という形でサンクションが
与えられていたようです。
村(集団)の内部では、村八分という(一応)コストが
かからないサンクションが有った(と考えられる)時代にも、
村から村への(集団間)の移動には、拷問というコストのかかる
サンクションがあった事になります。

関所が設けられたのは、5人組のような秩序維持のためでしたっけ?
もうすっかり忘れてしまいました。
調べればすぐ出てきそうな気がするので後日調べてみます。

>>136-137
良い点ついてますよ。

逆にいえば、罰する側にとってはコストゼロなのに相手を罰せられる構造が
存在している場合には、そもそも、ジレンマの問題は解決されてしまいます。
つまり「無視される」ことがコストとなりうる場面では、無視されまいとして
協力率が高まるでしょうね。

ただ、問題は、「なぜ無視されることがコストとなるのか?」という点です。
これは、心理学的にはもっともらしいです。が、「なぜ?」という問いを重ねて
いくことも可能ですし、意味があるでしょう。なぜなら、「無視されてもかまわない」と
考える、厚顔無恥なフリーライダーが存在したら、無視は罰として機能し得ない
からです。

>移動に厳しい制約があって移動しにくい時は、村八分型の
>サンクションは上手く機能しそうです。(これも曖昧な書き方ですが。)

だれが、移動を制約するのでしょうか?移動に厳しい制約がある社会構造
そのものは、どのようにして発生・維持されるたのでしょうか?と、この
問題は無限地獄のように「なぜ」という問いの連鎖を引き出してしまうのです。
>138
なるほどです。
つらつらと、村八分で考えてみましたが、
サンクションの進化について考える際には色々不都合な点が
ありそうでした。
問題点は、仰る通り、「無視される事がコストになるのか」と
「移動の制約は誰が行なうか」です。
でも、とりあえず、苦し紛れのこじつけですが、考えてみます。

まず、村八分はあまり人の出入りが少ないような村落でよく
見られるだろうと考え、移動がない閉鎖的な社会で
村八分型のサンクションが進化しないだろうかと考えましたが、
集団内では非フリーライダーのほうが有利となり広がります。
しかし、施行する際かかるコストがゼロであるサンクションが
存在するとし、サンクションを与えられた人はそれにより
利得を下げられないが
ゲームに参加できなくなるという設定が可能なら、
進化しそうな気がします。
(参加できる確率を設定しても良いかもしれません。)

問題点その1「なぜ無視されるとコストになるのか」についてですが、次の2通りを
考えていました。
(1)無視される事で、悲しい・辛い・居心地が悪い等、
利得が下がるかもしれない
(しかし、ひとまずこれは「効用」として棚上げした方が
良いのかもしれません)
(2)無視される事により、その集団内でゲームから
排斥される事になり、「資源を得る機会」を奪われるから
利得を減らされはしないが、利得を増やす機会を得られない
という間接的な罰。

※ いまさらの質問ですが、サンクションは「利得を下げるもの」と
定義されているのでしたでしょうか?
もしそうならば、(2)は、サンクションではなくなってしまうのですけれども・・(汗。
問題点その2「移動を制約するような社会構造はどのように
維持・発生し得るのか」についてですが、まず関所については
今日少々ぐぐっただけでも、移動を制約する為に設置された
ものではないようだという事が分かりました。
通行料を取る事が当初の目的だったようです。

とりあえず、考えてみますが、ここに血縁淘汰を持ち込んではダメでしょうか?
(ダメかな・・やはり。)
集団ははじめは血縁度の高いメンバーで作られているとします。
血縁淘汰により、集団内では協力行動が広まるとします。
(血縁度の低い他の集団のメンバーには協力しない。)

血縁度の低い相手と戦って資源を奪うタカ戦略より、ハト戦略の
ほうが有利であるような条件下にあると設定できれば、
各集団はそれぞれ孤立して閉鎖的な血縁度の高い小社会を
作ると考えることができるかもしれません。

ほかには、行き来の難しい場所に村がある為孤立しやすいといった
地理的要因も考えられるかもしれません。

上記はかなり怪しいですが、なんらかの条件で
「移動を制約・維持するのにコストのかかるサンクションは不要」
であるような場合を探すことで「なぜ」の無限地獄の連鎖から
抜け出す事はできないものでしょうか?
(我ながら、苦しい・・・そしてかなり飛躍していそうですが。)
139訂正

誤 非フリーライダー
正 フリーライダーもしくは非協力者
何が仮定で、何が結果か、ということを
もう少し意識すると、考えが整理しやすくなりますよ。
図にしてみるのも一案です。
>143
はい。 そうしてみます・・。
まとまったら、また書かせて頂くかもしれません。
そのときはよろしくです。
145没個性化されたレス↓
AGE