良スレなのに、なんで放置されているんだろうか。
(自分は貢献できないけど。 最近フォン・ノイマンについて
ちょこっと本を読み始めています。)
良スレだからこそ進みが遅い
__∧_∧_
|( ^^ )| <寝るぽ(^^)
|\⌒⌒⌒\
\ |⌒⌒⌒~| 山崎渉
~ ̄ ̄ ̄ ̄
そろそろ保守っておこう。
さて、人が居ないとなかなか議論はできませんが
とりあえず試行錯誤を仮定した学習ダイナミクスモデルの話でも
しながらどなたか心理屋さんの意見でも待つことにしましょう。
Roth & Erev 型の試行錯誤学習モデルでは「強化」と「忘却」によって
ある戦略を採ろうとする「傾向」が変化するというダイナミクスを
想定します。具体的には、時刻tにプレーヤーiが戦略jを採ろうとする
傾向パラメーターpij(t)が、次の差分方程式にしたがって変化することが
仮定されます。
pij(t+1)=(1−φ)pij(t)+Rij(t)
ここで、φは忘却を表すパラメーター、Rij(t)は時刻tにiがjを採ろうと
傾向に対して与えられる強化の大きさを示します。
0<φ<1でRij(t)がiがjを採ったときの利得の期待値の大きさに
等しいとすると、このダイナミクスは元のゲームのstrict Nash均衡
に収束することが示されます。
strict Nash均衡という静学解が動学の漸近安定状態となるケースは
いろいろ知られていますが、このRoth & Erevモデルでは、プレーヤーは
他者の利得や戦略、利得表の全体像などについての知識を持つ必要がなく
自らの採用した戦略とその結果が、プレーヤーが知る必要がある最低限の
情報となります。その意味で、プレーヤーに課される情報的制約が
もっともゆるくてすむ場合のモデルになっています。
で、このモデルの肝は
pij(t+1)=(1−φ)pij(t)+Rij(t)
という差分方程式なのですが、これは学習心理学の立場から見て
どの程度妥当性のある式といえるのでしょうか?
どなたか、意見や情報のある方がいらしたら、ゆるゆると
議論していきましょう。
その式は、学習が持つ諸特性、1)同じ行動が繰り返し強化されると、強化量が同じでも学習の効果は
減っていく=驚きが大きいほど学習の効果が高い、2)最近得た情報の方が
古い情報より大きな影響を持つ、を表現してるので、レスポンデントだろうが、
刺激間の連合だろうが、カテゴリ学習だろうが、MCCLだろうが、連合学習全般の
本質をつかんだ物だと思われます。
そこまでは、良いんですよね。そこまでは。
関係ないけど、最近、慣習と規範の経済学と合わせて、学習心理の本を読んでますが、
いろいろ考えさせられますね。溝は深いです。
そう、定性的にそれっぽいというのはいえるだろうと思いますが
私が気にしているのは、このモデルがstrict Nash均衡に収束するのは
ある戦略をずっととらないと、Rij(t)=0なので
pij(t+1)=(1−φ)pij(t)
したがってt→∞のときpij(t)→0となるためなのですよ。
この命題が崩れると、strict Nash均衡に収束という分かりやすい
シナリオが崩れます。
ある行動をずっととらないと、その行動をとる傾向性が0になる
という命題は学習心理学的にみて妥当なのでしょうかね?
とれるけどとらない場合(競合する行動をとる必要がある場合)と、
とれないからとらない場合(物理的にその行動が取れない環境にある場合)で違うのでは。
Estesが1959年の論文で、「行動しても強化が得られない時」に、
pij(t+1)=(1−φ)pij(t)と、pij(t+1)=pij(t)のどちらにすれば
良いのか、を議論してますが、結論は「ケース・バイ・ケース」。
これは、消去の話ですが、
>>190の例は、「行動を取らないまま時間が
過ぎるケース」なのでやや違うでしょうが、やっぱりこちらの例でも
データをとって判断すべき事柄であるように思えます。
>とれないからとらない場合
どうなんでしょう?1週間2X2PDをやって、一ヶ月別のものをプレイしてから、
再度2X2PDをやる場合、上の2つの式のどちらであっても、1ヶ月後に、
C (or D)を取る確率は同じだから(理由:pic, pidの両方が同じ割合で減衰しようが
減衰しないまま残っていようが、pic/pidは等しい)、どちらが生じていると
考えても良い。
>とれるけどとらない場合
むしろ、こちらの場合にこそ、どちらの式を使えば良いのか判断できるデータが
入手可能。まぁ、細かな話ですが。
で、話を戻すと、直感的な話ですが、「学習の対象」が何であるかによって、
どちらの式を使えばよいのか、特定し安くなるように感じます。例えば、
記憶の場合には、何も行動を取らない/刺激を得ないまま時間が経てば、
忘却という現象が生じる訳で。仮にですが、ゲーム場面で学習されているのが
単なる行動ではなく、ある種の知識や情報である場合には、
pij(t+1)=(1−φ)pij(t)としても良いのではないか、と。
このあたりは、オペラントの専門家だけでなく、認知系で学習の話をしている
人も来れば、もっと情報が得られるのではないかなぁ...
たとえば、調整ゲーム
1\2 | A B
−−−−−−−−−−−−−−−−−−−
A |4,4 1,1
B |1,1 3,3
は、(A,A)と(B,B)の二つのstrict Nash 均衡を持ちます。
2者試行錯誤学習ダイナミクスの場合、いずれも漸近安定ですが
例えば(B,B)が安定になるのは、お互いずっとBばかり採っていると
p1A→0、p2A→0となるためです。
ここで例えば、p1Aやp2Aが0に収束しないと、十分長い繰り返しの
のちにもAを採る確率が0にならないので、(B,B)にも収束しなく
なります。ですから、クリティカルなのはAをずっと採らないと
p1A→0、p2A→0となるのかどうかと言う点だと思われます。
>>194 p1A, p2Aが0に近づくことはあり得ると思うのですが、実際にそうなるか
どうか、いつそうなるかを、演繹的に決定することは難しいように感じます。
結局、ゲーム理論における(強化)学習モデルの適用、という営み自体が、
「学習という理論装置を適用してみると何が見えるか?」という問いに基づいて
いるわけですよね?
つまり、実際に人々が「強化学習」の原理に基づいて行動を変化させているかどうかが
問われているというよりも、「そうであるとしたらどうなるか」という問い。
である以上、「行動しないとき、(1−φ)を掛けるのが妥当か否か」を問い始めたら、
元々の枠組み=「ゲーム場面でシンプルな強化学習の原理“だけ”が働いている」と
言う前提を問い直す必要が出てくるのでは?
つまり、「(1−φ)云々...」問いが気になり始めると、「人々は、行動場面で
なにを学習しているのか?」という点まで踏み込んで議論していかないとならないのでは
...という感想です。
単純な問題に見えましたが、考え始めてみると、結構この問いは研究哲学の
分かれ目を意味してるかもしれませんよ。論理を構築する段階でとどまるか、
実証という名のデータの大海へ踏み出していくか、の。
それは分かれ道のように見えて、実はそうでもないかも知れません。
思考実験が何らかの意味で有意義であるとするならば、それが
ある程度は現実を反映している場合だと考えられますので、
どういう意味で現実を反映しているのか、と考え始めると
分かれ道の先は合流している、という可能性もあります。
ところで、なぜ試行錯誤ダイナミクスを問題にしているのかというと
模倣ダイナミクスも最適反応ダイナミクスもstrict Nash均衡に収束
することがすでに知られているからです。試行錯誤でもstrict Nash均衡
に収束することが示せれば、現場で働いていそうな学習アルゴリズムの
いずれでもstrict Nash均衡に収束することがいえて、
「人々は、行動場面でなにを学習しているのか?」をとりあえず
スルーしてもゲーム理論が使えるようになって便利です。
つまり、「(1−φ)云々...」はstrict Nash均衡戦線での最後の
砦となっているわけです。
いや、言いたかったことはですね。。。
>試行錯誤でもstrict Nash均衡に収束することが示せ
るかどうかは、実際にデータをとって、(1−φ)を掛けるかどうかを
調べない限り、「もし〜であるならば」という前提付きの議論にならざるを
得ないだろう、しかも、状況に依存して異なるモデルが必要とされるだろう、
ということです。だからこそ、
>現場で働いていそうな学習アルゴリズムのいずれでもstrict Nash均衡に収束することがいえ
るかどうかを問うタイプの議論=特定のメカニズムに依存しない均衡概念を探し求める
行為に、どれだけの理論的価値があるのか、気になる...ということです。
strict Nash均衡は遺伝ダイナミクスの漸近安定状態なので
現実性のある学習ダイナミクスでも漸近安定であることが示せれば
それはそれで有意義でしょう。
一つは、戦略の収納問題を考える手がかりになります。
もう一つは、「進化的に安定な学習アルゴリズムによるダイナミクス
で漸近安定となる状態は、遺伝ダイナミクスでも漸近安定になる」
(さもなければ、その学習アルゴリズムは遺伝的に安定な学習
アルゴリズムではない)という、やや天下りな命題を具体的に
検討することができます。
これに関連して、遺伝ダイナミクスを想定した分析は学習ダイナミクス
によるより詳細な分析の近似として使えるだろう、という
メイナード・スミスのプログラムの妥当性を検討できます。
HOSH
201 :
没個性化されたレス↓:03/10/31 12:19
保全あげ。
202 :
没個性化されたレス↓:03/10/31 12:23
保守
続行きぼうsage
205 :
没個性化されたレス↓:04/04/02 23:08
こいつはサルベージさげ
とか言ってあげんなよ。
207 :
没個性化されたレス↓:04/06/03 18:17
保全しておく。
ここは、残しておかないとね。
関係ないですが
今、M. M. ワールドロップの「複雑系」を呼んでる。
再認ができる用語が増え、なんだか賢くなった気にさせる本ですな。
その用語は説明できませんがー
バイオグラフィーの部分以外は、理解できませんのでー
この本の索引と用語(解説)の本が欲しい。誰か作れ。
以上、独り言。
なんとなく一年が過ぎてしまいました。
計算はだいぶ進みましたが、実証という点では
一年前からあんまり進んでないなあ。
うわ! 超久しぶりに来板したら177氏がいらっしゃった。
ご無沙汰してます。お元気そうですね。
学習のモデル化でしたっけ。
メイナード・スミスさんのテキストには、学習行動を支える遺伝的基盤を仮定できれば
学習行動も、近似値として進化ゲーム理論で表現できると書いてあったのを読んだ気がします。
うろ覚えなので間違っていたらすみませんが、そう上手くいくの
かなあ・・という気がしていました。
そういったところで引っ掛かってしまっていたので、実証例となると
どんなものがあり得るかあまり思い付きませんが・・。
理論的には大体あってるんですけどね。
細かい部分ではいろいろ疑問点はあるのでいす。
すみません、亀レスになりましたが。
大体は合っているんですか・・・。
進化ゲーム理論で表現できるものとは、
個体の差異により適応度が異なり、
その差異が遺伝に依るもので、
集団内の遺伝子頻度に影響する
という条件を満たすものですよね。
逆にこの条件を満たさない場合は、進化ゲーム理論は使えない。
それで、学習のしかたに遺伝的基盤があったとしても
学習行動として表れる時は多様で可塑的なものであり
「個体が多様な環境に合わせて行動を変化させることが出来るかどうか」というのがキモだと思っていました。
裏切や協力といったものは別としても、学習行動を進化ゲーム理論で表現できるのかなあ?と疑問になりまして。
親から遺伝により同じ学習モデルを持っていたとしても、
どんな学習行動をするかは環境の変化により異なるので、
進化ゲーム理論を使って学習行動は説明できないのではないかと。
少しスレ違いな問いでしたので、すみません。
このスレでやっているような、適応度を高める行動を選択するのに効率的な学習型モデルとは
何かという話ならば
進化ゲーム理論を使うことには疑問はないのですけれども。
もしかすると、テキストでも、「学習によって選択した行動そのもの」を
対象にしていたのではなく、このスレと同じように「学習による、行動選択のしかた」を
問題にしていたのでしょうか?
213 :
没個性化されたレス↓:04/12/06 07:36:32
保全あげ。
>>212 そこまで来ると、この研究とそこから派生した研究などが参考になるかも。
Lumsden, C.J. & Wilson, E.O. 1981.
Genes, Mind and Culture: The Coevolutionary Process.
Cambridge: Harvard University Press.
215 :
没個性化されたレス↓:04/12/30 22:14:17
たまにあげると書き込んでくれる人がいるみたい。
>>214 超遅いレスになりましたが、参考文献のご紹介有難うございます。
PriceやMaynard Smith, Wiloson辺りのことを知り、その辺りの
論文を探してはいるのですが、一般人の私には入手しにくいものが
多いので、止まったまんまになっています。
(いえ、その気になれば、入手不可能ということもないとは
思いますが。 Google Scholarという頼もしい検索ページもありますし(^^)。
「利他行動」や「互恵行動」などを数理社会学の方で
よく見かけるので、その辺りからゆっくりと調べていっています。
保全兼ねて書き込み。
217 :
没個性化されたレス↓:05/03/02 11:44:15
たまには保全あげ。
218 :
没個性化されたレス↓:2005/05/13(金) 21:05:29
リサイクル
219 :
没個性化されたレス↓:2005/05/13(金) 21:23:20
リサイクル
220 :
没個性化されたレス↓:2005/05/19(木) 12:12:34
,,∧_▽∧ ワレハメシアナリー
,;;;;;:::::.´д`::;ミ モットチカラヲー
i,;;;;;::::::;;;:::::::;;;:;;;:ミ ,∧[v]∧
l;;;::::::(/▲ ▲ ▲ミ ∬;:ヽj∀゚ミ ∧,,,∧ ボクハ エイユウ ダ
,i;;;::::::;;" .▲ ▲ ▲.i@;;:::(/▲▲ミ ,;' σ`'σ;、
l;;;;;::::::i ! |;;;;;:::i i i ^ j
'ゞ;;;;;;;____,;゙ ヽ;;;__,,:' ゝ___,,:'
221 :
没個性化されたレス↓:2005/06/30(木) 23:25:17
今日の講義でRescorla-Wagner modelを取りあげたので
記念にあげておく。
>>221 へぇ、大学生ですか?
心理学部じゃないので授業で教わったことはないので好奇心から
なのですが、どれ位の時間をかけてそのモデルについて
講義するのか聞いても宜しいですか?
あ、大学生じゃなくって、教える側の方ですね。
途中で気づいたんですけど、1行目書き換えるの忘れました。
失礼しましたー。
224 :
没個性化されたレス↓:2005/07/10(日) 13:13:59
般教のレスポンデント条件づけの講義の最後の20分程度だす。
225 :
没個性化されたレス↓:2005/08/14(日) 21:18:02
ゲーム脳って何?
226 :
没個性化されたレス↓:2005/10/10(月) 21:56:43
またもや、ゲーム理論でノーベル賞。
The Bank of Sweden Prize in Economic Sciences in Memory of Alfred Nobel 2005
"for having enhanced our understanding of conflict and cooperation through game-theory analysis"
Robert J. Aumann & Thomas C. Schelling
http://nobelprize.org/economics/laureates/2005/press.html 1994年に引き続き、ゲーム理論が取るのは2度目ですね。
2002年の行動経済学に引き続き、関連分野が注目を集めていますね。
内容も知らずに書き込むな
終了
228 :
没個性化されたレス↓:2005/10/10(月) 22:15:58
>>227 世間知らずはあなたの方よ。分からないかも知らないけど。
>>228 オーマンのどこが評価されたのか書いてみろ、蛆虫
先にお前が書いてみろ,便所コオロギ
それが人にものを頼む口の利き方か?
躾のなってない蛆虫だ
232 :
没個性化されたレス↓:2005/10/10(月) 22:25:51
>>229 繰り返しゲームだろう?そして、彼の共有知識に関する分析、
すなわち、ゲーム理論の認識論的基盤に関する研究についても
簡潔ながら評価されている。後者については、筑波の金子先生なんか
ばりばりやっているから、喜んでいるんじゃないかな。
それにしても、お前のようなウジ虫は、もうちょっと謙虚さを学んだ方が良いよ。
>>232 そのレベルの説明か
まあ、いいや
素人に本職相手に説明させた俺がいけないわなw
>>233 相手にしてやらん
>>235 負け惜しみもほどほどにね。匿名掲示板では、
周囲のレベルを見くびってデカイ口を叩くは良いが、
実は大笑いされてるってのは、良くある話よ。
しかし、
>>226での解説以下のほうがわかりやすいよ。
もっと詳しく聞きたいね。
でも、
>>237みたいな便所虫が騒ぐようじゃ誰もこないね。
>>238 全4ページのショート・サマリーと、全29ページの
マスコミ向け受賞理由を、1レスにまとめて味噌。
それすらできないなら、専門家の顔をした学生さんに
過ぎんわな。おわかりか?蛙君。
241 :
238:2005/10/10(月) 23:00:31
>>239 もう一人のシェリングってどんな人で、どんな研究をしていて、
それがどのような経済活動に影響を与えたの?
教えてください。
シェリングはゲーム理論家というより、理論政治学者/社会学者に
近い。まだ発展途上にあったゲーム理論を、国際間葛藤などの分析に応用して、
社会科学全体にインパクトを与えた。とにかく、最低限の数式しか使わず、
平易な言語でゲーム理論の論理を展開していったため、ゲーム理論の外部で
より高く評価されてる。あとは、コーディネーション問題の研究も有名。
>>233 ヤツはこれほど下劣ではなかったし、あの口の悪さも一種の爽快感があった。
似ても似つかんと思うが。
246 :
没個性化されたレス↓:2005/12/18(日) 00:25:26
246
247 :
没個性化されたレス↓:2006/01/06(金) 19:39:18
エロゲーが一種の昇華作用を果たし、性犯罪が減っているという主張がある。
「昇華」というのはジグムント・フロイトの造語で、社会に受け入れられない衝動や欲望を
社会的に望ましいものに振り向けるという意味である。人体を切り裂きたいという欲求を
持つ者は外科医になり、暴力衝動を持つ者は、その衝動をスポーツや軍隊、法の執行に
振り向ける、というわけである。
しかし、ゲームをすることは昇華にはならない。
娯楽産業は社会的に受容できる方向を目指してエネルギーの捌け口を提供している訳ではない。
それどころか、部屋に座ってエロゲーをプレイする際には、ろくにエネルギーなど費やされやしないのだ。
昇華ではないし、それどころか無害な娯楽ですらない。強姦シミュレータの操作とは結局の所、
古典的条件付け、オペラント条件付け、社会的学習であり、そして…
何とその全てが反社会的な方向を目指している。
エロゲーは、ベトナム戦で兵士の発砲率を第二次大戦時の15%から90%以上に高めたのと
同じフォーマットで性犯罪をパッケージ化しているのだ。
Dave Grossman 「戦争における人殺しの心理学」より
hoshu
ほしゅ
251 :
没個性化されたレス↓:2006/07/28(金) 17:31:27
\
保守
253 :
没個性化されたレス↓:2006/08/14(月) 08:34:01
森昭雄先生はトンデモ本の執筆をする傍ら、精力的にトンデモ発言を繰り返す脅威の人です。
以下、
http://ja.wikipedia.org/wiki/%E6%A3%AE%E6%98%AD%E9%9B%84 より引用
事実でない発言
* 「『テトリス』というゲームはソ連の軍隊で人を殺すための教育の一つとして、軍事目的で開発されたもの。人間をロボットにするための人殺しゲームだ。簡単に殺戮ができるようにするためものだ。」
* 「旧ソ連では『テトリス』を兵隊にやらせる。『テトリス』をやっている状態の脳は、非常に反射的な状態になり、人を殺しても何とも思わなくなる。その訓練のために『テトリス』をやらせていたのである。」
上記のような、事実でない発言を各地の講演で行なっていることが2004年に発覚し、インターネットコミュニティ上で問題となった。
2ちゃんねらーも真っ青。
脳トレで息子の自閉症が治りましたよ。
ゲーム脳とこのスレのゲーム理論は、なんの関係もありません。
名前が似ているだけでスレ違いです。
260 :
没個性化されたレス↓:2006/10/18(水) 01:04:57
わらえるね。
ゲーム脳とゲーム理論。ププ
sss
hoshu
263 :
没個性化されたレス↓:2007/01/22(月) 11:09:06
格ゲー板でゲーム理論連発する変なコテハンがいるんですけど
ゲーム理論って具体的にどういったものなんですか?
264 :
没個性化されたレス↓:2007/01/22(月) 11:29:29
265 :
没個性化されたレス↓:2007/01/22(月) 11:39:38
>>264 即レスありがとうございます
時間のあるときに読んでみて疑問がわいたらまた質問させて頂きます
経済板にゲーム理論の専門家がいますよ。
心理はゲーム理論の一部、浅いレベルですので。
267 :
没個性化されたレス↓:2007/01/23(火) 01:50:33
>>266 心理学でゲーム理論に関連している連中は、「ゲーム理論」そのものの
研究なんて、そもそもやってないでしょ。理論的概念に触発された研究を
やっている訳で、深いも浅いもないのに、何を勘違いしているのやら。
君、他人をおとしめることでしか、自分を高めることができない崩れ?
つまり、言い換えると浅いんだろ?
269 :
没個性化されたレス↓:2007/01/23(火) 05:01:09
↑知ったか君、その悔しい気持ちを勉強に向けたまえw
精神医学の学者、医者の工作員か?
常識ではありえない書き込みになっており良識を疑うスレ
なぜか伝染の連呼
【社会】 「説明しても解らないだろ」 精神科医、20代女性患者の髪をつかみ頭を壁に叩き付ける→逮捕…東京★2
http://news22.2ch.net/test/read.cgi/newsplus/1169562649/ 273 :名無しさん@七周年:2007/01/24(水) 03:24:34 ID:TLf6BWXe0
精神病って絶対伝染するだろ
276 :名無しさん@七周年:2007/01/24(水) 03:31:07 ID:jnPfvXJb0
精神科医にはキチガイも多い。
伝染するタイプの精神病もあると聞いたことはあるけど。
765 :名無しさん@明日があるさ:2007/10/28(日) 11:03:26 O
寮のマスターキー盗まれたのでage。
明らかに寮内に犯人がいるので、恐くて部屋から出られん。
今日夕方に総務部長が来て寮生集めて説教だと。
マジ犯人死んでくれ。
768 :名無しさん@明日があるさ:2007/10/28(日) 11:56:07 0
>>765 被害者である一般寮生に説教すればいいって考える総務部長も大概だな。
盗んだ奴なんか反省するはずもないだろうに。
776 :773:2007/10/28(日) 22:51:19 O
部長の話しやっと終わった…概要はこんな感じ
・明日までに名乗り出れば警察沙汰にはしない
・退寮&減俸で許してやる
〈犯人が名乗り出ない場合〉
・鍵の交換費用(150万)は寮生負担、一人五万くらい
・全員五日〜十日の謹慎処分(欠勤扱い)
当然みんなブチ切れて犯人捜し開始。
何人かいない奴がいるのでそいつらを呼び出し中。
↑面白杉なので転載。ゲーム理論で解決してやってくれwwww
275 :
没個性化されたレス↓:2008/01/06(日) 22:28:33
ほしゅ
276 :
没個性化されたレス↓:2008/10/15(水) 12:45:17
本当のことを言おう
ゲーム理論は役に立ちません
278 :
没個性化されたレス↓:2009/01/16(金) 13:51:06
279 :
没個性化されたレス↓:2010/08/30(月) 23:24:47
夏の終わりの虫干しあげ。
ゲーム理論が役に立ったことはありません。
後だしジャンケンのご都合解釈です。