76 :
没個性化されたレス↓:
ここでおまえらにマジな質問。
たとえば
>>70での
>阻止の例だと、あらかじめ条件づけられたCS(A)があるために、後に加えられる
CS(X)はUSの予測子としては冗長なために新たに学習が起きません。
という考えの背後には、「個体は学習というメカニズムを通じてstochasticな
環境の中から事物の因果関係を抜き出し、(確率的な意味で)適応的な反応を
獲得する」ということですよね?
このように考えると、「生物はどのような学習ルールを持っているのか?」を
実験を通じて記述していく研究だけではなく、「stochasticな環境において、
どのような学習ルールを持っていることが、最適であるのか?」という方向から、
演繹的・理論的に研究していくことも可能ですよね?
実際、新奇刺激に対してつよく反応する=環境は常に変動することを想定すると
適応的(実際にそれを理論的に示した研究あり)、冗長なUSは学習しない=
情報理論の観点からみて効率性が追求されている、とも言える訳です。
そこで質問。このような観点から、「適応的な学習ルールとはどのような物か?」
を研究している人、分野などをご存じないですか?
77 :
没個性化されたレス↓:02/10/02 21:07
>>74 それが専門ではないので詳しくはないけど・・
認知畑の人は、むしろ「なぜΔPではうまくいかないか」を研究している
ように見えるんだけど。密度バイアスとかはΔPではまったく説明できないし。
学習専門で因果推論やってる人は、既存の学習理論や動物で確認されてる現象を
因果推論にのっけたりしてるんじゃないの?
あと、連合学習との直接的な関係でいえば回顧的推論は少し盛り上がったな。
78 :
没個性化されたレス↓:02/10/02 21:13
>>76 いわゆる連合学習のなかでそうした関心の研究は、俺の知る限りない。
知らないだけかもしれないけど。スマソ。
適応的なルールというのは定義が難しいしなぁ。
むしろ、工学屋の方が詳しいのでは?あとはSutton & Bartoの強化学習が
参考になるかも。
79 :
コギャルとH:02/10/02 21:19
80 :
没個性化されたレス↓:02/10/02 23:21
>>77-78 おお、産休!!やっぱり、そういった視点からの研究というと、
Suttonとか機械学習の方へ行く訳ね。この辺りの領域の先端に
関する見取り図をつくっていたのだけれど、それほど「はずしていない」
ことが分かって、とても有益でした。
ともあれ、もう一度、Thank you!!!
81 :
没個性化されたレス↓:02/10/02 23:53
82 :
没個性化されたレス↓:02/10/03 00:53
うまく伸びるかとおもいきや、Q&Aになってるね
ところで、RWモデルで
>>65までの話がうまく説明できることが分かった後、
今度は、どんな問題・謎が解かれた・研究されたの?そこではRWに何が加え
られたの?
>>81 例えば...
>実際、新奇刺激に対してつよく反応する=環境は常に変動することを想定すると
適応的(実際にそれを理論的に示した研究あり)、
っていう話は、行動生態学者によって80年代に理論モデルが作られた。
そこでは、ここでの話とは逆に、「確率的に変動する環境下でどんな
学習ルールが適応的か?」という観点から、RWとほぼ同じ特徴をもった
ルールが「理論的に演繹」されたのよ。
で、結局、この話は、行動生態学や機械学習の分野ではarmed bandit problem
っていう問題のなかで扱われることが多いわけで、その先は、ご存じの通り。
ただ、俺的には、学習心理学におけるRW以降の話っていうのをちゃんと押さえて
いなかった訳で、このスレ読んでやっと、reinforcement learning全般について
通じることができそうだ、と。というわけで、むちゃくちゃ楽しみにしてます。続きを。