予測精度上げるタメにパラメタを減らすについて教えて
1投稿者:腐れ厨房ヽ(´o`;アイホンOS  投稿日:2011年08月13日(土) 08時27分11秒
くさいです。()イビ

こりもパラメタ減らして予測精度を上げた例ですか?。()イビ
たしかニュスでは半分近くの精度の高い地震センサを無視するもたいな方法て言うてもしたです。()イビ

緊急地震速報のソフト改修、小規模地震を分離して精度向上 - ニュース:ITpro

新ソフトでは小規模の地震を計算対象にしないように変更を加えた。
http://itpro.nikkeibp.co.jp/article/NEWS/20110810/364882/?ST=sp

919投稿者:腐れ厨房(゚腐゚)  投稿日:2011年08月07日(日) 19時43分55秒
飛ばし飛ばししか見てないですけどこの部分が興味深いかたです。
現状のシュミレション技術では複雑系もたいなコトせずに少ないパラメタ厳選したホが精度が高いてコトですゆね?

児玉氏「疫学と統計学⇔予測とシミュレーションは全く違う 統計学ではパラメータが多いほど傾向が出てくるけれど予測はパラメータ多くすると外れてくる」 ( #gendaitv live at http://ustre.am/esWT)
返信する RTする ふぁぼる ystricera 2011/08/05 15:14:51

児玉氏:SPEEDIはデータが足りないから発表しなかった、は間違い。予測というものを理解していない。少ないデータで出すものが予測。SPEEDIは民間、フルで動かしていた。 ( #gendaitv live at http://ustre.am/esWT)
nixe_sc 2011/08/05 15:15:46
2投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2011年08月13日(土) 09時35分26秒
サンプル数の話なら有意でないデータは外しちゃうってことはあるけど
サンプル数があまりにも少ないとやっぱりちゃんとした結果は
出ないんじゃないかな
3投稿者:腐れ厨房(゚腐゚)  投稿日:2011年08月18日(木) 05時16分54秒
津田「SPEEDIに関して言うとね、そうとう、当初公開が遅れてしまったって言うところで、まあいろいろ問題も指摘されてるんですが。また一方で、その科学者の方の中でもああいったまあ、SPEEDIみたいなものを公開してもそれを一般市民が見ても正しく読み取れる人のほうが少ないんだから、むしろそれで混乱を招いてしまうんだから公開しなければいいんじゃないかっていう意見をお持ちのかたも多いと思うんですが。児玉先生はそのへんはどう考えて…」

児玉龍彦「ええとですね。その前にですね。あの科学者の人も勘違いしてるんですよ。」

津田「ほうほう。といいますと」

児玉龍彦「あの昔の人はね、疫学とか統計学が好きなんです。今コンピューター世代の研究者って、予測とシュミレーションが好きなんです。それでね、疫学と統計学と、予測とシミュレーション、我々やってると全然違います。」

津田「はあどう違うんですか」
4投稿者:腐れ厨房(゚腐゚)  投稿日:2011年08月18日(木) 05時17分27秒

児玉龍彦「あのね、疫学とか統計学をやんのにはパラメーターが多いほど正確になるっていう考え方。だからあの、僕の専門、生活習慣病とかなんですが。よくメタボリックシンドロームとか言うじゃないですか。そうすっと、周囲が何センチとか中性脂肪がどれくらいだとかコレステロールいくつ何とかの人が心筋梗塞になったという統計処理をやって、これで病気のシンドロームを言うじゃないですか。こう言うのは、レトロスペクティブにやるときにはパラメーターは増やせば増やすほど、ある因果関係きれいに見えたように思うじゃないですか。ところが予測、プロスペクティブにやってると、パラメーターが多いと外れます。パラメーター少なくしないとだめ。少ないパラメーターで、メカニズムで予測しないとダメなわけですよ。それでね、SPEEDI問題もだから結局僕が見てると、文科省とか原子力安全委員会が、シミュレーションというのを全く理解していなかった。経済産業省とか原子力・保安院の報告書を見ると、SPEEDIはデータが足りなかったから発表しなかったって。」

津田「足りないんだったらむしろそういうのが正しい訳なんですね」

児玉「だって予測って、データが全部あったら実測であって(笑)。そんなもんシミュレーションじゃないじゃないですか。」

津田「なるほどね。たしかにね」
5投稿者:腐れ厨房(゚腐゚)  投稿日:2011年08月18日(木) 05時19分02秒
児玉龍彦「だから、あの今発表したらパニックになるとか何とか言ってる人は、予測というのを全く理解していない。だから予測っていうのは少ないデーターでやってやるわけだから、少ないデーターの中で一番正確な予測がSPEEDIなんですよ。それで僕はコンピューターの色々やってますから知ってますけど。SPEEDIはですね。その、まあ民間企業が動かしてるんですよ、はっきり言うと。国なんて全然出来ないの。それで、SPEEDIを動かしてるところはフルに動かしてました。だってそれであとでデーターが足りないってシミュレーションだから、当たり前なんですよね。だから多分コンピューターとかネットの人はすぐわかるとおもうんですが。統計とか疫学ってのはある意味で古いんですよ。何かって言うと我々が今やろうとしてんのは、未来の予測をやろうとしてるわけでね。そうすっとね、予測やろうとすると計算量もすごくなるしコンピューターもフルに使えないとダメだから、そういう予測をどんどん出さないとダメっていうのがまずイロハのイだと思うんです。だから今おっしゃってた議論の予測がなんとかだったら不安になるんじゃないかっていう議論は要するに過去の疫学とか統計とかを知らない人で、予測の仕方でより正確なものを出したら不安になるっていう議論がへんだとおもいません? だから予測って難しいんですよ。」

津田「まあ天気予報だってね、100%当たるわけでもないですし」

児玉龍彦「でも、やっぱり天気予報結構当たってきて。地球シミュレーターとかできて、すごく良くなってきてるじゃないですか」

津田「そうですね」

児玉龍彦「ええ。だからその、国会で言いたかったのは、なぜ21世紀の日本なのに19世紀みたいな議論やってんのって」
6投稿者:腐れ厨房ヽ(´o`;アイホンOS  投稿日:2011年08月18日(木) 06時04分00秒
ざまあみやがれい! : 児玉龍彦×津田大介のUst対談・書き起こし(1)、8/5
http://blog.livedoor.jp/amenohimoharenohimo/lite/archives/65755777.html
7投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2011年08月18日(木) 06時17分23秒
 
http://getnews.jp/img/archives/speed2011032311.jpg
8投稿者:.  投稿日:2011年08月18日(木) 09時47分08秒
サンプル数とパラメータ数は違うのでは? 1の地震予測ソフトの修正は,サンプル数を減らしたってことでしょう.
9投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2011年08月18日(木) 09時49分16秒
>>8
結婚したって本当?やっと童貞じゃなくなったんだな
10投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2011年08月18日(木) 09時50分38秒
おお、ドト吉さんだ!
11投稿者:腐れ厨房ヽ(´o`;アイホンOS  投稿日:2011年08月18日(木) 10時27分47秒
「小規模の地震を計算対象にしない」の小規模はパラメタになりもせんか?。()イビ
12投稿者:わんわん  投稿日:2011年08月18日(木) 10時32分13秒 ID:ZFXJ5MJE
サンプル数はパラメータではないでしょう。
一般にサンプル数は多ければ多いほど予測は正確になる。
13投稿者:腐れ厨房ヽ(´o`;アイホンOS  投稿日:2011年10月22日(土) 12時41分30秒
5投稿者:わんわん  投稿日:2011年10月22日(土) 12時15分38秒 ID:ZFXJ5MJE
予測はパラメータが少ないほうが正しいって言ってたトンデモ学者がいたな。

思い出しageです。()イビ

相関関係高いパラメタに絞るて予測すぺしてコトなんかな?です。()イビ
ある男の男性が一ヶ月以内に同性と性的行為するかの予測のパラメタは芝刈り機の保有よりもハドデスク内おちんぽ画像枚数もたいな。()イビ
14投稿者:わんわん  投稿日:2011年10月22日(土) 16時33分35秒 ID:ZFXJ5MJE
芝刈り機の保有=庭付き一戸建て=家庭持ち=ノンケ
ってことだっけ。。。
15投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2011年10月22日(土) 16時40分05秒
多変量解析では変数が多すぎると有意差が消えてしまうことがあるんだ。
16投稿者:腐れ厨房ヽ(´o`;アイホンOS  投稿日:2011年10月22日(土) 16時46分12秒
「キャバ嬢 統計的に優位で 世界の山ちゃん」で検索すんと統計的有意差に関する考察ができもすです。()イビ
17投稿者:わんわん  投稿日:2011年10月22日(土) 16時47分10秒 ID:ZFXJ5MJE
パラメタ数が置いと、何のパラメタを増やすと結果の値が増えるのかごちゃごちゃでワケワカになりそうです。
18投稿者:腐れ厨房ヽ(´o`;アイホンOS  投稿日:2011年10月22日(土) 16時47分21秒
キャバ嬢 統計的に有意で 世界の山ちゃん

でしたです。()イビ
19投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2011年10月22日(土) 18時44分30秒
パラメーターがたくさんあると、観測値にぴったり合ったグラフの式を導くことができるけど、
それは後からつじつまを合わせただけなので、既に観測された値はぴったり導くけど、これから先のことは、本質的なものをあらわしているパラメーター郡ではないので全然当たらないってことになる。
予測精度を上げるためには、本質的に関係のあるパラメーターを選びだしてモデル化しないといけない。
20投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2011年10月22日(土) 18時45分56秒
赤池情報量基準とかそういうのの話でしょ
21投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2011年10月22日(土) 18時51分56秒
現状、地震予知についてはパラメータを厳選できるようなレベルでないから
パラメータを絞れない、パラメータを増やしてどれが本質なのか調べている段階
ってことなんだと。
様は平行線。
投稿者 メール  
(゚Д゚) <