2 :
前スレの1の言質:02/01/13 22:36
-------------------------------------------------------
299 名前:1 投稿日:2001/03/12(月) 23:14
>>298 >あんた、オナニーしてる場合じゃないですよ(ゲラ
すまんこ。
「占いの世界で言う“統計”と、数学や社会学で言う“統計”は、別ものだ」
と言いきられてしまうなら、納得するしかないけれど。
しかし占いの方で「これは(占いではなく)統計“学”です」って
言っちゃうのはウソツキなんじゃないの? そうでもないの??
--------------------------------------------------------
という妙にねじれた疑問を誰かそろそろ解消してくれ〜。
ただし、前スレと同じことの繰り返しは止めようね。
>「占いの世界で言う“統計”と、数学や社会学で言う“統計”は、別ものだ」
別物なのよ。>1
学問の世界なら共有しているルールというか前提があるけど、占いの世界にはそれはない。(と思う)
>しかし占いの方で「これは(占いではなく)統計“学”です」って
>言っちゃうのはウソツキなんじゃないの? そうでもないの??
ていうのは“学”って言葉の意味を狭く捉えすぎてるのではないかな?
いわゆる“学問”的ではないにせよ、先人たちの積み上げてきたものは膨大にあるわけでしょ?
だったらそれを“学”と言っても別にウソツキではないんじゃない?
>統計学って、実際は結構大変なんでしょ?(やったことないけど)
>安直に「これは占いではなく、統計学です」とか言っちゃマズい
>っていうのはわかってるんだけど、じゃあ具体的にどこがどう違うのか
>一度詰めて話せたらいいなあ、と思ってました。
(過去スレから)
それは大変すぎて説明できません。
母集団をどうするんだとか、
2段階抽出のような厳密なサンプリングなんてできっこないとか、
質問文は適切なのかとか、
まあいろいろあるみたいなんだなぁ。
実際に統計をかじった経験から話してしまうと、
学会に出ているデータだって母集団は自分の大学の学生だけだったりしてけっこうバイアス(偏り)ありそうだよ。
とりあえずは因子分析(っていう技法がある。考え方はとても面白かった)やってそれっぽく見せればいいかなあ、なんて気もしちゃう。
学問の場に出ているから信頼できるというのは(当たり前のことながら)言いきれないですね。
学問の世界の中で常識はどんどん変わっていくんだから。(昔は太陽が地球の周りを回っていたと思われていた!!)
当たり前なんて時代や環境が変われば変わるのですよ。
当たり前は人によって違うのが当たり前。
しかし当たり前というかある前提というものを共有していかないと議論ていうのは発展していかないですよね。
その点、学問の世界は占いの世界より当たり前を共有してるのではないかな?
>しかし占いの方で「これは(占いではなく)統計“学”です」って
>言っちゃうのはウソツキなんじゃないの? そうでもないの??
ウソツキとなるのかどうかは情報を受け取る側次第のような気がするんだけどなぁ。
てな感じでどうでしょう。
4 :
名無しさん@占い修業中:02/01/15 13:50
5 :
名無しさん@占い修業中:02/01/15 16:42
?>4
>母集団より外の、社会や人類全体に対する一般化は、
>他のデータや理論などから総合的に考察しないとならない、
>つーことだね。
ごめん、なにいってんだかよくわからんです。
それ以前に、統計学でない占い統計「学」なのに、
統計学の手法が使えるとはおもえんのですけど。論理矛盾。いじょ。
概念そのものをちゃんとつかんでないから、
はっきりしたことが言えないんだけど・・・
ベイズ統計学と占いってひょっとすると融合する
可能性があるんじゃないのか、と思う。
だれか、ベイズ統計学に詳しい人いないかなぁ。
だから、占い=統計学ってのは、意外と正しいところを
ついているのかも?とも思う。
ただし、いまんところは、データがまるっきりないんだから、
占い=統計学は、証明不可能だよね。
占い=占い統計学なら、あまりにも未整理な感じがして、
個人的にはタッチしたくないなぁ。
7 :
名無しさん@占い修業中:02/01/15 18:54
ようするに、統計学を意思決定支援ツールとして捉えるか、否か、
ということになるわけじゃないの? 前スレのデータマイニングの話でもあったように。
意思決定を行うために用いる占い、という何気に絡みそうなところで言えばだけど。
統計的有意性の有無をここで議論しても、占いと絡んだデータが
整理された形では残ってないんだから、結論出るも何もないと思うよ。
ゴークランデータはいかにも古すぎるし、いまもあれを参照しなければならない
ってのが、どうかしているような気もするし。
占い=統計学だったら、理論ありきで臨床データにて裏付けをとる手法を用いる
もの全てが統計学になってしまうでないの?
統計学的に立証する占い統計学ってのはありかもしれんが。
細木女子あたりが、学問的な臭いを出すために用いてるに過ぎないと思われ。
(参考)
◆統計(statistics)〔数学〕
--------------------------------------------------------------------------------
確率と共に不確定事象を対象にしているので数学の領域外とされ、一七世紀に
なってようやく数学の仲間入りをしている。「数量の表」はピラミッドや万里
の長城の建造には多数の人、食糧、材料などを記録し、大変古くからあった。
が、数学ではこれをふつう『統計』とはよばない。統計というのは、その表の
奥に含まれているある傾向や特徴などを読みとることである。イギリスにおい
てはジョン・グラントが六十余年間のロンドン市の死亡表から社会統計学を、
ドイツでは三〇年戦争後の状況をまとめた経済学者コリングの国勢統計学が、
今日の統計の出発点で、統計の歴史を大雑把にまとめると、今日まで次の五段
階がある。
(1)記録時代 ―― 統計資料(素朴な統計)
(2)記述時代 ―― 統計学(学問の成立)
(3)関数時代 ―― 数理統計学
(4)推計時代 ―― 推測統計学(確率論を導入)
(5)検定時代 ―― 管理統計学(推計に加え検証もする)
こういう名称が正しいかどうかわからないけど、
逐次更新されるギガバイト単位のデータとコンピュータパワーを用いて行う、
(7)意思決定時代----意思決定統計学(具体的なアクションを起こすための、
意思決定支援を目的とする)
というのは、あると思うよん。そのへんが「意思決定補助ツールとしての占い」
と緩やかに絡んできそうな気も。というか、絡んだら、非常におもろい。
あ、ごめんなさい。
(6)意思決定時代----意思決定統計学(具体的なアクションを起こすための、
意思決定支援を目的とする)
です。
今、会社名を忘れたけど、掲示板の書きこみを
おそらく、テキストマイニング的に分析することで、
近未来的な株価を予測する業務を行ってる会社がアメリカにあります。
日経サイエンスに、載ってました。
これなんか、(6)ですよね。
12 :
名無しさん@占い修業中:02/01/15 21:02
細木女子あたりが、学問的な臭いを
出すために用いてるに過ぎないと思われ。
__ __ .r――――――――
∨ |・・・占いで21世紀の統計学を的中させたんだよ。
日 凸 U | ______
≡≡≡≡≡| / .∧ ∧ / ̄ ̄ ̄ ̄ ̄
U ∩ [] ∨% (゚Д゚ ;) < んなこたぁない
__ ∧∧___ .∧∧|つ∽)_ \_____
( ,,)日 ( ,,)∇
― / | ――.../ | ―――
\(__.ノ \(__.ノ
━┳━ ━┳━
 ̄ ┻  ̄ ̄ ̄┻ ̄ ̄ ̄ ̄
思ったよりも反応がある。やっぱり統計学を気にしている人はけっこういるのね。
さすが2chだ。。。
いや待てよ。よくよく読むと、本当は2,3人か??
>それ以前に、統計学でない占い統計「学」なのに、
>統計学の手法が使えるとはおもえんのですけど。論理矛盾。
そうなんだよね。「こういう命式の人はこうです!!」とか統計学で出しているわけがないしね。>5
占いの古典的手法の正しさが統計学的に証明されるかどうかと言えば非常にあやしい気がするよね。
凄い労力をかけるわりには不毛な結果になりそう。
別に占いだから統計学的に証明なんかされなくっていいのさ。(証明されたりしちゃったら面白いけど)
ただ、「占いにはまる人、はまらない人」とか「占いを信じる人、信じない人」とか
占いに関わる人間についての分析なら統計学の手法を用いて調査はできるだろうね。
ていうか、そういう調査を学生時代にやっておきたかった。。。
SPSS(統計ソフト)はやっぱり高いのか。。。
>統計的有意性の有無をここで議論しても、占いと絡んだデータが
>整理された形では残ってないんだから、結論出るも何もないと思うよ。
まったく同意ですね。>7
ところでデータマイニングって何?過去スレのどのへんにあるの?
あと、
>ようするに、統計学を意思決定支援ツールとして捉えるか、否か、
>ということになるわけじゃないの? 前スレのデータマイニングの話でもあったように。
>意思決定を行うために用いる占い、という何気に絡みそうなところで言えばだけど。
「意思決定を行うために用いる占い」っていうのは、
決断を前にして迷っている人の背中を押してあげるような占いのことと考えてよいの?
それと統計学は果たして関係してくるものかなあ?(疑問)
あと、>8の参考はどこから引用したものですか?
ところで
>細木女子あたりが、学問的な臭いを
>出すために用いてるに過ぎないと思われ。
細木さんはそういうこと言ってるのか。知らなかった。
14 :
名無しさん@占い修業中:02/01/16 16:53
>>5 簡単な例として、
ある占い師のもとに10年間で1万人お客がいたとします。
1万人の中の100人を選び調べ直して、ある法則が見出されたとしても、
それだけでは社会や人類全体に一般化はできない、
つーことです。
>母集団より外の、社会や人類全体に対する一般化は、
>他のデータや理論などから総合的に考察しないとならない、
>つーことだね。
「他のデータや理論などから総合的に考察」してしまったら、それは結局は仮説止まりなんですよ。
フロイトやユングの心理分析と同じ。
なるほどなとは納得できてもその理論の証明のしようがない。
やはり統計学を使うのならばそのルールにのっとってやらないと。
何か統計的有為性のあるデータが出てこなくては不毛でしょうね。
>ある占い師のもとに10年間で1万人お客がいたとします。
>1万人の中の100人を選び調べ直して、ある法則が見出されたとしても、
>それだけでは社会や人類全体に一般化はできない、
「社会や人類全体に一般化」と考え出したらやはりサンプリングをしっかりやるしかないですね。
でもそれは相当難しいでしょう。
学会に出てくるデータだって正しいサンプリングをされていないのは前述のとおり。
それなりのバイアスを許すか、おもいきって母集団を「占いに関わる人」とかに限定しちゃえばいいのよ。
その条件内でそれなりの結果が出ると思うけど。
で、勇敢にもそういう調査をしようとした人っていないのかなぁ。
16 :
名無しさん@占い修業中:02/01/17 15:48
>>15未知のバイアスが多すぎると思うので、
現実的には母集団を限定するしかないでしょ?
でも、たぶん明日の新規のお客は母集団の外の人だなぁ。
17 :
名無しさん@占い修業中:02/01/17 16:22
バイアスの統制をして厳密な母集団に限定すると、
大きい母集団は難しいね。
18 :
名無しさん@占い修業中:02/01/17 16:30
小さな母集団なら、「自分の顧客」という母集団でどうだ?
19 :
名無しさん@占い修業中:02/01/17 17:23
>>18今まで相談に来た顧客が母集団なら、
他人も明日の顧客も別の母集団だから、
これまでの結果は参考にならないな。
20 :
名無しさん@占い修業中:02/01/17 17:27
それにはベイズ統計学が役立つんじゃないかな>19
理解できないので、ベイズがどう役に立つのか
説明してくれ>20
母集団違ったらダメっしょ? OKなの?
22 :
名無しさん@占い修業中:02/01/17 20:32
とりあえずあげよ
自分もベイズ統計学って聞いたことないです。
説明キボーン。
>>20母集団を顧客に限定するのは狭すぎる気がするんですよね。
占いがどうこうはとりあえず置いておいて、自分の周りにいる人、20名くらいに占いに関する質問紙調査をする。
10人が20人ずつのデータを集めれば200人分のデータ!!それなりには使えるでしょ。
その中で「占いを信じますか」とか、「占いに行きますか」とかいう質問分を設けておく。
そうすれば占いへの関心が大きい人とそうでない人との性格特性の違いくらいは見えてきそうだよね。
でも占いと統計学という関わりから言えば、
「占いで言われることが統計学的にも証明されるかどうか」の方が皆さん関心大きいのかな?
(たとえばゴークランみたいな)
データは持ってないけど、過去に行われた占いに関する統計調査って圧倒的にそういうものが多いのかな?
ん?
>>2さんの言ってる占いと統計の関係っていうのはやはり
「占いで言われることが統計学的にも証明されるかどうか」っていうことか。
自分の話はズレてるだろうか。。。
でもその点に関して言えば自分は
>別に占いだから統計学的に証明なんかされなくっていいのさ。
だったりするんだけどね。
僕は占いと統計との関連よりは、占いとラベリング理論や予言の自己成就理論との関わりの方が興味あります。
20は、ベイズをここで最初に言った人じゃないかんね、ちなみに。
そうなのか。それじゃあベイズって結構有名なのかな?
>>24
27 :
名無しさん@占い修業中:02/01/18 22:30
ところで、細木さんのほかに、占星術=統計学説を唱えている人って、
誰がいんだっけ? そういう人に、真意を聞いたほうがはえーじゃん。
28 :
名無しさん@占い修業中:02/01/18 22:31
六星占術は、個人的には、数学的に記述できるほどの、緻密さを
獲得していないような気がする。だから、占い=統計学というのは、疑問。
占い統計学というのは、そのそも成り立ってないしさ。
あ、間違い。占い=統計学ね。
30 :
名無しさん@占い修業中:02/01/18 22:37
Thanks!!
>>26>まぁ、占いだからといって、知的敷居を設ける必要なんかないかんね。
>興味あることは、なんでも勉強するのが、占的には<吉>(w。
禿同!!
>>30統計解析ソフトについてはやはりSPSSやSASを自由に使える環境にある学生を見方につけるとよさげだね。
>>26さんのリンクにあった本をアマゾンで注文したんですけど、
その時に関連本でEXCELで統計解析をやるみたいなのがあって紹介文を見てみたらEXCELでも因子分析できそうなんだよなぁ。
調べてみたら案外EXCELでも使えるのかもしれない。。。
35 :
名無しさん@占い修業中:02/01/20 19:43
うーん、だからさ、占い=統計学と断言するのは、
今の時点では止めたほうが良いようにおもうね。
思いっきり強弁するならば、
(1)記録時代 ―― 統計資料(素朴な統計)
が当てはまるかもしれないかも?とは思うが、
(もちろん、ちゃんと、歴史的な資料が残っていることを前提にだが)
それ、現代では、統計学とは言わないと思うんだよな。
概念群がちゃんと組み立てられていない以上、
占い=統計学論を強弁するとみなが混乱するだけ。
百害あって一利なし。
>>19は別の母集団ってこたーないっしょ?
明日の客は「過去に自分の所にきた顧客」母集団の外部だ。
で、未来の顧客のことを予測するなら、
この母集団が先見情報として役立つことになる。
なぜなら、未来の顧客は、過去と条件が変わらない限り
これまでの顧客と同じ(未知既知)バイアスを持っている可能性が高いから。
だから(バイアスにジャマされて)占い法則の検証は出来ないが、
この占い師にとっては過去の占い法則は(バイアスが原因として)
未来も成り立つ可能性が高い。
占い法則が成り立たなくとも、事前確率を取り込むことによって当たるつーことだな。
有限母集団と無限母集団をごっちゃにして考えている人がいる。
-------------------------------------------------
母集団
ぼしゅうだん population
統計的推論の対象とする事物の集合をいう。
たとえば工場における1ロットの製品の重さとか,
1クラスの生徒の身長とかが母集団をなす。
これらは母集団内の要素数が有限なのでとくに有限母集団という。
これに対し,ある工程で今後生産される製品全体を
考えるような場合もあり,無限母集団と呼ばれる。
母集団からとった少数の標本に基づいて
母集団全体についての推測を行うのが統計的推測である。
その場合,母集団内の要素に特定の確率分布を想定することが多い。
これを母集団分布と呼び正規分布がとくに有名である。
正規分布に従う母集団を正規母集団という。 広津 千尋
(C) 1998-2000 Hitachi Digital Heibonsha, All rights reserved.
なるほど。EXCELの他にここに出ているソフトを買わなくてはいけないのだな。
>>34>概念群がちゃんと組み立てられていない以上、
>占い=統計学論を強弁するとみなが混乱するだけ。
自分もそういうこと思いますよ。
>>35占いは本当に当たるかどうかで統計を取るって言ったって概念の部分がむずかしいと思う。
何をもって「当たった」とするのか。むずかしいような気がするなあ。
だから自分は占いに関して統計調査をするのならば、
「占いに関わってる人、信じてる人、その特徴」みたいな調査になると思うんだよなあ。
>だから自分は占いに関して統計調査をするのならば、
>「占いに関わってる人、信じてる人、その特徴」みたいな
>調査になると思うんだよなあ。
うーん。。。予測できなきゃ、やってても面白くないよね。
それは、もはや占いとは言わないかもしれないけんど。
例えば、
自分の顧客だけが対象:有限母集団
日本人一般が対象:無限母集団
と考えてもよろしいか?
>>37
>40
ようするに、人間の行動を、逐次、計測すれば良いわけでしょう?
いまだったら、現金使わない、カードだけ使っているような
お金持ちの人の、お金の流れは、日時・場所・使用金額・使用対象など
お金に関するすべてのことが計測可能なはず。たとえばだけど。
それをあらゆる方向に広げれば良いわけで。
そういう方向から攻めていくしかないと思う。
息が詰まりますけどね。もちろん。鬱陶しいことこの上ないが、
そういう方法以外、思いつかない。
当たった、当たらないという主観に関しては、
これから先もどうにもならないですよ。それは考えるだけ無駄のような。
43 :
名無しさん@占い修業中:02/01/21 00:46
日本人一般は、成り立たないような気がするけど。
占いの顧客って、かなり偏ってるのでは。。。>41
占いの顧客になりそうな人物像の集合体が、
無限母集団になるのではないかと、思いますけど。
自分の過去に来た客は有限。
現在の日本人全体も有限。
自分の未来の客も10年とか区切れば有限。
未来の日本人は期限切らなければ無限。
でも未来の人間は、分布の条件が変わる可能性はある。
で、ベイズ統計学の出番だな。
さいころの目は未来永劫6分の1と仮定しても良いが。。。。
>36
それ、極論すれば、特定の占い師の元には、
特定の偏りを持った顧客しかこない、つまり、特定の占い師の占い方は、
特定の偏りを持った顧客にしか当てはまらない、ということになりますね。
でも、そっちのほうがすっきりしてわかりやすい。
ヘタに普遍化することができる、と考えるほうが違和感がある。
47 :
名無しさん@占い修業中:02/01/21 01:12
>>42いつ、どこで、だれに、何が(どのように)起こったか、
前もって「当たり」を定義すればできる、かも。
これなら事後の占い師や顧客の主観は要らない。
超心理学の予知能力実験にそんなことがあったような。。。。
いや、それじゃ無理。>47
ようするに、占いによる予測情報が顧客に渡った段階で、
心理的なバイアスがかかることが予想されるから。
全く無関係で、かつ、占いの知識も情報も持ってなく、
さらに興味もない人の行動を、事前に予測できた、それが
何例も続いた、ということになれば話は別かもしれないが。
もっというなら、そういう人に、占いのお勉強をさせたあとで、
予測情報を与えて、以前との行動の変化を調べてみないと、
占いがどういう風に影響しているのか、サパーリわからんはず。
しかも、そういう対象って、ひとりだけじゃ全然だめですしね。
労力と金と暇がなければできない実験ダヨーネ。
50 :
名無しさん@占い修業中:02/01/21 01:43
ふあ〜ぁ。 頭でっかち、尻つぼみ。 煽りではない。 あしからず。
↑くだんないあおりは無視だね。
・
正確には、尻すぼみですね(爆笑)>50
盛り上がってるなあー。
論点が整理できなくなってきた。。。
しかしいずれにせよ実際に実験するのは大変そうだね。
>>46 ソダネ。それを占い師と顧客の相性と言ったりするみたいだけどね。
もし占い法則が成り立つとしても、
バイアスの方が占い法則より影響が大きかったりすんじゃない。
ゴークランデータでも教育の影響が星よりずっと大きかったみたいだし。
占い師の人生経験と顧客のバイアスが上手く合うと良い占い師。
人生経験が占いに必要だと言われることが、それを物語ってる。
買いましたよ。『ベイズ統計学入門』福村出版
>>26 ・・・どこが入門じゃー!!とか思ってしまった。統計学の基礎を勉強する必要がありそうだ。
ていうか数式ありすぎ!!(統計学だから仕方ないのかもしれないけどさ)
ベイズを取り上げてきた人の理由というか気持ちというか・・・、はなんとなくつかめました。
が、、、
>ベイズ統計学と占いってひょっとすると融合する
>可能性があるんじゃないのか、と思う。
とのことですが
>>6 いったいどういう調査になるんだ?質問文はどんなのになるの?何をもって当たりとするの?
などなど、分析以前の問題が山積みのままのような気がします。
なぜならベイズ統計学ってのは(あの本を読んだ限り)データを取った後のデータの捉え方とか処理法についての話でしょ。
「どんな質問文でどんな調査をするとどのような結果が見えてきそうなのか?」
そういうデータを取る前の話を詰めてからしっかり調査しないと「ベイズの定理」までたどりつけないような気がする。。。
それと「主観確率」ってのが出てきますが、その本にこんなことが書かれてます。(17ページ)
「ベイズ統計学はプロは豊富な知識と経験に裏づけされた解析を行なうことによって、アマチュアとは異なる解析を行なうことを積極的に認めるものであるが・・・」
つまり、プロだから事前情報(過去に得られた情報)を元に「主観」で確率を(とりあえず?)決めて解析しても良いです。ってわけでしょ?
・・・それは占いの世界に適用できるのか?
今までにまともな実験で得られた「事前情報」などないと言えるだろうし、第一、「プロだから・・・」
いやあ、占いでプロとか言い出したら大変だろうなあ。もう「主観」なんてみんなバラバラだったりして。。。
そうですねえ、占いで統計学やろうとしてもベイズの定理までたどりつけないと思うんですよ。自分は。。。
もちろん取り上げてきた人の興味にはそれなりにそそられるものあったし、自分も勉強になったから3990円。・・・まあいいかって感じですけどね。
しっかし慶應の経済ってのはああいうのをテキストにして勉強してるんだな。凄い。。。
56 :
間違っていたら訂正してちょんまげ:02/01/24 20:34
>55
いや、人間が判断する際には、常に、
事前の情報を獲得している、そのバイアスの元に
判断している、というのが、ベイズの根本的な考え方じゃないのかな。
占星術しかわからないけど、占星術って、
常に、ある特定の様相を伴う時間軸的な「過去」があるわけでしょ?
それが、うまく結びつかないかな?と思うわけ。
金融関係でも着目されているらしいよ>ベイズ統計学
>>56 >いや、人間が判断する際には、常に、
>事前の情報を獲得している、そのバイアスの元に
>判断している、というのが、ベイズの根本的な考え方じゃないのかな。
それは同意。
そのバイアスの元に判断する資格があるのはプロだけよ。ということでしょう。
>占星術しかわからないけど、占星術って、
>常に、ある特定の様相を伴う時間軸的な「過去」があるわけでしょ?
うーん、占星術に限らず何だって過去はあるわけだしなぁ。
占星術に特有な「ある特定の様相を伴う時間軸的な「過去」」ってのは例えば何?
>金融関係でも着目されているらしいよ
たしかにそんな感じは受けた。
経済を取り巻く環境は日々変わるわけでしょ?そうすると、(既出の本、12ページ)
「未知母数そのものを変動する量としてとらえる」ベイズ推測っていうのは経済とかやってる人には魅力な気がするね。
一般的に使われていると思われる「標本理論」っていうのは母集団の性質は変わらないものと捉えている。
しかし対して「ベイズ推測」では母集団の性質は変わっていくものと捉えている。
特に経済ではベイズの方がよさそうな気がする。
うーん、占いとどう結びつくのか。
考えてみますけどね。。。
58 :
名無しさん@占い修業中:02/01/25 01:59
経済だけでなく人間を取り巻く環境は日々変わり、占いは人間を対象にしている。。。。
50です
けど、{尻すぼみ}の間違えでした。 尻が、つぼんだって、しょうがないですよね?
61 :
間違っていたら訂正してちょんまげ:02/01/25 23:03
いや、ちょっと違うかな、いいたいことが、自分とは>57
プロとかプロじゃないとかってのが、問題になる以前に、
数学的に記述するんだからして、
結局のところ、数式を理解できるか、理解できないかが、先に立つはずです。
>プロとかプロじゃないとかってのが、問題になる以前に、
>数学的に記述するんだからして、
>結局のところ、数式を理解できるか、理解できないかが、先に立つはずです。
それも大事ですね。
>>61 でも社会学者で統計使う人は因子分析のバリマックス回転のこととか数学的に理解してない人も多そうな感じだったよ。
文系だから数学は苦手でいいやー、みたいな。
でもその数式が結局のところ何を表すのかは理解しておく必要はあるだろうね。
数学は道具ですからね。一応原理のアウトラインをつかめればよいのではないかと。。。
話題転換。
最近、誠信書房の『占星術−科学か迷信か』を読んでいます。
ここでもたびたび出てきているっぽいアイゼンクとナイアスの本ですね。
立派そうな本なんで今までびびっちゃって敬遠していましたが、ついに購入しました!!
このスレが刺激になって統計を少し勉強したのですが、
初歩的な統計の話が分かれば、なんとかこの本は理解できそうという手ごたえを感じます!!
占星術と(科学的な)統計学の関係についてはこの本を読めば何か見えてくるんじゃないかな?
僕はまだ3分の1くらいしか読んでないけど、全部読んだ人、感想キボーン。
で、初歩的な統計の考え方については
ナツメ社の図解雑学シリーズの『統計』を読めばなんとかつかめると思います!!
(少々複雑な数式についてはとりあえず飛ばして読むべし!!)
ということで推薦age
64 :
名無しさん@占い修業中:02/02/08 16:48
アイゼンク・・・・あれは統計より、
占星術を科学的な研究対象として扱う参考になる。
ずっと前に、名前は忘れてしまったのですが、拾った本に、
奇形児を産む女性は決まって太陽と月がオポってると書いてあって、
まぁそれは乱暴だとは思いますが、そういう人はこういうアスペクトの
時を狙ってセクースしれば正常な子ができるとか、書いてありました。
66 :
名無しさん@占い修業中:02/02/08 21:49
67 :
名無しさん@占い修業中:02/02/08 22:46
68 :
名無しさん@占い修業中:02/02/09 22:14
69 :
名無しさん@占い修業中:02/02/10 02:47
占いは統計じゃないよ 統計だったら人間の生態はガウス分布になると思うけど、
本物の占いではそんなことはない。これは当たらない占いしか知らない人たちの逃げ道。
真理はほかにあるよ。
70 :
名無しさん@占い修業中:02/02/10 11:42
「真理」だなんて、まるで宗教家みたいな物言いだなぁ。。。
正規分布になるも、ならないも、なにも、「本物の占い」の、
データなんかどこにもないのに、なんでそんなこといえんのだろう?>69
それよか、今の段階で占い=統計学って断言している人を
厨房のスクツ(Wの2chでなんとかしてほしいにゃー。
ここで論破される程度なのに、他で主張することなんて
とてもじゃないけど、できんはずだしさー。
これ、今の段階では、どう考えてもカテゴリーエラーでしょ。
これから先、指一本一本の曲げ伸ばしや
視線移動の逐次データを取れるようになるから、
そんとき、もしかするとゆるーく繋がるかもしれない?ってだけでさー。
71 :
名無しさん@占い修業中:02/02/10 22:03
72 :
名無しさん@占い修業中:02/02/17 16:48
芥川賞、および直木賞受賞作家のデータでしょ?
この人よく調べてるよね。感心します。
>>72 それではアイゼンクの『占星術−科学か迷信か』もひととおり読んだことだし、議論(?)に参加いたしましょう。
>>72のデータは出生時間は不明として
(1)各惑星がどのサインにあるか
(2)オーブを8度としてコンジャン、セクスタイル、トリン、オポのアスペクトを持っているかどうか
の2点を見ていますね。
(1)についてはデータを集めたYAJIさん?も指摘しているように
出生時間不明なので月、および動きの遅い天王星、海王星、冥王星は見てもしょうがないだろうね。
僕はさらに地球の内側にある水星と金星も見てもしょうがないように思いますね。
(2)についてはYAJIさん自身、これといった影響がなさそうと言ってますね。
アスペクトの影響は全くないのか!?
標本数は合計で278人ですからこれから先の研究のきっかけにはできる数だと僕は思います。
(ていうかこのくらいの標本数の調査なら学会に出てると思います。)
ということであとはこれらのデータを統計ソフトに入力して分析なんでしょうが・・・。
統計ソフトが欲しい。
ちなみに科学的な追試に耐えているらしいゴークラン夫妻のデータでは
なーんと12室と9室にある惑星が影響を持つってことでしたよね。
その点ではやはり出生時間が分からないときついですよね。
太陽のサインについては上記の本ではヴァン・ドイゼンの研究などが触れられてましたね。(p78)
ありゃー、すごい!!数が半端ない。あの実験は太陽のサインしか見てないんだけど、
他の惑星のサインも見てくれてりゃよかったのに。。。
今日はこんなところで。
74 :
名無しさん@占い修業中:02/02/18 23:10
僕も見てきました。
でもデータ数は少ないように思います。
でも芥川賞、直木賞作家では仕方がない。
YAJIさんはどれだけ出生時間のデータを持ってるんでしょうか。
次回に期待です。
標本数が多いか少ないかはやっぱり意見が分かれるんだろうな。。。
でもきっとなんらかの参考にはなると思うんですけど、
もう私的には「アスペクト意味なし!!」って部分が気になってしゃーない。
どうですかね?
で、公開されていた出生データで僕も分析しようと思ったのですが、
278人のデータ入力はキツイヨ!!時間もない!!
じみちーにやろうかと思っています。。。
76 :
名無しさん@占い修業中:02/02/19 02:32
統計とるなら278人程度で弱音吐くなよ〜。がんばれ>75
それより、どんな手順で検証する気なの?
生年月日以外の入力項目は何?
77 :
名無しさん@占い修業中:02/02/19 17:57
>>75 僕も打ち込むの嫌だったのでYAJIさんにメールでお願いしたら
データを送ってくれました。
78 :
名無しさん@占い修業中:02/02/19 18:36
データ分析やろうとしている人に水をさすつもりは無いんですが、
ちょっと気になる点を質問。
天体のサイン分布やアスペクトなど、調査項目が多数になれば、
どこかに偏りが見つかる可能性が高くなります。
それで疑問というのは、
実験計画を立てる必要性は無いのですか?
79 :
名無しさん@占い修業中:02/02/19 21:41
統計学のこと良くわからないんだけど、
ここで、無料統計ソフトRの使い方と
統計学をちまちまベンキョしない? 占い好きのみんなで。
興味あるデータを元にすれば、
そーゆーのなんかやりやすいじゃん。
厳密なこと言っても、データないんだから、
どこまでもできないことはできないからさー。
もうちっと前向きに考えるほうが吉だよ。
80 :
名無しさん@占い修業中:02/02/20 00:59
まじですか!!
>>77 各受賞者の惑星のサインと度数を教えてくれるのですか?
もう私はアスペクトは意味なさげなのであきらめて、サインだけを入力してます。
昨日はしこたま入力してたのですが・・・、
そうなんです!!実験計画!!
>>78 気づいてしまいました。全受賞者の各惑星のサインを入力していてふと気づいたのですが、
このデータをどうやって処理するんだ?
多変量解析っていったって何と何をどうするんだ??
ということでHPに公開されている「各惑星のサイン別合計数の表」をもとに
とりあえず、このデータには有意な偏りがあるのかどうかで考えることにしました。
>>79 私はEXCELです!!
で、以前紹介したナツメ社図解雑学シリーズ『統計』で考え方を学習し、
オーム社開発局の『Excelで学ぶ統計解析入門』を見ながら格闘中です。
図解雑学シリーズは分かりやすいと思います。いかが?
一応ここで勉強するといってもTEXTになるような本はあった方がいいでしょうし。
とかいっても買うのにお金かかるからなんとも難しいかもしれないですけどね。
で、今のところですね、
⇒明らかに有意な結果が出てるみたいなんですよ!!
んなバカな!?と思っているので明日にでも統計スレに逝って自分の分析は間違っていないか質問しようかと思っています。
やっぱり標本数が少ないのかなぁなんて思い始めた。。。
さーてさて、きましたね。
>>80 >確率統計は科学でないらしい→心理学も・・?
そういう議論はあるらしいですね。
僕は科学の定義しだいだと思いますけどね。
結局は自然科学(古典物理学?)で用いられた方法がうまくいったからそれを社会科学etc.にも適用しようってところからその問題は始まっているんだと思いますけどね。
うーん、どうなんでしょうね。考え中。
で、
>>78さんの
>天体のサイン分布やアスペクトなど、調査項目が多数になれば、
>どこかに偏りが見つかる可能性が高くなります。
という話なんですが、
それはアイゼンクの『占星術−科学か迷信か』でも突っ込まれてたとこですね。
ゴークランはそのへんを分かっていて「追試をした!!」わけですよね。
上記の質問に対してのとりあえずの答えは「要追試!!」ってことなんでしょう。
でもYAJIさんのデータは芥川賞、直木賞作家だった。
追試するには次はどんなデータを使えばいいんだ??
82 :
名無しさん@占い修業中:02/02/20 16:01
だから、予備調査、実験計画。
83 :
名無しさん@占い修業中:02/02/20 16:32
データに有意な偏りがあるって、対象群と比較した?
>>81 YAJIさんが送ってくれたデータは牡羊座0度を0度として
360度で表した数字でした。
アスペクトもそれから計算式で出ています。
ちなみにEXCELでした。
でも自分では何も出来ませんでした。
対象群!!対照群!?どっちだっけな。
・・・まぁとにかく、その問題があるんですよね。
そうなんですよね。うーん。(困)
⇒僕がおこなった方法(太陽のサインで説明)
平均値を出す(データ数278を12サインで割るんですから23.17くらいの値が得られる)
太陽のサインと受賞者に何の関連もないとすれば当然どのサインも23くらいの値になるはず。
しかし実際は双子座の11から牡羊座、水瓶座の36までばらつきがある。
このばらつきに意味はあるのか?それを調べていく。
それぞれ、〔各サインの数〕−〔平均値23.17〕の値を出してそれを二乗する。
例えば牡羊座なら36−23.17=12.83の二乗となり、164.6くらいになる。
各サインにおけるこれらの数値を足す。895くらいになる。
この数を平均値23.17で割る。38.66くらいになる。
この38.66が偏りの大きさを表す数になる。
これをχ二乗(かいじじょう)分布表というものにあてはめて意味のある偏りなのかどうか判断する。
以上、χ二乗(χ自乗?)検定と言われるものです。
このへんの考えが前出した図解雑学シリーズの『統計』を読むと分かります。
で、この検定をおこなって5%有意になったものは、
太陽、水星、金星、木星、土星、天王星、海王星、冥王星でした。なんと10惑星中8惑星!!
しかし当然のごとく土星外惑星は動きが遅いので偏りがでる。
太陽が有意となれば地球内惑星の水星、金星も有意となりやすい。
ということで太陽、木星、土星について考えればよいかと思っているのですが・・・。
ちなみに「5%有意」という考えなのですが、
「母集団に偏りがない」と仮定するとこのような偏りのデータが得られる可能性が5%以下だ。
てな感じでしょうか。
「母集団に偏りがないとすれば、こんなデータは20回データを取った内の1回しか出ないぞ!!
つまり母集団には偏りがあるんじゃねぇのか?」
これでお分かりになるでしょうか?
さて、以下次回。
>81
>追試するには次はどんなデータを使えばいいんだ??
ノーベル賞受賞者とかでもいいの?
87 :
名無しさん@占い修業中:02/02/21 16:13
>>85 >「母集団に偏りがない」と仮定すると
多分、母集団には偏りがあるでしょう。
昔の日本では、季節ごとに生まれた人数が違うので。
88 :
名無しさん@占い修業中:02/02/21 16:15
>>86 「ノーベル賞受賞者と文学者が同じ太陽サインに特徴を持つ」
という占星術理論はある?
89 :
名無しさん@占い修業中:02/02/21 20:22
前のスレの轍を踏まないために、
統計学とはなにか? 占いとはなにか?
占いと統計をくっつけて語りたがる奴らはなんだ?とか、
そのへんからノロノロやってかない?
文献調査でもなんでも良いから。ほかにはURL調べたり。
数学板で聞いてきた結果報告とかさ。
正直言って、82さんが言うような実験計画なんて、
とてもじゃないが無理じゃん。今のレベルでは。
そんなの読んでてすぐわかるっしょ。
占いって時間扱う分野なのに、パート2の
今の時点でも時系列解析のさわりさえ出す人いないのに。
やんないことはわかんないんだから、統計わかんないのは、
恥でもなんでもないよ。わかんないことを自覚したら、
自分が満足するまで、ノロノロ、ベンキョすりゃーいいだけだもん
ごめん、87さんは、さわりならだしてた・・・。スマソ。
91 :
名無しさん@占い修業中:02/02/21 23:04
>>87 現在の日本でも季節的な偏りはあるようです。
もちろん昔と分布は違いますが。
だから実験群と同じ時期に生まれた人達の分布と比べて見ないことには、
偏りは分からないんですね。
AFAでは一応、実験群と一定の日数だけ離れた年月日のデータは、
コントロールと扱っているようですね。
そう、僕も生まれた季節には偏りがあるんじゃないかって思ってる。
どうやったら調べられるんだろう。
ということで実は太陽、および水星、金星については疑わしいと思ってる。
しかし木星と土星についてはどうなんだろう?
1897年生まれの人から1975年生まれの人がいるんだもんなぁ。
範囲、幅広いよなぁ。
で、対照群なんですけど、例えば実験群の10日後に生まれた人のデータを使えばいいってことか?
木星と土星については、そのやり方じゃほとんど同じだろうしなぁ。
しっかし、その情報!!
>AFAでは一応、実験群と一定の日数だけ離れた年月日のデータは、
>コントロールと扱っているようですね。
もしかして91さんってAFAの会員?
やっぱ僕も英語の文献読まなきゃダメなんだろうなぁ。
アイゼンクの本だって1982年のものだから今はまた違うデータが出ているだろうし・・・。
>>89さん
>前のスレの轍を踏まないために、
>統計学とはなにか? 占いとはなにか?
>占いと統計をくっつけて語りたがる奴らはなんだ?とか、
>そのへんからノロノロやってかない?
>文献調査でもなんでも良いから。ほかにはURL調べたり。
>数学板で聞いてきた結果報告とかさ。
そうですね。
やっぱここ2chなんで、きっかけはいろいろ転がってても結局は自分で勉強するしかないとは思いますけどね。
「きっかけ」となる情報をいろいろ出し合うのはいいと思います。
ただ、収集つかなくなっちゃわないかなぁ?という心配はありますが。
しかもここは2chですから、情報そのものを疑う必要もありますし。(でもどこでもそうか)
「占いと統計をくっつけようとしている人たち」については特に興味ありますけど。
93 :
名無しさん@占い修業中:02/02/23 17:01
あげる
94 :
名無しさん@占い修業中:02/02/23 18:31
>実験群と一定の日数だけ離れた年月日
もちろん何をコントロールするのかによって、
使えない場合もあるし、日数を変えたりしますね。
あくまで仮に使う年月日ですから。
季節による出生数の違いは一部は石源の本にあると思う。
95 :
名無しさん@占い修業中:02/02/23 18:50
実験群って統制群とセットで考えられるんじゃないのかな。
実験群について知りたくて、ネットでたまたま引っかかったのは、
http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc003/075.html だけど、統制群ってここでいう、コントロール群のことね。
以前は、コントロール・グループといってた>おれ
占い統計学では、何をもって統制群とすんの?って疑問が常にあるんですけど。
あと、認知心理学でマガーク効果知って、
実際にそれを体験したときには、
なるほどねーと思ったんだけど・・・。
統制群の問題を考えるときって、
そういうのを頭から無視して、考えるのも。。。
そのへんのこと、考えている人っています?
96 :
名無しさん@占い修業中:02/02/23 20:20
アゲル
97 :
名無しさん@占い修業中:02/02/23 22:48
>>95 実験データを集めるときには、
コントロールすべき要因を前もって検討する必要がある
って言いたいのかな?
あぁぁ、
>>92で対照群という言葉と対で実験群という言葉を使っている。
そんなに細かい定義ってのは今一分からないんだよなぁ。ごっちゃになってるかも。
統制群と対照群では微妙に違うと思いますよ。
例えば
「占いの知識による自己暗示効果について検証する」ことにする。
例えば12星座についての本を読ませてから自己分析テストをやらせるのが実験群。
本を読ませずに自己分析テストをやらせるのが統制群。
何かの実験をする時に統制群というのが必要なのであって、
芥川賞直木賞受賞作家のデータに対して考えるときは対照群でしょう。
別に実験をしたわけではないのだから統制群ということは考えなくていいと思う。
まぁ、細かいかもしれんが。。。
「マガーク効果」面白いですね。
でもそれと統制群の問題がどう関わるのかは今一分からないです。教えてキボーン。
さてさて、受賞者は1892年から1975年に散らばっているので
1892年1月1日から1975年12月25日の間、
木星がいたサインの比率を出して受賞者のデータと比較してみました。
1892年から1975年までの木星(カッコ内は日数)
牡羊 8.26(2533)
牡牛 7.57(2322)
双子 7.89(2419)
蟹 8.42(2583)
獅子 8.49(2602)
乙女 8.99(2755)
天秤 9.05(2774)
蠍 8.93(2739)
射手 8.67(2659)
山羊 8.10(2483)
水瓶 7.80(2391)
魚 7.83(2402)
直木賞、芥川賞受賞者データ(カッコ内は人数)
牡羊 6.83(19)
牡牛 5.04(14)
双子 3.96(11)
蟹 8.63(24)
獅子 9.35(26)
乙女 9.71(27)
天秤 10.43(29)
蠍 10.07(28)
射手 11.87(33)
山羊 8.99(25)
水瓶 8.63(24)
魚 6.47(18)
どうやればこのデータが有意かどうかが分かるんだろう。考え中。
二つを比べてみると、双子で少なく、射手で多いのが目立ちますね。
もしかして双子が敗で射手が盛だから??(魚についてはサブルーラーだから無視するとして)
「成功する人は木星がよく働く!!」・・・なんちゃって!?
100 :
名無しさん@占い修業中:02/02/24 02:06
やってますね>99
このデータからなら、木星の在泊率を理論値として
作家のデータを分配していいんじゃないかな?
101 :
名無しさん@占い修業中:02/02/24 02:10
理論値
牡羊 278×8.26%=23人
以下省略
102 :
名無しさん@占い修業中:02/02/24 02:14
理論値の前提は、この期間の出生率が一定している。
103 :
名無しさん@占い修業中:02/02/24 02:48
牡羊 牡牛 双子 蟹 獅子 乙女
理論値 23 21 22・・・
実測値 19 14 11・・・
104 :
名無しさん@占い修業中:02/02/24 03:02
>>102 作家全体の中での受賞者の比率もできれば欲しいところ。
理論値の前提には、全年代を通して作家の比率は一定も。
105 :
名無しさん@占い修業中:02/02/24 16:56
>>102 戦後の1次ベビーブームには木星射手があるな、多分。
>芥川賞直木賞受賞作家のデータに対して考えるときは対照群
これ、作家さんがどうこうというよりも、
なんかわかるとするなら、その時々の賞の専攻委員の
嗜好のようなもんじゃないのでしょうか?
そっちのほうの可能性は調べなくて良いんでしょうかね?
統制群を出したのは・・・。
戦後日本に大々的に占星術情報が
ばら撒かれたんだけど、割りと厳密にやろうとするなら、
戦前の受賞者とそれ以降の受賞者を
わけて検討する必要があるんじゃないですか?
ある時期以降の日本人って、占星術情報を
DMでばら撒かれて、マーケティングされているのと同じだと思います。
ぼくらは、占星術をはじめとした占い情報に、酷い言い方をするなら、
メディアを介して、脳みそがすっかり汚染されちゃってるわけですよ。
行動を方向付けるような情報として、占いの情報はセッティングされていた、
と思いますしね。
偏差を出すための、前段階として考えなければならないことが
もっとたくさんあるとおもうんだよね。
まぁ、結果だけを占いの有効性として簡単に意味付けることは
よもやないとはおもうけど。データとしても単純過ぎるし。
108 :
名無しさん@占い修業中:02/02/24 17:35
木星といえば歳星、干支。
東洋占いの影響もバイアスになるかもよ。
109 :
名無しさん@占い修業中:02/02/24 17:43
君たち、統計出すときばっかり理屈こねるね。
普段、占いをするときはあっさり言うのに。
ものすごいめんどくさいこと考え始めたら、
芥川賞、直木賞ってものが、本当のところ
どんな感じで決まってるのかを、調べる必要もあるよね。
どんどん増えていく情報軸をカットして、
見栄えのする有意な結果を提供するってのが、
その人のセンスになっちゃうんだろうけど・・・。
111 :
名無しさん@占い修業中:02/02/24 17:47
わはははは>109
占いは大雑把で良いんだもん。あんまりなんも考えないで、
えいやっと直感で結果を提供しても、みんな納得するじゃん(w。
統計って、それなりに、情報を扱うための
ルールがあるじゃないスカ。
112 :
名無しさん@占い修業中:02/02/24 18:15
有意さが有ったとしても、その原因を
星の直接的影響と考える積極的根拠はないわけだ。
考えられる他の影響を全て統制しても有意さがあれば追試を行ってみる。
113 :
名無しさん@占い修業中:02/02/24 18:30
>>110
占星術の知識による汚染?は内容によっては大きくないでしょう。
例えばアディ調波による分析では、
先行知識のバイアスはほとんどないと思いますので、
その方法ではどうでしょう。
>110
アディ調波って、以前ソフトで図を出してぼんやり眺めていたくらいの
理解しかないので(すみません)、それがいったいどういうものとして
統計分析と結び付けられて理解されているのか、
わからんのでもうしわけないんですけど。。。
ここでやってるのは、星座レベルの話ですよね?>113
あとひとつに気になってるのは、太陽の位置(=星座)以外の
ファクターは、考えられて当然ではないか、と。
版元の出版傾向とか、その年に売れたベストセラーの傾向とか。
芥川賞とか新人賞だから、これから売って行きたい傾向の小説に
受賞するとも考えられますし。。。
普通、星座はセグメントには使いません。これ前もいったけど。。。
どこまでも、分析要素のひとつ、だと思います。。。
おもしろい試みだとは思いますが。。。
これ、本当に有意な結果が出たら、
予測技術として採用されるかも? いや、マジで。
だって、今の予測技術だって、結局最後の最後は、
マンパワーというか、直感だよりというか、そんな感じじゃないのかな。
呑んでいる席で聞いた話なので、あれなんですが。。。
視聴率調査予測で、確度の高い結果を出している会社があるけど、
ドラマの要素とかを細かく数値化して、数学的に処理して結果出してる
らしいです。かなり酔っ払ってたんで、あんま信用しなくても良いですけど。。。
べつに、占い情報ばら撒き作戦(wによって
戦後日本人の脳が影響されているのが問題じゃなくて。。。
影響されているなら、それを積極的に考慮して、
予測しよう、というのが趣旨。
予測って言うか、立場によっては、制御になっちゃうかもしれませんが。
117 :
名無しさん@占い修業中:02/02/24 21:39
118 :
名無しさん@占い修業中:02/02/25 01:36
120 :
名無しさん@占い修業中:02/02/25 20:33
そりゃそうだよ>118
物の本によると、バビロニアの宗教儀礼と
ワンセットだったらしいし>占星術
121 :
名無しさん@占い修業中:02/02/25 22:12
>>89 >占いと統計をくっつけて語りたがる奴らはなんだ?とか
同時に「占いを宗教として語りたいやつらはなんだ?」とかも
考えんといかんなぁ。
ひょっとして無知なやつ多い?
一応、占星術って神秘主義史の中でも、ポジションあんだけど。
占星術を神秘主義のポジションにとどめておきたい奴らはなんだ?
124 :
名無しさん@占い修業中:02/02/25 23:11
>>99 このデータから偏りを見つけることが出来ても、
それだけでは木星の影響と言えないところが、
統計ソフトの使い方を知っただけでは対処できないところですね。
(データを統計的に処理する場合には普通のことですが)
125 :
名無しさん@占い修業中:02/02/26 00:18
ああああ
無知でゴメソ・・・
ヒソーリエツランシテハイルノデスガ
サンカデキナイジブンガカナシイ
126 :
名無しさん@占い修業中:02/02/26 00:52
127 :
名無しさん@占い修業中:02/02/26 01:01
木星の影響が無いなら偽の関連だな。
それともバイアスが原因だとしても「関連がある」と言いたいわけ?
星座「だけ」の偏差を求めて、それのみで結論出すのは、
間違いなく、統計の嘘、だよ、それ。
だって、車に乗らない人は、交通事故の確率下がるじゃん。
車に乗りやすい傾向を、星座「だけ」が示しているならともかく。。。
偏差を求める対象に最も密着するセグメントを設定するのが、
ふつーの感覚だと思うんだよね。
星座のような、あらかじめ定められているセグメントは、
たとえ、有意であったとしても、次の次の次・・・くらいじゃなの???
129 :
名無しさん@占い修業中:02/02/26 21:35
そうです。わかりにくくてすんません>129
131 :
名無しさん@占い修業中:02/02/26 21:47
育ってるよ(’◎’)!! ←一応驚いている
>>芥川賞直木賞受賞作家のデータに対して考えるときは対照群
>
>これ、作家さんがどうこうというよりも、
>なんかわかるとするなら、その時々の賞の専攻委員の
>嗜好のようなもんじゃないのでしょうか?
>そっちのほうの可能性は調べなくて良いんでしょうかね?
などなど。たしかに原因はいろいろ考えられるよね。
たしかに普通の感覚でいっても受賞者と星を結びつけるってのは??だよね。自分もそう思う。
(ん?しかしここは占術理論実践板だから星と結びつけるほうが普通の感覚なのか!?)
やはりいろいろな可能性を考えるべきでしょう。
134 :
名無しさん@占い修業中:02/02/28 01:02
>>131 でも占いが当たったかどうかは検定で見るしかないんだけどねえ。
135 :
名無しさん@占い修業中:02/02/28 18:13
バイアスをコントロールした上でね>134
バイアスのコントロールの具体的やり方がわかるサイトを教えてください>135
あり物のデータ使うなら、最初の最初にデータを選択するところそのものが重要と言うか、
そこでできるだけ、データに人の恣意が混入しないような対象を選ぶとか、、、
そういうのが「センス」(爆)のひとつであって。。。
いま、具体例なくバイアス云々と言う、そういうことを話しても、
統計教えてくんにはわかりませんん。。。
たとえば、ここでちょこちょこデータいじってるような
小説の賞なんて、人間の意思や意図が入りまくりじゃなすか?
そんなのどうやって検証すんの?とか思っちゃうんですよ。
いきなり、そーゆー難しいところへ入りたがる人の気持ちがわからん。
もっと簡単なところからやるのが普通だろう。。。と。
137 :
名無しさん@占い修業中:02/02/28 18:58
どんなバイアスをコントロールしたいかで方法は色々。
文学賞なら選考基準も影響するだしょ。
でも検出したい要因以外を全て同じ条件にしたデータを集めるのは無理だそ。
まあ最低、同じ年同じ月同じ場所で生まれた人とかで条件を合わせて比べたい。
138 :
名無しさん@占い修業中:02/02/28 20:07
よーするに、もちっと簡単なデータでやるしかないべ。
140 :
名無しさん@占い修業中:02/02/28 23:24
>>138 それにしたって、太陽星座は先行知識の影響が多いと思われ。
検出したい要因をはっきりさせた方が、どんなデータにするか考えられるべ?
141 :
名無しさん@占い修業中:02/03/01 01:27
極端なこといえば統計では例数さえ増やせばある要因に対する割合が
0.51と0.49でも有為差はつくことがあります。
さて,この場合,実用上でなんか意味が有りますか?
142 :
名無しさん@占い修業中:02/03/01 02:41
テーマによるかも。ギャンブルや金融なら?
土星も調べました。
1892年から1975年の平均(カッコ内は人数)
牡羊 8.17(2507)
牡牛 8.29(2542)
双子 7.91(2426)
蟹 7.42(2276)
獅子 5.77(1769)
乙女 6.21(1904)
天秤 8.78(2693)
蠍 9.47(2905)
射手 9.61(2947)
山羊 9.99(3066)
水瓶 9.27(2845)
魚 9.13(2801)
直木賞、芥川賞受賞者(カッコ内は人数)
牡羊 7.91(22)
牡牛 5.40(15)
双子 5.40(15)
蟹 5.40(15)
獅子 6.83(19)
乙女 5.40(15)
天秤 6.47(18)
蠍 12.23(34)
射手 12.95(36)
山羊 13.67(38)
水瓶 11.15(31)
魚 7.19(20)
獅子から天秤までが少なく、蠍から水瓶がグンと多いですよね。
山羊がピーク(一番多い)ですから、「やはり格式って重要だった?」って思うかも知れませんが・・・、
いや、やっぱり思わないか。
もっとデコボコしてれば木星や土星の影響がある?とも思いやすいんですが、
データ数が278。12で割れば22くらい。数値が2,3違えば大分違う結果になりそうだもんな。
やはりデータ数が少ないのかもしれない。
そしてどうしても人口数や世代の影響を考えてしまうんでうよね。
そちらの方が影響大きいんじゃないか?
それでは以下のちほど。
次に5年刻みで受賞者の出生年の偏りを見てみました。(1年刻みでは見づらかった)
1890年〜 2 1895年〜 10 1900年〜 14
1905年〜 16 1910年〜 19 1915年〜 12
1920年〜 24 1925年〜 36 1930年〜 36
1935年〜 23 1940年〜 11 1945年〜 26
1950年〜 12 1955年〜 20 1960年〜 11
1965年〜 4 1970年〜 1 1975年〜 1
当然若い世代はまだ受賞者が少ないし、昔はこれらの賞がなかったんだから
グラフにすればいわゆる「正規分布」のような形になっていいと思われます。(違うかな?まぁいいや)
つまり両端は少なく真中が多いということですね。
グラフにしてみて目を引いたのが、受賞者の少ない年代として
1915年〜の世代、1940年〜の世代ですね。(1950年〜も少ないですけどおいといて・・・)
で、反対に受賞者の多い世代としては
1925年〜、1930年〜の世代(つまり1925年からの10年間)と1945年〜の世代。
結局のところ、世代の影響かなぁと思い始めました。
国勢調査のサイト
ttp://www.stat.go.jp/data/kokusei/2000/6.htm でも人口統計を見てみたんですけど、
1915年〜の世代って戦争でたくさん亡くなってるみたいですね。
1945年の調査結果を見ても
16歳から20歳は約385万人、21歳からは約202万人、
26歳からが約160万人と谷底になっていて、
31歳からが約180万人、36歳からが約198万人、41歳からが約204万人
ということで、この世代の方々はたくさん戦争の犠牲になっている!!(まあ、犠牲というと少し聞こえが悪いかもしれませんが)
つまり1915年〜の世代は受賞者が少なくて自然。
次に1925年から10年間の世代は多感な思春期の前後を戦争で過ごしているということですね。
いわゆる戦中派とは定義が違うのかなぁ。
でもどちらにしてもそういう経験をした人の中に受賞者が多いのは自然に感じられるんですよね。
そして1940年〜の世代は戦争のど真ん中だし、
その次の5年間はベビーブーム。
なんだか納得。
実は1940年〜の世代人口はそんなに少なくないみたいだし、
1950年〜の受賞者数が少ないという「謎」も残っていますが、
それは僕が各世代の特徴を知らないからですかね?
調べてみれば結局は世代の影響が大きいような気がするんですけどねぇ。
あ、実はその世代の影響に星が関わっているのか??・・・うーん。(困
各年代と木星、土星のサインの関わりについては次回。
145 :
名無しさん@占い修業中:02/03/01 18:12
各年代と木星のサインの関わりについてです。
1915年〜(受賞者が少ない世代)
1915年1月1日は水瓶だが2月4日から魚。
1919年12月31日は獅子。(この年の8月から獅子)
⇒魚から獅子は少ない。
1925年〜(受賞者が多い世代)
前年の12月18日から山羊に入っていて
1934年12月31日は射手。(この年の10月から射手)
⇒ほぼ一回り。あまり影響はなし?(ただし1934年12月31日で区切ってしまうと射手はやや少ないか?)
1940年〜(少ない世代)
1940年1月1日は牡羊。5月16日から牡牛。
1944年12月31日は乙女。(この年の7月から)
⇒牡羊から獅子は少ない。
1945年〜(多い世代)
1945年1月1日は乙女からで
1949年12月31日は水瓶。(翌年4月まで)
⇒天秤から水瓶は多い。
こうやって見ると受賞者には天秤から水瓶が多く、牡羊から獅子までが少ないだろうと推測できる。
グラフと照らし合わせると納得してしまう。
土星については割愛。
前半のサインが少なく、後半のサインが多いことが予測できる。
しかしここまでやって、
今自分がしていることは意味がないかもと思ってしまったのだがどうなのだろう。
なにかズレている気がする。
受賞年齢!!
それも必要だよな。。。
148 :
名無しさん@占い修業中:02/03/01 22:32
>>146 ずれてないと思うよ。
天体の位置以前の、年代的な偏りを除くことは必要な手順ですよ。
それで例えば、どんな賞であっても
「受賞者は木星土星が支配サインにある人が多い」とか仮説を立てれば、
他の分野の受賞を含めて時代も地域も考慮しながらやってみることができる。
>>148 たしかに仮説は立てられますよね!!
以前ノーベル賞というのが出ていたけれど、例えば
「ノーベル賞受賞者は木星射手が多い」
とかね。
まぁ、今やっていることも今後の研究のための何かのきっかけになればよいかな。
ところで木星と土星よりも太陽の方がデコボコしたグラフになるんですよね。こっちの方が影響ありそう。
でも太陽だと
>>140さんも指摘の「先行知識の影響」問題が出てきそうだよなぁ。
この点はたしかアイゼンクの本にも取り上げられてましたね。
ところで、お隣の板でもこの問題を取り上げてたのね。意外。
>>139 ところでところで、バイアスコントロールの話は難しい…。
とりあえずもっとも考えられた世代の影響を考慮してみたわけですが、既出のように選考委員の問題なども考えられる。
よーするに「実験の限界」があるんだろうなとは思うわけで、調べられる範囲でやるしかないとは思います。
で、あとは仮説を立てて追試をすると。実は追試にもいろいろ条件はあるようなんですが…。
ところでところでところで、
>>141さん
こんなことは分かってらっしゃるかもしれませんが、
>極端なこといえば統計では例数さえ増やせばある要因に対する割合が
>0.51と0.49でも有為差はつくことがあります。
>さて,この場合,実用上でなんか意味が有りますか?
おそらく意味はないと僕も思うんです。
ただ、社会学を考えるときの方法として大きく分けると、
質問紙調査(いわゆるアンケート)とフィールドワーク(実際に現地に行っちゃう)ていう二つの方法があるわけで、
前者は全体的な傾向は分かっても個別の事情は分からない。つまり広く浅く。
後者は個別の事情は分かってもそれが全体に当てはまるのかどうか分からない。つまり深く狭く。
なわけですね。
で、今やってる受賞者のデータいじくりは別に質問紙調査したわけではないが性質としては前者に似てるわけで、
後者に当てはまるのはなっといっても実占!!ですよね。
というわけで僕が言いたいのは理論と実占はやっぱり両輪だよなということで。
…論点がずれてるか??
いやいや、今やっていることもどこかで実占につながるってことを言いたいんだ。自分は。たぶん。。。
>>149 僕が言いたいのはね,調べてる側では「違いが有る」といったところで,
さて自分の身に何かが起きる側で1%の違いって意味が有るのかなってこと。
>>142で
> ギャンブルや金融なら
って言ってたけど元手が1億円で1%の違いなら100万円か。
本当は確率だから意味が違うけど,そこは取り敢えず置いといて(ワラ
やっぱり小さいか。えっ,大きい?
151 :
名無しさん@占い修業中:02/03/02 17:09
1%が大きいか小さいかだって?
占い使って売上が1%上乗せされるなら買いだ!!
152 :
名無しさん@占い修業中:02/03/06 19:37
>>149 >ところでところで、バイアスコントロールの話は難しい…。
〜中略〜
>よーするに「実験の限界」があるんだろうなとは思うわけで、
>調べられる範囲でやるしかないとは思います。
そう、例えバイアスが混じる可能性があっても、
可能な範囲で、少しづつ積み重ねて行くしかないですね。
影響があるかどうかは、多くの実験を総合的に考え判断するんですね。
153 :
名無しさん@占い修業中:02/03/16 18:45
もう、終わりなの?
行き詰まり中。
まぁこの先の研究のヒントは得られたかなと思っているので。。。
155 :
名無しさん@占い修業中:02/03/20 04:47
まあ後ろ向きで研究するのには「バイアス」はしょうがないな。
とにかく例数増やして条件洗い出すしかないでしょう。
157 :
名無しさん@占い修業中:02/03/29 22:33
時代により出生月の分布が違うな>石川本参照。
158 :
名無しさん@占い修業中:02/04/05 22:39
期待してあげときます。
159 :
名無しさん@占い修業中:02/04/13 04:04
>>156=77
紹介してくれたページでは日本人に双子座が少ないと書いていたが、
一番下の星座別の1日平均出生数を見てみたら、そんなことはないと
思った。
むしろ、水瓶座の出生数の多さが気になった。
正規分布の考え方を採用すれば、平均±標準偏差の範囲に全体の
約68%が相当すると考えられ、平均±標準偏差×2(2標準偏差という)
の範囲には約95%が相当すると考えられる。
よって、平均±2標準偏差の範囲に入らないデータというのは、かなり
特異的なものと考えてよい。
ページの12星座のデータを計算すると、平均4093.3、標準偏差118.9、
双子座は平均−標準偏差の範囲内であまり特異的とはいえない。
蠍座、射手座ともに同様。
水瓶座(4320)は平均+2標準偏差=4331.2に近く、特異的といえ
そうだ。日本人には水瓶座が多い?
160 :
名無しさん@占い修業中:02/04/14 16:38
年代により偏りあり>159
161 :
名無しさん@占い修業中:02/04/14 17:21
>1930年代には1月の出生率は年間平均よりも70%も多く
(出典:生まれ月の科学:三浦悌二編)
レスどうもです。
>>160 できればソースを示してくれるとありがたい。過去ログにあったら、
指摘願います。もしかして石川本?
>>161 159で用いたデータは、昭和22年(1947)〜平成11年までのデータ
(しかし断続的)で1930年代は入っていない。
紹介いただいた本は探してみます。1月の出生率が多い理由(推定)について
は過去ログにあったですね。
>>77=162 うん、そのページから受賞作家に双子座が少ないようにみえるが、
日本人に双子座が少ない場合はそうは言えないということだよね。分かります。
で、156で紹介いただいたページで計算してみたら、少ないように「思えた」
という結果だが、統計学の考え方から検討すると、違っているようだという
ことを159で指摘したのですよ。
159で試し計算してみたらこーいう結果になったので・・・
厚生労働省のページに行って人口動態のデータでも拾ってきて、少なくとも
戦後生まれについて自分で計算してみますです。
長くなったので分けます。
159で書いているのは、記述統計の初歩です。
過去ログにあったアイゼンク本で出てくるような推測統計学と記述統計学
は全く異質なものですが、推測統計学のベースには記述統計学の正規分布
の考え方があります。アイゼンクは心理屋ですが(心理学では重鎮)、
心理屋や行動科学ではまず記述統計の基本を押さえてから、推測統計学=
仮説検定の統計分析に進みますです。
厚生労働省のWebで人口動態データを探したら、古い年代(昭和20年代や30年代)
は5年刻みのデータしかDLできないようだ。(YAJIさんのページのデータと同様)
中断のない連続データを手に入れるためには図書館で古い資料を当たる必要が
ある。気象庁の気象データの「平年値」は過去30年間のデータをもとに計算
するので、少なくとも1970年くらいから完全データを手に入れて、とりあえず
月ごとの偏りがないか検定してみる。
167 :
名無しさん@占い修業中:02/05/01 02:48
あげ
168 :
名無しさん@占い修業中:02/05/04 04:51
4月が始まってバタバタしていたら、166で書いてから2週間以上も経って
しまった。過去の資料をまだ手に入れてないので、166の件は宿題にさせ
てもらいます。
過去ログの方でSPSSやらSASやらの話をしている人がいたけど、私はその
どちらも使っております。SAS社が出しているJMPも触っています。
SPSSはBASEが13万あまりとまだまだ高いけど、
(1)石村貞夫氏をはじめとする関連本がたくさんある
(2)コマンドを書かなくても、クリッククリックで操作できる
ということでSPSSは使いやすい環境が整っていると思う。
そもそもSASはサイトライセンスしかない筈・・・コマンドを書かないと
いけないのも面倒くさいし。
そのSAS社のJMPは最近売り出し中で、グラフィカルなインターフェースで
一部で人気が出つつあり。個人売りもしているようです。
あと、Excelのアドインとして使うExcel統計というのもあり、上記の統計
ソフトを使える環境にない人に愛用者多し。
ただ、統計解析には複雑な計算を要するものが多く、ソフトには信頼性が
求められるため、結果として定評のあるものを使わざるを得ないのですね。
170 :
名無しさん@占い修業中:02/05/07 00:03
http://www.spss.co.jp/ って、個人で買える値段なんだろうか?>169
以前、関わってた企業では、6ライセンスで500〜600万円くらい
したような記憶があるんだけど。
ニューラルネットワークや、ディシジョンツリーを含む、フルライセンスだと思うが。
あとさ、データの集め方や分析手法から考える必要があると思う。
この板では。自分もあまりわかってないので、他人様のことをどうこう
言う資格はないんだけど、ちょっとなーと思うところ多すぎるよ。
SPSSやSASが使えるということは大学の院生?
>>159
172 :
名無しさん@占い修業中:02/05/07 01:20
SASやSPSSって、個人じゃとても買えないから、
無料のRや比較的安価なS−PLUSでなんとかならんのかな?
173 :
名無しさん@占い修業中:02/05/07 03:14
>>170 まあねぇ、一般人を母集団にするのは無理があるよなぁ。
企業によってはSPSSをフルに入れているところがあるのね。
>>170 そりゃそのくらいするでせうな。全部入れちまったら。
あれを全部使いこなしてるとしたらスゴイっすね。
でもたいていはBASEだけで十分ですよ。
最近のバージョンは一通りの多変量解析できるし。
>>172 RやS-PLUSについては日本計算機統計学会の統計ソフト一覧
ttp://www.jscs.or.jp/etc/softlink.html にも載っているし、素性についてはOKだと思う。
ただ、統計をマスターする前にソフトの使い方を覚える時点で力尽きそう
だ・・・私だったら。
Excelをお持ちなら、エクセルの「分析ツール」でも結構統計できるっぽい。
メニュー「ツール」→「分析ツール」。なかったら「アドイン」から
組みこんで。標準インストールだと入ってないかもしれないので、CD-ROM
を要求されるかも?
数学の統計関係のところにはExcelで統計とかいう本が最近沢山出てるね。
流行りなのかな。
>>170 ちょっとなーと思う点って例えば?
私個人の気持ちとしては、最初から大上段に構えるよりも、手持ちのデータを
眺めてから、仮説を考え、そして調査デザインを考えたらよろしいのではと。
175 :
名無しさん@占い修業中:02/05/08 00:24
たとえばね、ディシジョンツリーを使ったら、
母集団を分割してくれるから、別スレでやってたような、
あの手の議論は、あり得なくなるだろうね。まぁ、設定の仕方がノウハウなんだけど。
ゴークランデータ用いて占星術の有効性を
論じる人の言葉が、妙に古臭いってのは、そういうところなんだよ。
仮設を考えるところを、今はおおざっぱにならソフトウェアがやってくれる。>174
仮設→仮説
177 :
名無しさん@占い修業中:02/05/08 00:31
失礼。改めてスレの最初の方みたらExcelで統計してはる人がいましたね。
芥川・直木賞作家の惑星サインについてもχ二乗検定してはりますね。
作家もいいけど、出生データが手に入りやすい芸能人データを分析するの
もいいかも。ほんまありきたりな考えやけど。
↑177は私です。
>>175 いつも「Answer Tree」って何よ?と思いながらSPSSを使って
いたけれど、今ディシジョンツリーで検索してみたら、あーいうのを
してくれるソフトなんだね。
母集団を分割?って思ったけれど、要するに全数調査のデータをどん
どん腑分けして結果をみるというようなものという理解でよい?
私は医学や心理、実験で使うデータ分析手法しか知らんからそういう
方向でしか考えられないけれど、占術関連で使うとしたら、どういう
調査が適当なのだろう。
>ディシジョンツリーなどデータマイニング系では
179 :
名無しさん@占い修業中:02/05/08 00:53
>>175 >仮設を考えるところを、今はおおざっぱにならソフトウェアがやってくれる
それは仮説検定じゃないな。
何通りもサブグループを分析するからな。
ソフトウェアによる探索だわな。
まあ、ある程度の分析データ見たら当たりは付くこともあるが。
探索に使ったデータセットで検証力は弱い。
もうひとつだけ聞かせてください。
>>175 >ゴークランデータ用いて占星術の有効性を
>論じる人の言葉が、妙に古臭いってのは、そういうところなんだよ。
>仮設を考えるところを、今はおおざっぱにならソフトウェアがやってくれる。>174
このあたりがまだちょっとぴんと来ない。
データを眺めて仮説を紡ぎ出すというのは普通だけど、いわゆるデータ
マイニング系ではそういうのとは違う!ってことなん?
181 :
名無しさん@占い修業中:02/05/08 01:10
182 :
名無しさん@占い修業中:02/05/08 01:19
>>182 「妥当性」についてのスレだけど?
いいスレだとは思うが・・・○○尺度の作成、とか卒論や修論でやる
ひとには参考になるだろうけどね・・・
>>184 いいページだね!ありがとう。
私が180でもやもやしていた点が晴れたよ。
他の部分も参考になる。占術分野では医療系での統計の使われ方が参考に
なるように思う。
医学での事例研究→実占でのケース検討
疫学研究→massデータの分析
実験的研究→仮説を設定した調査分析 ・・・ってとこでせうか。
186 :
名無しさん@占い修業中:02/05/08 02:16
戯言だが、医術と占術は親戚。
西洋も東洋も。
188 :
名無しさん@占い修業中:02/05/08 04:41
>>185 ようするにデータマイニングは統計の一部分でしかなく、
それだけでは仮説の検証にはならない、つーことだわな。
経済統計の新書なんか読んでて謳ってるのは、
統計的な数値や傾向も、それに馴染んでいない
人の心を縛るってことだよね。マインドコントロールって
はっきりといってる、人もいる。
結論を、ブラックボックスのまま投げ出されてしまうと、統計も人の心を縛る。
時と場合によれば、人の心を特定の方向へ向ける縛るために用いられてる。
たとえば、マーケの結果を役員にプレゼンするとか、それっぽいじゃん。
統計は占いと似たようなところがあるように感じているよ。
という点では、占いは統計である、といってもいいかも。
>188
そりゃそうだ。データマイニングは、データウェアハウスから、
ある種の傾向を引っ張ってこよう、ということに過ぎない、と理解している。
でも、そこにも、考え方としての、ノウハウがある。
>それは仮説検定じゃないな。
>何通りもサブグループを分析するからな。
>ソフトウェアによる探索だわな。
>まあ、ある程度の分析データ見たら当たりは付くこともあるが。
自分の理解は、たぶん、それほど正確な理解じゃないかもしれない。訂正ありがとう。
実際にやってる現場で理解したことだから、ディシジョンツリーから
得られた結果から、経営計画に用いる仮説を導き出すところに
ダイナミズムを感じていたし、それが非常に印象に残っていたみたいだ。
191 :
名無しさん@占い修業中:02/05/08 21:20
>189
>マーケの結果を役員にプレゼンするとか、
統計はある種、プレゼンの効果的ツールですな。
織れの場合は口下手なので、言葉よりグラフの訴求力が大きい。
192 :
名無しさん@占い修業中:02/05/08 21:30
>それは仮説検定じゃないな。
>何通りもサブグループを分析するからな。
占い理論の検証と言いながら、
何通りもの因子を検定するのも同様だわな。
仮説が無いのと等しいからな。
>184やアイゼンク本にあるが、20個の変数を調べれば、
5%水準は偶然の結果。
193 :
名無しさん@占い修業中:02/05/24 18:32
統計の勉強をちゃんとやる気があるって人います?
今日、基礎からデシジョンツリーまで3日で追える!と銘打った、
書籍見つけたんですよ。統計解析ソフト付きで1700円+税だから
教材としては、結構いいような気がした。電車の中で読んでて、
わかりやすいな〜と思ったし。
自分も、思考が穴だらけなので、これを機会に、
基本的なところだけでも埋めたいんだけど。
もしやるなら、トリップつけて、こて半で、
別スレ立てて、やりたいです。
195 :
名無しさん@占い修業中:02/05/24 18:42
>195
ここでもいいけど、話の邪魔にならない?
197 :
名無しさん@占い修業中:02/05/24 21:19
>196
ここでどうぞ、ユングは多少なりとも勉強したよね?
ユングの話を交えながら統計お勉強会をするの?>197
199 :
名無しさん@占い修業中:02/05/24 21:24
>198
随分早いレスね、イヤお好きにどうぞ但しトリップつけて、こて半でね。
200 :
193 ◆9uo04hmc :02/05/24 21:27
いちお、今日買ってきた書名書くと、
新村秀一『パソコン活用 3日でわかる・使える統計学』(講談社ブルーバックス)
です。
やるなら、自分のコテハンは、193にしよっと。
各人適当に読んで、適当に感想書いて、わからなければ、
適当に質問する、という大雑把な感じが良いなぁ。
あと、これ、データを保存して取りこむために、
EXCEL(というかCSVファイル)が必要みたいだから、
どこかで調達しなければ。秋葉で安価に売ってないかな。
捨てコテハン(w。
なんでもいいけど、この本結構良いよ。
正規分布は、人文系のそれにはありえないだろ?とか
最初の最初にチャンと書いているし。何よりも安価だしね。
>各人適当に読んで、適当に感想書いて、わからなければ、
>適当に質問する、という大雑把な感じが良いなぁ。
OK!
記憶間違い。スマンソ。
人文系に限らず、
「世の多くのデータは正規分布でないものが多い」P.26
でした。
だから、正規分布だけを前提にした統計の解説書は
ダメダメよん、という結論らしいよ、筆者によると。
まぁ、いろんなことが読み進めていくうちにわかってくるであろう…と期待。
久々に上がっていたので何かと思ったら、
>>193で本が紹介されていたのか。
新村氏の本ならよいと思うよ。情報ありがとう。
以前SPSSをベースとした統計学の解説本をやはりブルーバックスで出して
はったけど、基本がしっかりしている上にわかりやすくてその昔重宝した。
他にもブルーバックスで1、2冊あったかなぁ。
203の
>だから、正規分布だけを前提にした統計の解説書は
>ダメダメよん、という結論らしいよ、筆者によると。
こんなこと書いてはるのか。読んでみるよ。
まあ、本を読んでもらう(購入してもらう)には煽り文句も必要だからね〜
私はこの人の本で正規分布の意味を頭に叩き込んだけどね。
この人自身は数学屋→統計屋だから信用しているよ。
206 :
あげてみますが。。。:02/05/26 01:17
193の本、今日買ってきた。
statisticaのライト版が1700円で手に入ったと思えば超お買い得だぁ。
statisticaは今まで使ったことが無いのでインストールして触るのが楽しみ。
内容はまっとうで堅そうだ。やっぱり新村さんだ。浮き足立った手法では
なく、基本的なものだけに絞ってある(最後に決定木分析がある以外は)。
文系の学生にデータ分析を教える講義がベースにある本らしいから、大体この
くらいの分量なんだろうな。なるほろ〜色々な意味で参考になるなぁ。
>>200=193
>あと、これ、データを保存して取りこむために、
>EXCEL(というかCSVファイル)が必要みたいだから、
>どこかで調達しなければ。秋葉で安価に売ってないかな。
CSVファイルを作るだけならテキストエディタ(Windowsならメモ帳とか)が
あれば十分だよ。
新村さんの本のP.99のデータを入力するなら、それぞれの変数を半角のカンマ
で区切ればいい。
例:p.99の1件目のデータなら
1,0,55,2,6,0,3,野球部(Enterキーで改行コードを入れ、次行に移る)
保存するときに拡張子をcsvにすればいいだろう。
一般に公開されているデータを使いたいなら、やはりExcelを入手するしか
ないだろうが、とりあえずの方法として。
手始めの基礎資料として、出生数を月別に検討してみた。
ソースはwebで公開されている平成12年の人口動態データと、昭和59年の
人口動態統計の本。
1980年〜2000年の21年分。昭和22年〜30年までのデータも入手可だったが、
資料によると1月に不自然なピークがあり、きれいなデータでないため、
扱わなかった。昭和30年以降、1979年までのデータは飛び飛びにしか入手
できず。
出生数平均
1月 110030.1
2月 99980.5
3月 107408.6
4月 106157.8
5月 111773.7
6月 108223.2
7月 116848.3
8月 115636.8
9月 112526.6
10月 111052.1
11月 104135.1
12月 109525.5
月により出生数の偏りがないかどうか、月を独立変数、出生数を従属変数
として、一元配置分散分析をした。
F値=3.39567、有意確率=0.0002
よって、月による出生数の偏りあり。
続いて多重比較(Scheffe法)をしたところ、
2月(99980.5)<7月(116848.3)という結果になった(p<0.05)。
2月は他の月に比べ短いので出生数が少ないのは当然だが、7月以外の
月とは有意な差が認められず、7月も他の月とは有意な差がなかった。
2月と7月の差の原因は不明だが、総合して考えると、月による出生数の
差はないと思われる。
YAJIさんのように人口動態データを加工して星座別の出生数を出すべき
かもしれないが、以上の結果から考えるに、星座別に検討しても同様な
結果になるのではないだろうか。
213 :
名無しさん@占い修業中:02/06/01 01:48
>>211にケチわけじゃないのですが、1日当たりのの出生数を出すと
夏にピークがくると思いますが、いかがですか?
>>213 夏?夏とは何月のことを言っているの?
言われている意味がちょっと見えない。ごめん、ポイントを明確にして
書いてもらえますか。
あと、わざわざ一元配置分散分析で検定しているのは、そういう、
月ごとの出生数のバラツキが偶然の範囲なのか、それとも偶然の範囲を
超えていて、背景に何らかの要因が働いている可能性があるかを検証
するためなのね。
つまり、生の数で計算して多いとか少ないとかいう段階(=記述統計)
を過ぎているのだ。
216 :
名無しさん@占い修業中:02/06/01 02:26
>一元配置分散分析で検定
もちろん、それはそうなんだが、
毎年5〜10月が多くて11〜4月が少ないんなら、何かあるかも?
つーことでさ。
>>216 ・・・うーん。だから「それ」を統計手法で調べたんだけどなぁ。
んでね、何で各月の出生数に有意な偏りがないかどうか検討したのはね、
個別に色々なものを検討する場合の出発点を確かにしたかったのさ。
例:アナウンサーには双子座太陽が多い
→もしこれが統計で有意になっても、元来の出生数が月ごとに明らかな
偏りがあれば、その影響を無視できず、結局のところ確かめたい仮説も
検証できない、っていうのを恐れたため。
219 :
名無しさん@占い修業中:02/06/01 02:42
もし偶然なら、毎年夏に多くなる、つーのは不自然じゃないの?
たとえそれが、個々の月同士の比較で有意差は出なくても、
夏冬カテゴリと考えて仮に1%の影響要因があっても
検出できないんでない?
220 :
名無しさん@占い修業中:02/06/01 02:45
それは年と月の2次元で配置してみないとならないね。
221 :
名無しさん@占い修業中:02/06/01 02:49
>>219 では、四季はどの月で分けるのが適当でせうか?
やってみるよ。
>>220 年と月で2元配置したら、どうなるか考えた?
くりかえし数が1回になっちまうのでわ?
222 :
名無しさん@占い修業中:02/06/01 02:50
夏冬の増減が毎年繰り返すのなら、
その差が少なくても、そりゃ原因を考える必要があるだろ。
データをぱっと見ただけで2月7月の差を考えてたんで
季節は5〜10月と11〜4月でいいよ。
つーか受胎が9ヶ月前の秋の夜長つーのは、どうかな?
今までのやり取りを振りかえると、
何か根本的なところで共通認識が違っているような気がする。
統計学の本を読んでくれ(泣)。新村さんの本で十分だから。
>>222 夏冬の増減が毎年繰り返すとは書いていない。
21年間の月別平均を出しただけだ。
ミクロなステップを重ねて結論を出さんとあかんと思う。
すでにある説の受け売りだけど。
>>219=223
了解。分け方が恣意的だとツッコミも入りそうだけど、暖かい季節と
寒い季節ということで私自身は納得する。
秋の夜長というのは私もチラと考えた。
そういえば、2月は障害児の出生率が高いと聞いたことがある。
難産が多いということだろうか。
ならば、出生数だけでなく、死産の数も調べた方がいいかもしれ
ないな。
5-10月、11-4月で検討するのは、ファイルを他所に置いてきてしま
ったままなので、ちょっとお待ちを。ではでは。
実際に調べるのは大変だろうけど(織れは挫折)
死産まで調べたら発表してください。
ニューヨークではテロの9ヶ月後、出産が増えたそうな。
230 :
名無しさん@占い修業中:02/06/01 04:13
>>224 平均といっても、毎年そんなに差が無いんでしょ?
変動が大きかったら平均で調べる意味がなくなる。
231 :
名無しさん@占い修業中:02/06/01 06:06
>209
>昭和22年〜30年までのデータも入手可だったが、
>資料によると1月に不自然なピークがあり
日本の1960年以前は、冬に出生数の異常に高いピークが現実に存在した、
ということです。
232 :
名無しさん@占い修業中:02/06/01 06:15
この時代の死産にも、冬にピークが見つかっているようです。
233 :
名無しさん@占い修業中:02/06/01 06:31
>218
>個別に色々なものを検討する場合の出発点を確かにしたかった
中略
>元来の出生数が月ごとに明らかな偏りがあれば
過去の調査によると、時代によって出産の分布は違うみたいですね。
実験データの年代に合わせるしかないでしょ?
議論いい感じですね。
70年代の出生数データが手に入らなかったので、どなたか探せる方が
いらっしゃれば、提供していただけると大変ありがたい。
やはり30年分は欲しい。サンプルが多い方が正確を期せるので。
>>233 過去ログから、昔(60年代以前か)は1月に出生数のピークがある(理由も
過去ログにあり)ので、私はその頃については検討の対象外にしている。
60年代以前生まれの日本人については、統計による検討は不適当だろう。
ホロスコープを読む事例研究は許されるかもしれないが。
実験データの年代に合わせるしかないというのは、どういうことをおっしゃ
っているのか、今一つ分からないので、もう少し補足していただきたい。
236 :
デムパ:02/06/02 02:34
精神的ショックで出産が早まることはよくきくよね。〉テロ後の出産ラッシュ
再生への希望の子供たちになってゆくのかもしれないね。
(ナショナリズム扇動に利用される人生たちでありませんように。)
サイコな方面はテロのによる死者の生まれ変わり云々と言い出すかもな・・
生まれた子にテロの記憶があってもただのマスコミ・ニュースによる胎教だからな、
消防士の生まれ変わりと英雄扱いしたりラディンの魂として逮捕したりはやめろや。米国ならやりかねん。
237 :
名無しさん@占い修業中:02/06/02 17:31
>>235 実験データの年代に合わせるってーのは、
人口動態という言葉にあるように、
出産分布は時間によって変動していくわけで、
固定した出産分布の基準を見つけようとする方向に
無理を感じるってこと。
実験に使用したデータの年代に合わせて一般の出産分布を考える。
一般の出産分布からの偏差を考えれば、フラットな基準以外でも
使えるンでないか?
>>237 つまり、こういうことだろうか?
1960年生まれの集団について、太陽星座による職業の違いがあるかどうか
調べたい。その際には1960年生まれの出生数データを使って、そこからの
逸脱を調べればよい、と。
私は今のところそれには興味がない。
1月に出生数=出生届が多い、という「人為的な偏り」からフリーになって
も何らかの偏りがないかどうかというのを確かめるのが今回の趣旨だった
から。
「実験」をする際にはその「実験」をする人が、あなたのいうようなことを
考慮に入れて検討すればいいと思うが、いかがだろうか。
もし私の理解が間違っているとしたら、申し訳ない。
また、あなたは統計の知識があるようだから、あなたの目的とする検討を試
みてここで結果を開示していただければありがたい。
239 :
名無しさん@占い修業中:02/06/02 23:19
>1960年生まれの集団について、太陽星座による職業の違いがあるかどうか
>調べたい。その際には1960年生まれの出生数データを使って、そこからの
>逸脱を調べればよい、と
そうですね。
>人為的な偏り」からフリーになっても何らかの偏りがないか
この点については、私は先行研究をとりあえず受け入れてます。
それを覆す緻密な論があれば参考にしたいとは思いますが。
あ、他のスレでムカムカ腹を立てていたうちに、
いつのまにか、ずんずん進んでる…。
>>208 ありがとう。それ、試してみるです。
もしかして私もあなたと同じスレでムカムカだったりして。。。
>>240
>>223 5〜10月と11〜4月で2群に分けてt検定してみた。
1%水準で、有意な差があった。
およよと思って、1月〜6月と7月〜12月に分けてt検定してもやはり有意な差が。
そして、1〜3月、4〜6月、7〜9月、10〜12月にの4群で一元配置分散分析を
しても有意な差があった。
(急いでいたので詳しい統計値は持ってこられなかった)
あなたの考えたとおり、季節による偏りがありそうだ。
月による偏りはないといった、私の前言は撤回する。
で、家のPCに入っていた理科年表データから、全国の月別平均気温と、出生平均の
相関係数をインストールしたてのstatisticaで計算したら面白かったぞ。
相関係数r=0.7689、p=.009なので「使える」相関係数だ。
割合強い正の相関、つまり気温が上がると出生数も増加する関係にあると推定
される。
気温が上がると出生数が増加する、というのは、夏に生まれる子どもが
多い。で、さかのぼると秋に受胎する子どもが多いってことかなぁ。
何だか占いとは関係なくなってきたけど、例えば○○は太陽星座獅子が
多い!と素直に言うのは考えないといけないな、この結果をみると。
244 :
193 ◆9uo04hmc :02/06/06 22:33
いま、48ページまで読破。
尖り度って、始めて知ったよ。
前は、その辺、適当に処理していると思ってた。
あと、御決まりのようですが、自由度、がわからない。
なんで、N−1なのか。まぁ、いいや、すっ飛ばして先進む。
245 :
193 ◆9uo04hmc :02/06/07 23:28
統計解析で自由度がよくでてきます。
しかし、自由度がよくわかりません。
過去の記憶をたどると、
PV=nRTの状態方程式があったとき、このなかで変数は5つあるが
そのうち4つの変数が決定されると残り一つは決まるので
自由度は4である。
自由度とはこのようなものであったと思います。
統計解析の本には”自由度はN-1”という程度であまり詳しくのっていません。
ある本では、”x1,x2,x3,,,xnと、x(平均値とする)があるとき
(x1-x)+(x2-x)+(x3-x)+...+(xn-x)=0
となるので自由度はn-1である”
と記載されてました。
しかし、上記の式のなかで変数はx1からxnまでのn個と平均値xのn+1個です。
自由度はn+1-1のn個ではないでしょうか?
ご存知の方よろしくお願いいたします。
http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc014/237.html > ある本では、”x1,x2,x3,,,xnと、x(平均値とする)があるとき
> (x1-x)+(x2-x)+(x3-x)+...+(xn-x)=0
> となるので自由度はn-1である”
> と記載されてました。
>
> しかし、上記の式のなかで変数はx1からxnまでのn個と平均値xのn+1個です。
> 自由度はn+1-1のn個ではないでしょうか?
n 個の測定値は、その平均値が規定されているので、
どんな数値でも取りうるわけではなくて、
n-1 個だけは自由に決めることができる。したがって、
不偏分散の計算における自由度は n-1 であるということでしょう。
不偏分散の計算では平均値を使いますから、不偏分散は
平均値が特定の値を取ることに依存しているわけです。
http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc014/239.html わからん…・(泣
>PV=nRTの状態方程式があったとき、このなかで変数は5つあるが
>そのうち4つの変数が決定されると残り一つは決まるので
>自由度は4である。
>自由度とはこのようなものであったと思います。
ここまでしか分かりません。。。
役にたてなくてごめんね。
放置されたらかわいそうと思ったのでレスしてみました。
>>245 自由度については、引用されている以上の解説は、読んだことが無いです。
しかし、前半で引用されている記事は「変数」の使い方が間違ってるな。
「変数」ではなく「ケース数」だよ。(^^;;
新村さんも例の本のp.43で
「誰か、自由度に関してもっと分かりやすい解釈を本にして出してほしい
ものだ。」
とさじを投げているくらいだから、あまり深く考えない方がいいと思う。
標本から母集団を推定する場合に、自由度を使うと分かっていればいいの
では。
自由度で停止するより、新村さんの本のサンプルデータを打ち込んで、
それを付録のSTATISTICAで本と首っ引きで分析していくのを勧めます。
私もひとに教える時には、彼らの興味の持てそうな身近なデータを統計
ソフトで一緒に分析して、その出力結果を説明することにより分析手法
を理解させようとしてます。
これは新村さんの主張している統計教育の方法でもあります・・・
(今手元にあるデータである)標本が母集団全体であるとすれば、
分散を求める際には単なるケース数=nで割ればよい。
しかし、母集団から抽出された標本であるなら、n-1で割らねば
ならない(不偏分散)。その理由としては
>>245で述べられている
理由があるし、個人的な感覚としては、
標本から平均値を計算した。一応それを母集団の平均と推定する
わけだが、母集団の真の平均とは十中八九、誤差がある。
で、少々の誤差があっても真の答え=母集団の値、がヒットしやす
いように、標本平均からさらに他の統計値を計算する際には誤差の
分をおまけしてn-1で計算する・・・というイメージ。
え、ますます分からん?
そりゃ当然です。私自身がよう分かっていないのだから。
本を読んで「分からん」と思ったら、それは自分がアホな場合と、
あと書いている本人自身もよく理解していない場合があるでしょ。
そういうことです。とほほ。
249 :
193 ◆9uo04hmc :02/06/09 21:09
ありがとう>247-248
閑話休題。
ところで、別スレの話題だけど、
>302 名前:名無しさん@占い修業中 投稿日:02/06/03 20:01
>嶋中雄二
って、
嶋中雄二『太陽活動と景気』(日本経済新聞社)
の人ダヨネ…。うちに本ある。むかーし、栗本さんの本を
読み漁っていたとき、たまたま古書店で見つけて買ったものだけど。
250 :
193 ◆9uo04hmc :02/06/09 21:13
251 :
名無しさん@占い修業中:02/06/15 18:55
YAJIさんが出生データが更新してた。
何か変化ある?
折れも統計の専門家じゃないんで、エラソゲなんだけどちょっと一言。
自由度の意味を理解できないとすると
統計ソフトの機能を利用するにしても、
現実問題に統計を応用するとき、
手続きの妥当性を満たすの難しいと思うよ。
253 :
名無しさん@占い修業中:02/06/16 23:39
YAJIさんのデータって何?
254 :
名無しさん@占い修業中:02/06/20 18:44
255 :
名無しさん@占い修業中:02/06/29 11:27
難しい話よりヤジさんのグラフの方が出生月なんか関係ないってよくわかる。
あれではダメなの?
256 :
名無しさん@占い修業中:02/06/29 11:27
257 :
名無しさん@占い修業中:02/06/29 20:45
>>255 グラフは人の目で見やすいが、
数字自体を分析する必要性はなくならない。
258 :
名無しさん@占い修業中:02/07/01 00:22
数学板の統計スレの方がこの板の素人より良いと思われ>254
まあ、素人なりの理解で説明すると、
例えば、いかさまでサイコロの目を調整したとして、
その場合、5面までは出目の確率を自由に決めることはできるが、
5面までの出目の確率を決めた段階で、6面目は自動的に決まってしまう。
つーように思っているが。。。。
259 :
193 ◆9uo04hmc :02/07/01 16:52
なるへそ>258
それ、すごくわかりやすい。
今日受けた講義でも、
自由度の問題はスキップしてましたよ。
覚えとけって感じで。
先は遠い・・・・・・。
260 :
193 ◆9uo04hmc :02/07/01 17:10
聞きかじりだけど、
自由度が用いられた発祥って、
もともとが、それほどたくさん無作為抽出できないような
実験で使われていた、t−分布から来ているらしいから、
100以上のサンプルをとれるような実験対象なら、
それほど自由度を考えなくて良い、ということらしい。
今日受けた講義では、そういってた。パン工場を例に出して、
説明してたな。そういうのは、非常にわかりやすく感じた。
ただし、なぜ、1引くのかはわからん、覚えとけ、と。
ちなみに二次元グラフ見たら、n=100くらいで、だいたい、正規分布に近づいてました。
わからん、というのは間違い。
短時間では説明しにくい、というのが正確だったと思う。
263 :
名無しさん@占い修業中:02/07/01 21:30
>260
>100以上のサンプル
エラソゲですまないけど、も一度調べ直したら?
264 :
193 ◆9uo04hmc :02/07/01 23:33
>263
自分が調べたのではなく、推測統計学概論を
受けて、そこで、示された図の話。
明日も行くから、どのへんが間違ってるか教えてよ。
t〜t(100)
って定義している図だから、数値は間違いようがないぞ…。
265 :
名無しさん@占い修業中:02/07/01 23:35
じゃあ「サンプル」になるじゃないか>264
しばらくこれなかった。自由度についてイロイロ書いてある。
>>262=193 の数学板のスレに逝ってきます。ありがとう。
>>263 100以上のサンプルというのは、「講義」で先生が口走ったこと
みたいだから、厳密な場面で言ったのではないんじゃないかな。
267 :
193 ◆9uo04hmc :02/07/01 23:41
書き方がまずかったのかもしれない。
t〜t(n-1)=t(v)
で、n-1を100とした場合ね。
パン工場の例って割りとポピュラーなものだという
印象を受けたから、「100以上のサンプルをとれるような実験対象」
と、はしょって書いて、これでわかると勘違いしていた。スマンソ。
小標本の母平均を推定するという趣旨で
出てきた、図。
細かい図なんで、よくわからないんだけど、ざっと見た感じだと、
サンプルを100くらいとったt分布って、確かに正規分布に近づいているよ。>267
というか、もう、頭の中が、ウニになりました。今日は。
数式をちっとも終えなかったし。
これ、もう何度か、復習しないとダメだ。
>数式をちっとも終えなかったし。
>数式をちっとも追えなかったし。
やはり、それなりに基礎がないと時間がかかりそうだよ。
隣の人は、途中で帰ってんの。気持ちはちょっとわかった。
話は面白かったけど。
270 :
名無しさん@占い修業中:02/07/01 23:52
>>268 >100以上のサンプルをとれるような実験対象なら、
>それほど自由度を考えなくて良い
先生にこの内容を詳しく質問してみて下さい。
他にも条件があるような気がします。
小標本から母集団を推測する場合、ばらつきを大きく考えないと
いけないので、t分布ってやつを統計値を出すときに用いないと
いけないんじゃなかったっけ。
でも、ある程度標本が確保できるなら、正規分布の考え方で良い
・・・まあ今日先生が例に出してはった、パン工場でよろし、と
いうことでせうか。
ひとりや二人の男と付き合って、それで世の男とはこんなもんだ
と結論づける=小標本、かな。
その狭い見聞から分かることは、おのずから限りがあるので、
保険として、男というものは大体こんなもんだろうと考えられる
範囲を広くしておくという。
で、自由度に関する議論を読んでいて思ったのだけど、
皆さん、何のために統計をするの?
私は、手元のデータを必要に迫られて分析するために。
この間買ってきた本を書いておきます。
『心理統計学の基礎―統合的理解のために』
南風原朝和 著 有斐閣 2002
灯台の教育学系のセンセなので、心理統計学と銘打ってあるけど、
今問題になっている自由度についても、他書とは一味違った解説
がしてあります。
立ち読みしたら、重回帰のところで自分がひとつ勘違いしている
のに気がついて、即購入と相成りました。
274 :
名無しさん@占い修業中:02/07/02 00:50
>手元のデータを必要に迫られて分析するために
同じく。
>>268 t分布が成り立つことが前提でしたね。
カン違いしてた。ごめんよ。
素人の悲しさ。。。とほほ。。。
276 :
名無しさん@占い修業中:02/07/04 01:41
実際のデータでは前提条件が満たされているかが、
結構大きな問題だったりするからね。
277 :
名無しさん@占い修業中:02/07/06 14:07
それで占星術は、当たるのか、当たらないのか。
どっちだ!
278 :
名無しさん@占い修業中:02/07/09 19:57
統計的な判断ができるほど前提条件を満足させるデータは殆ど無いみたい。
279 :
名無しさん@占い修業中:02/07/09 23:00
占いが当たってるという統計が無いだけでしょ。
280 :
名無しさん@占い修業中:02/07/09 23:22
それを前提条件に取り入れてナ。
281 :
名無しさん@占い修業中:02/07/10 00:32
闘鶏はなかなか難しいね だって調教できないからね
282 :
名無しさん@占い修業中:02/07/10 23:19
それで、芥川賞作家のデータで、占いは当たってるのか当たってないのか。
283 :
名無しさん@占い修業中:02/07/10 23:50
284 :
名無しさん@占い修業中:02/07/11 17:57
>277
残念ながら、あたらない。
>279
「占い」というように一般化するからいけない。特定の「占い師」なら意味が通る。
一般化して言うなら、細部に関してはまず当たらない。
285 :
名無しさん@占い修業中:02/07/11 18:03
当たらないのにお金ぶんだくるから自浄作用が必要なのに、そんなの聞いたことがない。
鑑定料とったらいけないという議論が以前ありましたね。
粘着スレ乱立男が孤独な戦いを強いられていましたが、みんなか
らけちょんけちょんに言われて、自分が立てたスレを捨てて逃げ
ていきましたね。
そんな彼のことなどどうでもいいのですが、有効な統計なら、情報提供
料としての金銭を取ってもよろしいのでしょうか?
そもそも占いと統計の関係性は希薄なような気がしますが。単なるデータ
と、理論を現実に適用して導き出す推測である占いとは、関係があるよう
で、どこか別物のような・・・。素人だからわからないのかな。
つーか、統計学ちょっとぐらいかじれよ。。。
ここでブツブツいってないで。
ちょっと勉強したから、エラソでご免ねー(w。
素人だからわからないじゃなくて、なにも知らないから
わからないの。あったりまえじゃん、そんなの。ヴァカじゃねーの?
関心があるんだったら、ここでやったら?ってことね。
幸いなことに、ちゃんとかじってる人もいそうですし・・・。>286
関心なかったらやる必要ないよ? もちろん。
同じところで、ぐるぐる、ずっと悩んでれば良いんだから。
おれは、そういうの嫌なわけ。
だれがどう考えたって、時間の無駄だから。そんだけ。
さあて、負け犬=スレ乱立男がえらそうにほざいてますが、
皆さん、またからかってあげてください(大笑い
演技なのがわからないみたい。
ぷっ
というか、だったら、統計学の話をすれば?
あなたに可能ならね。
できないんだったら、泥沼にはまったまま、どっかいけよー(w>289
私は別人だけどさ、皆が思ってるのは、統計の話がなんで占いスレに出てくるのか、
ちゃんと説明しろよ、ということじゃないの?
そういう疑問持っただけで、「ヴァカ」とか「泥沼」とか言われたら、誰でもいやにな
っちゃうんじゃないか?
290さん、なんでもいいけど、言い方にとげがあるね。
スマンソ>291
統計が占いと関係あるかないかは、
それを主張している人たちに、聞いて欲しい。
著名人も含めて、そゆこと主張している人ってたくさんいるはずです。
しかも、それに追従する人が多い。
自分は、統計は統計、占いは占い、だと思ってるよ。
それを調停できるだけの思念像を作れたら、立派だと思うが、
なかなか難しいだろう。
293 :
名無しさん@占い修業中:02/07/12 15:01
>286
>単なるデータ
?単なる数字ってこと?
統計は単なる数字じゃないけど・・・。
>つーか、統計学ちょっとぐらいかじれよ。。。
>ここでブツブツいってないで。
もう終わってるね。こんなん言ってるようじゃ。せっかく少しは楽しめるかな
と思ったのに無茶苦茶だ。自意識過剰のあいつが絡むスレはいつも最後はこう
なる(悲
放っとくしかないのかな。統計の話する前に、人間的にいやになる。
あのさ、統計を駆使した経済指標のインチキぐらい
いくらなんでも皆さん知ってるよね。
日米の失業率を単純に両者比較できないことぐらい、知ってるよね。。。。。。
その多くは、手法以前に母集団問題に帰結するってことも知ってるよねえ、えええええ!!
専門学校生、頑張って煽りまくれや。
このスレつまんない。
298 :
名無しさん@占い修業中:02/07/16 17:04
さあ、いこ。
299 :
名無しさん@占い修業中:02/07/16 17:15
面白いと思うネタを自分でフレば?
300ゲットー!!!
301 :
名無しさん@占い修業中:02/07/16 18:04
>面白いと思うネタを自分でフレば?
つまんない。
302 :
名無しさん@占い修業中:02/07/16 18:52
>>301 何を言いたいわけ?
一言じゃ伝わらないよ???
303 :
名無しさん@占い修業中:02/07/16 19:22
>何を言いたいわけ? 一言じゃ伝わらないよ???
つまんない。
304 :
名無しさん@占い修業中:02/07/20 00:32
>うまんない。
そのレス連発を確認できましたので後はご自由に。。。
変なやつは無視しましょう。
あんまこんなこといいたくないけど、荒らすことそのものが
目的となってるヤツラがいる。
御互いの主義主張が違うという喧嘩ならすれば。
その上なら、罵倒もありでしょ。理不尽なこと多いしな。この業界。
だけどさ、いまの荒らしがやってることって
まったくそういうわけでもない。筋が違うだろう。
307 :
名無しさん@占い修業中:02/07/20 00:44
>筋が違うだろう。
そだね。
つまんない、の連発で確認できたよ。
193 ◆9uo04hmc が荒らしの大元。
309 :
名無しさん@占い修業中:02/07/25 19:47
昭和21年の10月、11月、12月の出生数をだれか教えてください。
310 :
名無しさん@占い修業中:02/07/25 22:52
昭和46年と昭和51年も教えて
311 :
名無しさん@占い修業中:02/07/29 20:05
データがないのかもね。
312 :
名無しさん@占い修業中:02/08/02 19:54
みんな、教える気がないだけ
313 :
名無しさん@占い修業中:02/08/10 11:43
占星術で当たってるデータを発掘しようぜ。
314 :
名無しさん@占い修業中:02/08/11 02:04
統計的な意味での当たってるの定義基準は?
315 :
名無しさん@占い修業中:02/08/14 08:32
どんな統計をとるにしても日本の月別の出生数が必要。
だれかupして
316 :
名無しさん@占い修業中:02/08/14 22:11
母集団が日本人全部なら。
317 :
名無しさん@占い修業中:02/08/14 22:44
そうですね。
外国でもわかればupしてほしい。
>315
「月別」の出生数ってなんの占いに必要なの?
319 :
名無しさん@占い修業中:02/08/15 14:33
320 :
名無しさん@占い修業中:02/08/15 15:36
参考になったね 運子は万戸南アだね
321 :
名無しさん@占い修業中:02/08/15 15:50
人口や出生者数調べるなら、統計局の国勢調査の内容を調べたらいいよ。
322 :
名無しさん@占い修業中:02/08/15 20:57
323 :
名無しさん@占い修業中:02/08/15 21:02
どのみち母集団の外部には適用でキン罠。
324 :
名無しさん@占い修業中:02/08/15 21:21
みんなで、できること考えようよ!
325 :
名無しさん@占い修業中:02/08/15 22:43
現実問題、母集団として定義できる集団を見つけるしかないだろ。
326 :
名無しさん@占い修業中:02/08/15 23:06
どんな集団が考えられる?
批判覚悟でみんなであげよう。
本当に調べたいときは、統計局に直接電話した方がいいよ。>322
ここ、いろんな人が見てるからあまり安易に日本の国情知られない方が
いいと思うから詳細は書かないでおくね。
328 :
名無しさん@占い修業中:02/08/15 23:23
出生数ってそんなにやばいことなのか?
いや、やばくないよ。
330 :
名無しさん@占い修業中:02/08/16 00:15
ようするに、海外の厨房が情報検索手段を知るってことがヤバイってこと?>329
331 :
名無しさん@占い修業中:02/08/16 00:16
この板って、そんなに、重要視されてるのか????
たかが、占い板なのに。。。そりゃ、裏情報もあるが。。。
ちく裏のほうがすごいだろうに。。。
うん。意外と見てるからね。>330
この板が重要視されているわけじゃなくて、書いたことキーワードで
検索できるからね。いろんな検索ツールがあるんだって。 >331
趣味で、2chを題材にテキストマイニングやってる人もいるね。>332
おれもやろうかと、思案中。
2chではテーマと関係ないところで、まれにすごい裏情報が出ていることあるから
カナーリ面白いと思う。>333
おいらは、眺めて楽しむわ。
さげ間違えたよ。素人ぶりがばれたな。(w
>335
石オタ(w。
337 :
名無しさん@占い修業中:02/08/16 22:49
>334
そうだね。うそか本当かわからないが、
皇室ゴシップネタの厚さには、自分も驚愕した。
ああいう話って、いったいどこの誰が書いてんだろうなぁ??
サヨっぽい批判ネタが多い。
338 :
名無しさん@占い修業中:02/08/17 22:59
>>326 公開データ調べたが、占星術として検証に使えそうなデータは余りないな。
339 :
名無しさん@占い修業中:02/08/17 23:04
なんかの、以前のようにリキ入れる気がせんわの。
なんでやろの。
340 :
名無しさん@占い修業中:02/08/17 23:18
この板の、まじな議論を嫌うウイルスに感染
341 :
名無しさん@占い修業中:02/08/17 23:39
石オタジエンウイルスには既に感染済み。
だから性病に感染しやすい状態。
342 :
名無しさん@占い修業中:02/08/18 22:05
>328
どういう条件のデータを探してる?
343 :
名無しさん@占い修業中:02/08/24 22:45 ID:eDRpp5JL
せっかく、この夏休みにみんなで研究しようと思ったのに…
344 :
名無しさん@占い修業中:02/08/24 22:56 ID:Hyh62O30
>339に同じくだな・・・
345 :
名無しさん@占い修業中:02/08/24 23:51 ID:NwpaHWuy
芥川賞、直木賞作家の受賞者の太陽が水瓶座に多い(37/280)っていうのは
偶然の域ですか?
346 :
名無しさん@占い修業中:02/08/25 17:51 ID:adh0VO6d
偏りはあるようです。
347 :
名無しさん@占い修業中:02/08/25 20:36 ID:aCqw5zj5
280人中、37人が水瓶座の場合
水瓶座が受賞しやすいと判断してよいか
水瓶座が受賞しやすい確率は1/12であるという仮説を
危険率5%で検定せよ。
348 :
名無しさん@占い修業中:02/08/26 16:25 ID:qvns32As
前提として、小説家全体で12星座の分布は等しいのかなぁ?
349 :
名無しさん@占い修業中:02/08/26 17:36 ID:2+xv7irb
どの業種も太陽星座で12等分されることはあまりないんじゃない?>348
ネットはどこまでも話題がめぐり続けるんだなぁ。
12星座で区切るよりもよりよい切り方があるはず。>348
351 :
名無しさん@占い修業中:02/08/26 17:58 ID:AiGPQYCD
>>348 小説家全体である必要はないんじゃない?
日本人の分布が等しければ。
日本人はほぼ分布していると考えていいんじゃない。
352 :
名無しさん@占い修業中:02/08/27 17:44 ID:Pv9Q1deu
>>351 もし何らかの要因で水瓶座の小説家が多ければ、受賞者も多くて当然だから。
353 :
名無しさん@占い修業中:02/08/27 18:18 ID:/oXmnn6o
そうそう、まず文筆は水星なわけだから太陽より水星だろうと思う>350
でもサインじゃ有意じゃないだろうな。アスペクトやできればハウス分布が
わかればいいと思う。ハウスはムリだね
355 :
名無しさん@占い修業中:02/08/27 21:58 ID:g6djDrsM
356 :
名無しさん@占い修業中:02/08/27 23:40 ID:yCYKt8zy
>>352 小説家に水瓶座が多ければ、それはそれですごいデータ。
357 :
名無しさん@占い修業中:02/08/28 02:48 ID:oEKVD/xL
誰も347の問いには答えないのか?
358 :
名無しさん@占い修業中:02/08/28 17:52 ID:0g0+/YX4
ごめん。僕じゃわからない。
359 :
名無しさん@占い修業中:02/08/29 00:23 ID:Bew/UvtY
>356
占星術的な要因(なにをもってそう考えるかは議論あるが)以外に、
原因がなければなぁ。
360 :
名無しさん@占い修業中:02/08/29 16:35 ID:Bew/UvtY
占星術的な要因以外=バイアスつーことかの。
361 :
名無しさん@占い修業中:02/08/30 12:59 ID:YaksrvcV
347が361に回答すればいいんじゃないの?
363 :
名無しさん@占い修業中:02/08/30 16:59 ID:x/0vbwOT
ここには、そんなもの解けるやつなんか来ないさ。
364 :
名無しさん@占い修業中:02/08/30 19:40 ID:e42Z+ixT
質問自体が不十分だからね。
365 :
名無しさん@占い修業中:02/08/30 20:57 ID:fYTqWBU6
牡羊座牡牛座双子座蟹座獅子座乙女座天秤座蠍座射手座山羊座水瓶座魚座
受賞者数362011211217283213263727280
これが必要だね。
366 :
名無しさん@占い修業中:02/08/30 21:00 ID:fYTqWBU6
うまく出ない
牡羊座牡牛座双子座蟹座獅子座乙女座天秤座蠍座射手座山羊座水瓶座魚座
受賞者数362011211217283213263727280
367 :
名無しさん@占い修業中:02/08/30 21:03 ID:fYTqWBU6
これで許して
牡羊座36
牡牛座20
双子座11
蟹座21
獅子座12
乙女座17
天秤座28
蠍座32
射手座13
山羊座26
水瓶座37
魚座27
368 :
名無しさん@占い修業中:02/09/06 20:35 ID:U/niLcb5
それではまだ足りないで初。
369 :
名無しさん@占い修業中:02/10/24 18:34 ID:o1SKBITO
少なくとも300件は必要だと、とある本に書いてあった。
あと、もうちょっとなんだけどね>367
370 :
名無しさん@占い修業中:02/10/24 18:34 ID:o1SKBITO
それから、事前にその年その年の、出生月の偏りも調べないと
統計として成り立たないらしいよ。
例を挙げると、戦前、日本は12月1月生まれが多かったけど、
戦後は7.8月が多いそうだ。これは農業国から工業国への推移と
密接な関係あるらしい。(石オタでスマソ)
371 :
名無しさん@占い修業中:02/10/30 21:53 ID:Wv0vpN9O
>>370 それじゃ、そのデータを提示してよ。
皆、そんなこと言ってるだけでやろうともしないじゃん。
研究はデータ集めるところからはじまるんだよ。
そこから他人を頼ってるようじゃ・・・・・。。。。
373 :
名無しさん@占い修業中:02/10/31 21:24 ID:kCX7vwFU
データ集めた人いる?
有効なデータ集めて技法を学んで正誤を研究してか・・・一生終わっちまうな(大笑
375 :
名無しさん@占い修業中:02/11/01 08:37 ID:w+Bamz3I
>>374 そりゃゴークランだ。
彼のように一生をデータ集めに捧げたような人は他にいるのだろうか?
377 :
名無しさん@占い修業中:02/11/08 20:21 ID:w0o3zyRB
↑そのゴークランって人、どんなデータを収集してましたか?
興味があるので、よかったら教えて下さい。
378 :
名無しさん@占い修業中:02/11/08 21:02 ID:1DnCstf+
379 :
名無しさん@占い修業中:02/11/12 21:20 ID:aBQbXNzq
380 :
名無しさん@占い修業中:02/11/12 22:48 ID:AddwIwTC
そもそも生年月日と運命には、因果関係はありません。
そもそも運命が定義されてない。
「運命」みたいな漠然としたものじゃなくて、
計測可能な出来事と生年月日の関係を調べたいね。
383 :
名無しさん@占い修業中:02/12/09 23:55 ID:AvDwdiN8
>382
もうやってるじゃん。
384 :
名無しさん@占い修業中:02/12/10 17:27 ID:bsjQaMm4
どこで?
385 :
名無しさん@占い修業中:02/12/15 17:54 ID:t9E4kgeT
>383じゃないけど
芥川賞のやつではないでしょうか。
386 :
名無しさん@占い修業中:02/12/31 12:52 ID:Y25blsYC
芥川賞の統計のページなくなっちゃいましたね。
387 :
名無しさん@占い修業中:03/01/02 21:58 ID:mGSj3HF3
移動しただけ。まだあるよ。
「星占いは当たるのか」でぐぐれ。
388 :
名無しさん@占い修業中:03/01/03 04:09 ID:7rj4lFuc
がいしゅつかもだけど、作家の年齢分布とコントロールの年齢分布が違うな。
389 :
名無しさん@占い修業中:03/01/03 12:19 ID:pho2zVqi
コントロールの年齢分布ってなんでつか?
390 :
名無しさん@占い修業中:03/01/03 13:54 ID:7rj4lFuc
実験群、対照群でぐぐれ
391 :
名無しさん@占い修業中:03/01/03 18:16 ID:pho2zVqi
コントロールという言葉が出てこないですが
392 :
名無しさん@占い修業中:03/01/04 17:01 ID:XA2PtXhN
「星占いは当たるのか」でぐぐれ。ってどういうこと。
どこにあるのか教えて。
393 :
名無しさん@占い修業中:03/01/05 15:08 ID:PQN5OJPb
コントロール=統制・・対照群の選択>391
もし、これで意味がわからない場合は統計の一般用語集をどうぞ。
394 :
山崎渉:03/01/08 16:00 ID:???
(^^)
age
本家石ロリ↑
397 :
山崎渉:03/01/19 06:52 ID:???
(^^)
398 :
名無しさん@占い修業中:03/02/16 13:47 ID:LBk+Qowu
386以外で月別の出生数がわかるHPないですか。
石ロリ自作自演荒らし=山崎渉はギャンブル好きなヤシだよ。。
400 :
名無しさん@占い修業中:03/02/23 21:41 ID:DVH+NwNi
age
占いを統計学だと思ってる馬鹿な占い師もたくさんいるよな〜
ホントは違うのに。
単に経験に基づいてることを言いたいみたい>占い師
403 :
名無しさん@占い修業中:03/03/08 01:21 ID:+KCvEVnE
>>401 占いってなんなのですか? (四柱推命の話を聞いて最近怖くなってきてます)
一切、根拠の無いことなんですか? なら少し安心。
確かな証拠は無いわな>占い
405 :
山崎渉:03/03/13 13:43 ID:???
(^^)
経験的=統計的とは!!
ものすごい主張だな。
要は「思い込み」だよね。
経験的に、こんな感じだと思う、それが占いの根拠です。
とくに東洋の占術はどうしても中国人の思想遍歴に影響を受ける。
長い時間経過のなかで、迷信部分が多くなってきます。
統計的といっても、厳密な意味での統計ではないですね。
西洋的思考では、中国の思考方法は理解しがたいよ>407
古い宗教的伝統をしょってる華僑の人たちと話したことあります?
近代以降の教育を受けた身としては、なんかぜんぜん考え方が違うので違和感がありまくりだ。
ただ、その手の考え方は日本国内にもあるんだよ。
中国的な天文観は、天の概念あれども、惑星は単なる天の上で動く「点」の扱いだったという話だから、
そこからして西洋の天文観とは異なるんだよね。たまねぎ状の天文観じゃないんだよ。
はっきりとはわからないのだが、もしかすると、
あっちは時間を連続したものとして捉えていないのではないのか?と激しく疑ってる。
統計的手法って、時間を連続の一部としての点としてに捉えて、
そこで得られた数値をプロットして、仮構した母集団の推定精度をあげるってのが
基本的な考え方でしょ? たぶん、古代中国文明を精神的源流とする人たちには
そういう考え方はまったくないとおもうな。
>>408 なるほど。
時間の観念が実は違うのでは?ということですね。
いわれてみれば、伝統云々といっている人たちの理論の非現実性は、そのことが要因のひとつかもしれませんね。
正しいとか、間違っているとかではなく、根本的な考え方の発想原点が異なるということですね。
と、すると、西洋占星術とかではどうなんでしょうね?
統計つー言葉はそもそも静的意味だからな。
動的データを扱いう方法もあるけど、
発想が違うってか。。。。
412 :
名無しさん@占い修業中:03/03/20 00:11 ID:WlWXXgpQ
>409
ルクレティウスを物理学方面から読み込んでる人がいるよね。
ミシェル・セールだっけ?
自分はそのへんあんまちゃんと読んでないから
あれなんすけど、古代思想を現代の知見から
新しく「読みなおす」というのは、それほど特殊なことじゃないみたいだよ。
古いものが現代社会で意味を持とうとすると、
そういう方向がひとつあるのではないのかとか、ちと思います。
時間軸による動的変化を例えば日単位で繰り返せば調波になるネ。
414 :
山崎渉:03/04/17 09:00 ID:???
(^^)
415 :
山崎渉:03/04/20 04:03 ID:???
∧_∧
( ^^ )< ぬるぽ(^^)
上げとく
417 :
名無しさん@占い修業中:03/04/25 14:41 ID:GKGKePSw
ネットTV電話レディー募集中!顔出しはしなくてもOK!
お家のパソコンから24時間いつでも気軽に出来る
テレビ電話サイトで会員さんとお話しするだけで最低1800円〜最高3500円の
高時給!
女性スタッフが多いから安心して働けます。
18才以上45才位までの女性なら主婦(お子様がいてもOK)・学生・OL・フ
リーター・副業でもOK!
週2〜3日、1日2〜3時間からの勤務でOKです。
現在ネットTV電話レディー登録者も200名を突破致しました。
YahooBBマガジンでも紹介された安心の人気サイトです。
暇な時間に遊び感覚でアルバイトができます!
家族にも職場にも絶対バレないように処理致します。
パソコンをお持ちであれば、お金は一切かかりません。
登録料&月間コストも完全無料! カメラ&マイク無料貸与。
貴女も今まで欲しくても手に入れられなかった物を手に入れませんか?
お問合せは・・・
[email protected]まで!
(^^)
419 :
_:03/05/15 03:07 ID:???
占い理論を検証してくれ
421 :
山崎渉:03/05/28 14:24 ID:???
∧_∧
ピュ.ー ( ^^ ) <これからも僕を応援して下さいね(^^)。
=〔~∪ ̄ ̄〕
= ◎――◎ 山崎渉
石ロリスレ
__∧_∧_
|( ^^ )| <寝るぽ(^^)
|\⌒⌒⌒\
\ |⌒⌒⌒~| 山崎渉
~ ̄ ̄ ̄ ̄
__∧_∧_
|( ^^ )| <寝るぽ(^^)
|\⌒⌒⌒\
\ |⌒⌒⌒~| 山崎渉
~ ̄ ̄ ̄ ̄
∧_∧ ∧_∧
ピュ.ー ( ・3・) ( ^^ ) <これからも僕たちを応援して下さいね(^^)。
=〔~∪ ̄ ̄ ̄∪ ̄ ̄〕
= ◎――――――◎ 山崎渉&ぼるじょあ
(⌒V⌒)
│ ^ ^ │<これからも僕を応援して下さいね(^^)。
⊂| |つ
(_)(_) 山崎パン
427 :
名無しさん@占い修業中:03/10/09 23:30 ID:X4RJhJDL
これ、続けないの?
428 :
名無しさん@占い修業中:03/10/11 08:47 ID:RLHur6ug
月別の出生数がわからないと無理
429 :
めぐみ:03/10/11 13:13 ID:VPcijKj3
430 :
名無しさん@占い修業中:03/10/11 23:53 ID:RLHur6ug
戦前の月別出生数が欲しいな。
どこかの図書館に厚生省が出した人口動態統計がないかな。
431 :
名無しさん@占い修業中:03/10/13 22:13 ID:P2tv4h+4
皆、占いが当たらないことを知ってるから統計には関わりたくないんだよ。
432 :
名無しさん@占い修業中:03/10/22 21:01 ID:AWY1fAn3
age
433 :
名無しさん@占い修業中:03/10/31 21:56 ID:H8Mq5wUm
まじめに語りたいな
434 :
名無しさん@占い修業中:03/11/01 17:58 ID:qfDPsZo0
もう一度、みんなでデータを持ち寄り、なんとか結論を出そうよ。
435 :
名無しさん@占い修業中:03/11/03 22:31 ID:nbFD95cr
今日、星座別の知能指数やってたよ
436 :
名無しさん@占い修業中:03/11/06 22:32 ID:fVfMgZ7c
age
437 :
名無しさん@占い修業中:03/11/09 23:29 ID:7QB2Np4y
日本人で一番多い星座は何?
( ´,_ゝ`)プッ 隣り板いけ。
439 :
名無しさん@占い修業中:03/11/10 17:18 ID:WLyrQEPQ
>>438 おまえこそ理解できないなら隣り板へいけ。
440 :
名無しさん@占い修業中:03/11/18 09:28 ID:lHpbfoc4
age
441 :
名無しさん@占い修業中:03/12/17 22:18 ID:T8AMo4iV
age
442 :
名無しさん@占い修業中:03/12/28 00:36 ID:B9ILV0UH
kuso age
統計は有効だ。今のぐちゃぐちゃの占星術においては
それしかない・・・・・・・・・・・・・・・・・・・・・
444 :
444:03/12/29 04:11 ID:???
@
占いは統計学なんて思ってる占い師がいたら、プププププププ( ´,_ゝ`)プッ
446 :
名無しさん@占い修業中:04/01/16 23:55 ID:sxsWXMTm
占いが統計学なんじゃなくて占いを統計でどの程度当たるのか見ようっていってるの
( ´,_ゝ`)プッ
448 :
名無しさん@占い修業中:04/01/17 19:08 ID:wi9gS2OL
http://headlines.yahoo.co.jp/hl?a=20040114-00000004-mai-l15 交通人身事故と干支との関係 丑年生まれ、要注意です−−村上署調べ /新潟
村上署が、管内で起きた昨年1月から11月末までの人身事故と
その当事者の干支(えと)との相関関係を調べたところ、
丑(うし)年生まれの人が最も交通事故に遭いやすいという結果が出た。
調査は、交通安全の意識向上を目的に一昨年から始められ、今回が2回目。
対象となった事故は369件の人身事故で、
その当事者は682人(男415人、女267人)。
最も確率の高い丑年生まれの人は全体の10・7%を占めた。
逆に最も当事者率が低かったのは辰(たつ)年生まれの6・2%だった。
事故の内容別にみると、追突事故(93件)では、
未(ひつじ)年生まれが最も多く13・9%。道路を逸脱するなどの自損事故(52件)では、
寅(とら)年が最多で15・4%。ハンドルやブレーキ操作の誤りが元になった事故(48件)では、
亥(い)年が18・8%で最も多かった。寅年生まれは、正面衝突事故でも最多の21・4%を占めた。
事故原因を作った、いわゆる「第1当事者」(365人)では、亥年が12・3%を占め、
最も多かった。【小暮靖男】(毎日新聞)
[1月14日19時21分更新]
事故が一番多い時間帯は夕暮れ時なので丑刻とは関係なし
糞スレ醸しあげ
451 :
名無しさん@占い修業中:04/02/14 23:32 ID:fvk7vqpF
AGE
452 :
名無しさん@占い修業中:04/02/25 22:07 ID:LXc0AsLl
定期アゲ
453 :
名無しさん@占い修業中:04/03/23 23:13 ID:P5dkt0s6
A.g.e
age
455 :
387:04/04/30 00:15 ID:oYJ4/ybY
456 :
名無しさん@占い修業中:04/05/01 23:41 ID:7jChs9z1
結局、四柱推命も当たらないってこと。
457 :
名無しさん@占い修業中:04/05/03 14:27 ID:/OSCMMHR
age
458 :
名無しさん@占い修業中:04/05/06 23:46 ID:vslCYcLr
>>456 当たらないとは言ってない。逆に偏りがあると書いてある。
よく読め。
459 :
名無しさん@占い修業中:04/05/15 00:22 ID:GaU8LRDx
age
データベースすら使えないぽまいらに統計学は無理
age
462 :
名無しさん@占い修業中:04/07/02 13:04 ID:KLl0g75r
統計学は数学的手法
つまり左脳
占いは神秘学
つまり右脳
論じることが可笑しい
統計は過去のデータ処理
占いは未来への共時性
>未来への共時性
てのわ何だろね、論理的に説明できないんでしょ?
464 :
名無しさん@占い修業中:04/07/03 17:13 ID:GfmEFOl/
その通り
論理的なのは左脳だろう
占いは右脳で
説明できない
だから占い
占いが統計学なんて思ってない。
統計で占いが当たるのかってことを証明したいだけ。
誰もそれに答えてくれない。
占いが共時性なんて思ってない。
人間が勝手に作る。
占いが共時性つー意見も、
占いが統計つー意見と同じくらいDQN。
だから占いが統計だとは思ってないって。
占いと統計を知ってる人は、>465は分かってる。
カン違いをしてる香具師が>462のように、
DQNな意見を述べるってこと。
共時性と統計を対比するなら、
ユングの占星術の統計的研究を踏まえての意見を言ってみよ、と。
まぁ占いと統計に関する話題は、
まずデータの集め方からだね。
母集団とサンプリングが適当じゃイカン。
過去、話題になったものは、そのへん、どうなんでしょうね?
>>470 そうそう。統計の意味もわからずちゃちゃいれる輩が多くて
結局、どういうふうにデータを集めるかだ。
人の研究にケチつけるんじゃなくて自分たちでやっていこう。
age
age
age
age
age
477 :
名無しさん@占い修業中:04/11/27 12:38:05 ID:3ZR22s2K
>448
その記事がなにが言いたいのかよくわからん。
干支は12しあるんだから
単純に考ええも
8%前後は有意の差じゃないだろ。
人口分布を考えたら15%だって偶然のバラツキの範囲内かもしれない。
元のリンクが切れてるからわからんが
そういうこと検証したのかね?
age
age
481 :
名無しさん@占い修業中:05/02/03 00:45:46 ID:nMzeulPp
482 :
名無しさん@占い修業中:05/02/05 22:57:13 ID:jqDUEm8T
そろそろ新たなデータが出てこないかな。
こんなのあった。
966 :名無しさん@占い修業中 [sage] :05/03/20 00:42:06 ID:???
よく「占いは統計学」とか言うけどさー、データの収集してんの?
各占い師が勝手に鑑定とかして、自己満足に浸ってるだけだろ。
実際に診断どおりの人生かってのも、客観的な判定は不可能だし。
データの取りようがないじゃん。取ってないだろ。取ってたって少数派だろ。
だいたい平均とか分散とか、占いで聞いたことないぞ。
「いままでみてきた印象で」とか言ったって、そんなの統計学じゃなくね?
統計に関しては、
ゴークランやアイゼンクの本で西洋占星術について
述べて記憶が。
えっと、ユングの研究では共時性と統計が関連して扱われているが、
どんな関係を持っているのか分かる人といる?
共時性って、再現性の問題があると思うんだけど、
統計的に有意な結果が出るのなら、
個々の事象には再現性があるって事じゃないの?
つまり統計を持ち込むこと自体が共時性の考えと矛盾するんじゃないか?
まさにあなたの言う通りで、ユングの直弟子フォン・フランツなどは、
「共時性は一回きりの偶然の事柄に関わるものであって、
原理的に言って統計的アプローチは不可」といった内容のことを書いている。
ユングによる占星術の統計的研究は、本人も認めているように失敗している。
有意な結果になる時もあればそうでない時もあり、結局はうまく証明ができなかった。
ただ、その研究を通してユングは、
調査者の関心が高いときに限って有意な結果が偏って現れる、という
超心理学者たちがよく言及する現象に気づき、関心を持つことになる。
占いの本質をどう考えるかによって、
占いに統計学を持ち込んでいいかどうかの判断は分かれてくる。
487 :
名無しさん@占い修業中:2005/06/11(土) 17:18:04 ID:prSL4Bgt
488 :
名無しさん@占い修業中:2005/06/11(土) 17:39:06 ID:prSL4Bgt
489 :
名無しさん@占い修業中:2005/06/11(土) 17:39:55 ID:prSL4Bgt
490 :
名無しさん@占い修業中:2005/06/18(土) 02:36:38 ID:k5mCLD8a
当方量子情報理論で博士やっているものなのですが。
占い理論の量子化って面白いとおもいます?
量子統計(量子統計力学ではない)というマイナーな分野もあったりします。
ちなみに、それとは関係の無い、メジャーな分野である統計力学の友人は、
最近易占い(筮竹をつかったやつ)をたしなんでいるらしく。
彼によると、易占いは古典的なIsing模型に等しいらしい。
・・・まあ、要するに単なる1/2の確立の2つの事象が続いていくと言うだけなのだが・・。
なには、ともあれこれは筮竹の替りにIsing模型で近似できる電子系を十分に
操作することができれば、これを用いて「量子易占い」が可能であると言うことを示唆している。
もっとも、これは電子一つ一つを十分に操作できないといけないので、
今のところ量子ドットなどが量子易占いをするための物理系の候補として考えれる。
個人的には、量子易占い系の相転移を易学の見地からどのようにとらえるべきかなどに興味がある。
[@
492 :
名無しさん@占い修業中:2005/08/08(月) 16:00:09 ID:SXj0n9qD
で、結局統計的に有意差はあるのか?
493 :
名無しさん@占い修業中:2005/08/13(土) 17:10:29 ID:ukKfYCV9
どっかにX^2検定してるサイトがあったけど…
忘れた。
陰極まって陽に逆転、って当たり前か。
495 :
名無しさん@占い修業中:2005/11/10(木) 22:46:19 ID:Pjs5VTTL
>>448 >その当事者は682人(男415人、女267人)。
>最も確率の高い丑年生まれの人は全体の10・7%を占めた。
>逆に最も当事者率が低かったのは辰(たつ)年生まれの6・2%だった。
簡易的な方法だけど、ポワソン分布を仮定して、
もし、十二支で平均に事故が起こるとすると、56.8プラマイ7.5件。
これをパーセント割合に直すと、8.3プラマイ1.1%。
丑年はプラス2.2シグマ、辰はマイナス1.9シグマになる。
大体、20回に1回くらい「外れ値」が起こる確率だから、12回中2回起こったというのは、
かなり多いと見てよいかも。
496 :
名無しさん@占い修業中:2006/01/02(月) 17:54:44 ID:twFcuTVQ
>495
>もし、十二支で平均に事故が起こるとすると
その前提はセグメントの切り分け方に依存すると思われますが、
詳細はご存知ですか?
>>455 何の統計よ? 四柱推命は基本的に空亡論を否定していて、
十二星も否定してるっていうのに。 土台が間違ってる。
sage
500
501
悪徳詐欺師
http://hobby8.2ch.net/test/read.cgi/uranai/1145062670/l50 677 :最新悪徳詐欺師:2006/06/30(金) 12:17:24 ID:???
江原啓之、織田無道、麻原彰晃、大川隆法、池田大作、船井幸雄、川口喜三郎、小林正観、衣川晃弘、深見東州、
福永法源、文鮮明、桐山靖雄、石田千尋、森田健、細木数子、伊島良昭、大泉の母(クロートー)、Dr.コパ、李家幽竹、
貞白龍、北条一鴻、田口真堂 、黒門、鈴木星翔、松岡秀達(北斗柄)、永瀬久嗣、大島みどり、 千乃裕子、高橋弘二、
小島紀武(小島露観・万師露観)、成合弘、松永修岳、 長島豊、村上世彰、小林世征、藤原忠行、
Reiko(鍬ヶ谷恵子、レミ、杏樹、ミリリアン、斎藤まなみ)、柴田真嵯兼(Reikoの仲間)、松村潔、高山秀之、八海光道 、
園世修、松田明、水宮可琳、宮ありさ、瑠花、加藤真由儒、宇佐美由麻、黄麗、ルーサー田中、坂本幸夫、
佐藤六龍、市毛実、リリアントゥー、アポロ
占龍館、開運館、香草社、橘出版、アタール、ワールドメイト 、統一教会、アーレフ(元オウム真理教)、高島易断
ザイン、権現堂 、自己開発系セミナー団体(ライフダイナミックス他)、船井総研と船井幸雄の傘下、 シオン、
エンジェルネットワーク、不思議研究所、パナウェーブ千乃正法、エホバの証人(ものみの塔)、顕正会、創価学会、
シャーマン、グレギャラリー 、幸福の科学 、真愛の萌、ACOS、日本呪術協会、コンゴ呪術-マヨンベリア- (マヨンベーロ)、
聖仙ワークス 、京都念凛堂 、日本霊能者連盟 、呪術救人堂、占い/呪い代行 、エンジェルネットワーク、ACワールド 、
エンゼル 、jason,s心霊心理、四川呪術 、悪魔協会、赤狼師
age
大型書店の数学書コーナーの半分は,統計学だ!
棚割は統計的にいっても,社会のニーズを反映している
しかるにここでは,あまり議論されていない
語るがよい.偉大な統計学を...
2
>大型書店の数学書コーナーの半分は,統計学だ!
眼科逝け。
統計学を数学にいれるのはやめようよ
このスレッドに書きこむのやめようよ
終了
統計学は大切だと思うが、1が最低。
ネタ振りしない1は最低
統計学専門なら数学板の引篭もり院生&学生の率を教えてくれ
>>大型書店の数学書コーナーの半分は,統計学だ!
>眼科逝け。
昨日,東洋一の新書売場面積を誇る,池袋ジュンク堂で調査してきました.
数学書コーナーの半分は確かに統計学(データ解析)関連でした
ところが別の階の「経済」「心理」「生物」「医学」「マーケティング」
「製品開発」「食品学」のコーナーの数学書は,殆ど
す べ て 統計書でした.
わざわざ調べたの? 悔しかったんですか?
_( ̄▽ ̄)ノ彡☆ばんばん!ばくばく〜〜爆笑!
統計は人をだますのにもってこいの道具だね
す、すみませーん。わざと騙してるわけじゃ、ないんですぅーー(T-T
1の書き込みを見たとき
「そーいや、ジュンク堂の数学書コーナーは
統計の本やたらと多かったなあ…。」
とか思ってしまった俺は逝ってよしですか。
さみしいから逝かないで
芳林堂(池袋)も旭屋(池袋東武デパート内)も「数学」コーナー
の半分は統計学ですよ.そして「経済」「心理」「生物」「医学」
コーナーの数学書はほとんど統計学です.私は池袋のことしか知ら
ないけど.マーケティング的には数学書の売り上げの多くは
統計学だと思うな.ちなみに池袋という町は新書売り場面積は日本1
です.
つーか。その手の統計学は数学ではないというのが
このスレの意向のような気もする。
しかも、書き手は数学科を出てない人では。
…最近寒い書き込みが多いなぁ……夏にしてよ…そういうの。
ある集団で胃癌が15人、大腸癌が2人、食道癌が1人、肝臓癌が1人
だったとき、胃癌が有意に多いですよ、ってことを検定するためには
何検定を使ったらいいのですか。
素人なので、すみません。教えてくださいませ。
比率の差の検定で,多重比較します.
オムニバス検定は情報を取り出しにくいから
2つの水準の比較のできる方法のほうがイイヨ
↑
すみません。せっかく教えていただいたのに、
申し訳ないのですが、“2つの水準の比較できる方法”
というのはどういう検定方法なのですか。
今までstudent t-test とχ2しかやったことが
ないのでスマソ。
__,,,,_
/´  ̄`ヽ,
/ 〃 _,ァ---‐一ヘヽ
i /´ リ}
| 〉. -‐ '''ー {!
| | ‐ー くー | _________
ヤヽリ ´゚ ,r(、_>、 ゚'} /
ヽ_」 ト‐=‐ァ' ! < さげ
統計学の本が多いというより、
数学の本が少なすぎるのだね。
普通の人は読まないし…。
統計っていっても一般向けのものは、簡単な検定や推定に関する物
がほとんどだね。多変量解析なんて、あんまり一般人はよまんわな。
ましてや、時系列解析なんて・・・。
昔に比べると多変量解析の一般向けの解説書は随分充実してきていると思う。
パソコンの普及と関連があるのだろう。
パソコンとWinMX
χ2検定で対比較。
胃癌がもとから多そうだとわかっていたら危険率/3,
そうじゃなかったら危険率/10の限界値で。(分母は比較の数)
Bonferroni(綴り不確か)不等式の利用(Dunnの方法)。
つー方法ではだめですか?
すいません。おじゃまします。統計初心者です。
n=70名程度の、BMIが平均25だったのが、半年間の運動後に23.5まで下がりました。
この場合の検定をする場合、独立した2群となるのか関連した2群となるのか教えてください。
お願いします。
関連した2群(対応がある場合の2群の平均値の差の検定)だぴょん
時系列解析って役にたつの?
株価・為替・景気
何とか総研とかで,計算機ぶん回して
今年の予測とかいうけど,あたらんよ
さん。ありがとうございました。
もうひとつ恥ずかしい質問してよろしいですか。そうすると、F検定の必要はないって
ことですか。
ないよ
皆さん初めまして!私はこの春、大学生になる者です。
どうやら、うちの大学は1年で統計解析をやるようで、
ちょっと予習しとこうかな??って思っています。
何かいい本・やり方などありましたら教えてください。
(統計解析の公式って、高校数学の確率分布とカブっていませんか?
間違っていたらごめんなさい)
sage
初歩の統計学は高校数学の確率分布ともちろんかぶっているよ。
僕はちゃんと読んだことがないけど、ブルーバックスの
「推測統計 はじめの一歩」でも読んでみてはいかがでしょうか。
ちゃんと勉強するのにはともかく、寝ながら読むのには楽しそうな
感じの本です。
そういえば、昔、鈴木義一郎先生のブルーバックスの
赤池情報量基準に関する話の書いてある本読みかけたことが
ただ単純にの方法を取らないほうがいいことがある。
たとえば変化の度合いが前値に相関するうようなとき。
こういう時は比をとってそれが1ではないかどうかしらべる。(のだったような)
に乗じて
高校数学の各分野って 現実社会で何に役立つか教えてください。
(Ω,F,P) : 確率空間
X_k : Ω→R^n,(k=1,2,3,・・)
X : Ω→R^n
らを確率ベクトルとします.
ここでX_kがXに分布収束するとは
P(X<x)の任意の連続点xで
P(X_k<x) → P(X<x) (k→∞)
となることです.
「統計的漸近理論」は,遠からず滅びると思われ...
なぜ?
スレ違いだと思うが、一応いっておくと
「高校数学の各分野って 現実社会で何に役立つか教えてください。」
という質問に対しては
「あらゆる分野で役に立っている」
といえる。君がネットにつないで2chでこんな質問ができる
ようになるまでにPCの基盤設計からネット上の圧縮技術etcまで
どれだけの数学が用いられているかを考えてみればわかるだろう
いま39がいいこといった
純粋数学としては美しくない・深みも無い
応用数学としては,役に立たない
なぜ?
部活程度の関わり方では、という条件が付けば、
「純粋数学としては美しくない・深みも無い
応用数学としては,役に立たない」
というのは真実ではないでしょうか。
なぜ?
応用数学として、高校生程度の対象者に好まれない理由は、簡単な統計処理が既に普及しきっているため、
労働市場でのその個人の価値を高める感じがしないからだと思います。逆にファイナンスの分野などで、
それが理解されたり必要とされているかがややあやふやな感じもしますが、
ルベーグ積分などが高く評価されている傾向がある気がします。
純粋数学への入り口としては、数学史的な位置付けが曖昧なのか、解析や幾何と異なり
ややドラマに欠ける紹介の仕方がされる面があるようです。
でっ?
確かに今から「統計的漸近理論」ってやってみようとは思わないな。
分野として成熟していそうだから、いまからはじめても最先端の内容に
追いつくまでに沢山勉強しなきゃいけなさそうだし。
統計的漸近理論ってブームは20年前(80年代)でなかったけ?
竹内−赤平先生の高次漸近理論とか。
結局、かつての統計学の研究された蓄積が、計算機の登場ですっかり
変わってしまい、大量のデータが扱える昨今においては検定論は使えないし
「先を読む統計学 〜『情報量基準』とはなにか」でないの?
鈴木先生の講義を十数年前直接受けたことがあるよ。
議論の腰を折るようですけど
ありがとうございましたー。
>統計的漸近理論に限らず、現在流行のゲノムと金融工学も何の成果も出ずに
>いずれ滅びるのではないかな。俺はやらんが。
おれもそうおもう とくに金融工学なんて
素人にはわからない目くらましで,素人から金をまきあげる
ことにしか,現時点では貢献?してない.ほとんど犯罪だ
そのうち「難しい金融商品はかわない!」といわれて
ほろんでいくだろう
部活程度ったって高卒ですぐエースになるやつもいるしなあ。
さらしあげ
古い話に戻るけど、
最近、多変量解析を使う人が増えたのは
RとかSystatとかのお手軽なプログラムのお陰だと思う.
理解できていない内から結果だけは出せるから、
使ってるうちにわかってくるんだよね.
Vistaみたいに3主成分の3Dをグリグリ廻したりできると
分布の様子もよくわかるし.
数学者(関係者)がつまらないといっている統計と実務者が役に立つといっている統計学には少々隔たりがありますねぇ。
研究分野として数理統計学がどのように面白いかは私にはよくわかりません。
もちろん未解決の問題もありますし、発展も続けています。
しかし、統計としての面白さは実際の問題へ応用するというデータ解析のツールになった時だと思います。
この板にある癌の話だったり、BMIの話だったりする時に、仮定をチェックするということも統計をデータ解析へ利用する時に必要な作業です。
χ2検定であってもt検定であっても仮定があります。数理統計を勉強しておくとどんな時にχ2検定が利用可能であって、どのような時にχ2検定がだめになるかということがわかります。
BMIってナーヌ?
Body Mass Index のこと?
ageちゃおう。 えへ
多変数量解析ってあんまり ナウじゃない?
統計のPCソフトなんか使っているのある?
おれっち?
おれっちは、貧しく表計算そふと。
もっと貧しくR(GNU S)
数学部の人だと。CとかFortranとかで
バリバリしちゃうんすかねえ。やっぱり。
GNUは使い方がよくわからない(泣
寒い寝たふり止めれ
貧者のS子 R子でしょ
まともな数学科で統計なんてやってる所ってどこ?
ないの?
標本x_1,x_2,…,x_nに対して、標本中央値が
f(a)=1/n?納i=1,n]|x_i-a|
を最小にするaとなることを示せ。但し、nは奇数とする。
さて、どうやって解けばよいですか??
x_1,x_2,…,x_nを小さいもん順に並べたのをw_iとして
y=f(x)=?培x_i-x| のグラフを考えると
y=f(x)ってのはx=w_iのところで折れ曲がる下に凸な折れ線になる。
グラフの頂点は当然(n-1)/2で。
こんな感じでいいのかなあ。
↑自分で書いといてなんだが、むちゃくちゃだな。
でも面倒くさいのでw、がんばって解読してね。
でもグラフの頂点は(n-1)/2じゃなくてw_((n-1)/2)でした。
>ありがとうございます。
>y=f(x)ってのはx=w_iのところで折れ曲がる下に凸な折れ線になる。
のところがいまいちわかりません。標本中央値なので、
頂点(最小値)がn=2k-1とした場合は(2k-1)/2になる、というところまでは
わかりましたが・・・。
y=f(x)=?培w_i-x|
だよね。
x<w_1のとき、y=f(x)=(w_1-x) + ... + (w_n-x) でこの直線の傾きは n ね。
xがもっちょい大きくなって w_1 < x < w_2 になると
y=f(x)=(x - w_1) + (w_2-x) + ... + (w_n-x)
で傾きは(n-2)になるよね。
ゴメソ、大嘘。
× x<w_1のとき、y=f(x)=(w_1-x) + ... + (w_n-x) でこの直線の傾きは n ね。
○ x<w_1のとき、y=f(x)=(w_1-x) + ... + (w_n-x) でこの直線の傾きは -n ね。
~~~
× で傾きは(n-2)になるよね。
○ で傾きは(2-n)になるよね。
はい!!先生しつもーん!!
傾きが増える??なんで??
あと、を普遍的に示すとしたらどのように記述しますか?
>傾きが増える??なんで??
w_i < x < w_(i+1) のとき、Σの中のn個の項のうち、
i個の項のxの係数が(+1)になり
(n-i)個の項のxの係数が-1となるので、
f(x)のxの係数は(2i-n)。
xが増えることはiが増えることだから当然係数も増える、と。
もちろん係数はxの増加にしたがって連続的に増えるのではなく、
x=w_iの地点で離散的に増えるのよ。
多変量解析って何冊が読もうとしたが、どうしてもよくわからない。
わかりやすい本があったら教えてください。
追加。ブルーバックスの「複雑さに挑む科学」ならやさしいのかと思ったら
わかりにくかった。助けてくれーーー。
> 75,76
多変量解析について、どういうことを知りたいのか、何がしたいのか?
例えば、単にパッケージソフトが使えるようになりたいのか、
それとも、もっと深く理解してプログラムが作成できるように
なりたいのか?
いろいろレベルがあるだろう。
わは
77さん、78さん、親切にありがとう。
マーケティング関連の仕事をするようになってあわてて多変量解析
が必要になってSASを使わなくてはならなくなったんだが、
多変量解析の教科書がみなわかりにくくくて困っているわけだ。
俺は文系だから高校数学までしかやっていないが、はっきりいって
数学は得意だったから、何の不安も抱いていなかった。ところが
入門書については、大学の教員が高校卒業生の持っている知識をそれほど
把握しているとは言いづらいし、ページ数の制限があることなどから難しい.
81で問題になっているあたりはたぶん学部教養向けの統計の本、
例えば「統計学入門 東大出版会」あたりを読めばその辺の知識はつきます.
> 75
なるほど。
82さんも書いているけど、統計の基礎についての知識はあった方が
良いと思います。教科書は、やはり、東大出版会の『基礎統計学I 統計学入門』
シリーズをお勧めします。この際だから、『基礎統計学』のシリーズを
3冊とも備えておくと、後々まで重宝するでしょう。
訂正&補遺
> 東大出版会の『基礎統計学I 統計学入門』シリーズ
『基礎統計学』シリーズですね。その第1巻が『統計学入門』です。
第2巻には、多変量解析(因子分析とか多次元尺度法)が紹介されています。
また、第3巻では、回帰分析のやや詳細な説明があります。
統計はやたらと分布とかを覚えろ覚えろって感じ。
なので、数学科の人も嫌がる傾向あり。
上級になっても分布として載っているだけ。
高校の世界史の教科書とかじゃあるまいし、事項だけ覚えろってのか。
確かに、統計学の教科書では分布の話がたくさん出てくる。
それは、分布を特定した方が、解析がしやすいからだ。
しかし、上級の(大学院向け以上の)テキストでは、特定の分布を
想定できないケースの解析のための、ブートストラップ手法や
ノンパラメトリック回帰なども扱われる。
84でなくて85でないのContextからして。
イヤそういう意味でなくて、どういうことらかそのような分布が
出てくるとか考え方が示されていないとか。
導出の仕方が省かれている書物が多いということ。
確かに、84ではなくて85さんに書いたものです。
導出の仕方が省かれている書物が多いのは、ご指摘の通りですな。
(さきのレスでは、85氏の指摘を読み損なってるな)
きちんと導出するのは結構大変なので、
手を抜いている本が多いんだと思う。
# しかも、「わかりやすい」とかうたっている本に、
氏
やさしい本に暗記型が多いように思えます。
もともと数学が嫌いなひとに、ますます嫌気が差すように作られて
いるような気がする。
漏れが見た中でそうでない本は。
国沢清典『確率論とその応用』
竹内啓『数理統計学』
ぐらいだけど。まあ、辞書として使うのだけど。
さんへ
ぼくが読んだ範囲(斜め読み含む)では、
柴田 文明,"確率・統計", 岩波書店
が、細かい式の導出もしていて良かったです。
あと、古めの本では、
77さん。
挙げられた本のなかで知らないのは。
>柴田 文明,"確率・統計", 岩波書店
>鈴木 武, 山田 作太郎, "数理統計学", 内田老鶴舗
です。ちょっと図書館辺りで見てみたいと思います。サンクス。
あと、国沢さんの本は名著と云われるフェラーと同名の本です。
ちなみに岩波全書です。
を読んで勇気付けられた。
やっぱりみんな苦手意識 (というか嫌悪感というか) 持ってるのね。
そういう人には情報幾何学が良いのではないかと.
amazonははやい。「図解でわかる多変量解析」は今日届いた。77さんが
挙げてくれた「コツ」の本も即座に注文したので近日中に届くはず。「図解」
を見るとなるほど分かりやすそう。でも付録の検定のところでF分布とか
自由度とかやっぱりいきなり出てくる。皆様のアドバイスどおり、
ここらへんは要するに統計学の教科書で学ぶしかない、ということなのかな。
皆様親切にありがとう。
ところで俺はここで話しているうちに大きな潜在需要を感じた。
集合論は奥が深い
私の手元にあるのは大分古いので(1989年12月5日第23刷)最近のは直っているかもしれないが、164ページのベクトルの意味の説明でベクトルOHとベクトルOFの説明が逆になっている(159ページの図の説明と違うので注意してみればすぐわかることだが)。
経営畑出身だけど
むしろ、マーケティングの連中のほうが
統計解析をしてるんじゃないのかなあ
おれもやったし
確立ってはやり、マイナーかんな。
本でもあんまり取り上げにかな
は〜っと。
P=何たら、ってまさに確率そのものなんですけど。
まじめに勉強すると統計的分布論はかなり深みのあるテーマだと思います。
ピアソン分布系、対数正規分布、逆ガウス型分布、楕円型分布などなど。
多変量解析だろうと時系列解析だろうと全ては分布論に帰着する。
統計的分布論は10年の冷や飯を覚悟しなければならない。
洋書で、統計学の最強書を教えてください。
ワラタ
その辺りを直観的に説明してくれる本がないような気がする。
正規分布の証明に必要なスターリングの公式の証明が
結構スゴクてビックリした覚えがある。
ワラテナイデオシエテヨ
age
>スターリング
フェラーの確率の教科書にいい説明なかったかな?
フェラーは高いよぉ〜。
30分5000?
ソビエト連邦?
「心理学のためのデータ解析テクニカルブック」って
どんな感じ?
> 112
心理関係では割と評判は良いと聞くので、もっている。
が、ほとんど読んでいない。
読んだ範囲で言えば、数学的な統計の本と言うよりは、
数値例(計算例)を出して、読者を納得(≠理解)させようという感じ。
公式は出ているが、その導出までは載っていない。
つーか。統計ってそんな本ばっか。
ありがとうございました
国の機関に統計なんたらってあるよね。
あれって何?
総務省統計局のことか?
ここは国勢調査や物価統計などの国の指定統計を実施している現業官庁だよ。
来年には独立行政法人になる予定。
文部科学省の統計数理研究所のことならこの板にスレ↓があるよ。
../1005/1005729178.html
統計数理の方でした。
情報ありがとう。
見学行こうかなぁ。
経済企画庁は?
俺は薬学出身なんだが、最近統計が必要になってきた。
自分でやるわけではないんだが、統計解析屋さんと喧嘩できるレベルになれなどと無茶なことを上司に言われ、
学生時代に使った薄っぺらい教科書を出してきて読んでみたもののさっぱりわからない。
このスレで紹介されているものを少し見てみようと思います。
ああ数式の羅列を見ると吐き気がする。
>統計解析屋さんと喧嘩できるレベルになれなどと無茶なことを上司に言われ、
なんか、納得できる。
なるほど統計解析屋さんか
分野別スレage
標準偏差から、変動率を出すにはどういう計算をするのでしょうか?
インターネットで検索しても株のサイトしか出てきません。
分野別スレage
変動係数という意味なら標準偏差÷平均値だよ。
分野別スレage
統計学において、データの数が少ない時にその統計の正確さを表す公式を
教えていただきたいんですが。
自分は統計学を学んでないんでよく分からんのです。
1羽の鶏が産む卵の重さは正規分布に従うとする。ある鶏が産んだ10個の卵の
重さ(g)を
測定したところ
68.1 70.4 71.5 67.6 70.2
74.5 68.6 70.3 71.2 69.6
であった。この母集団の平均をm1とする。
この鶏に1週間あるビタミン剤を混入した飼料を与えたところ、6個の卵
を産み、その重さは
正規分布なんかでよく出てくる(
もしくは m-1.96σ/√n
の
σ/√n
で見る
?@等分散の検定は、F分布を使う。
?Am+t(n)*σ/√nの mをm2−m1に変える。σは、10個の時の分散と6個の時の
分散を加重平均したものを使う。
これは統計学入門の名著である、小針「確率・統計入門」岩波書店
1973年 に掲載された例題 (p.204 および p.210)。しかし、原著には
ビタミン剤の商品名を特に「コケコッコー」としているのに、上の引用
では省略されている。引用が不誠実。よって、回答は教えない。
最尤法の尤度がよくわからないです。
分布がy=x~2だったりすれば尤度関数はどうなるのですか。
確率変数Xは正規分布(10,3^2),Yは(5,4^2)に従い、互いに独立です。
Z1=X+Y Z2=X-Y Z3=XY とすると
Z1,Z2,Z3の期待値と分散、Z1とZ2の共分散、Z1とZ3の共分散を求めなさい。
誰かこれの答えを教えてもらえませんか?
よろしくお願いします。
age
137です
誰かこの問題を教えていただけませんか?
できれば具体的な数字で答えをしりたいのです。
お願いします。
宿題くらい自力でやれ。
変動係数を用いてばらつきを評価するときの長所、欠点を教えて欲しいっす。
t分布は自由度が大きくなるにつれてスソが軽くなるように見える。
実際、自由度は∞のときに標準正規分布になることが知られている。
なぜそのようになるのかを説明せよ。って問題だれか教えてくれませんか?
利点
平均を1とするので、
数字の桁数が異なるものでも、同じものさしで
ばらつきの大きさを評価できる。
欠点
まともな使いかたをしたらないんじゃない?
ところで、
> 144
> 統計の中級者、上級者向けの本を紹介してほしいです。
……略……
> これは、初心者には難しいでしょうか?
↑この2行、矛盾してない?
中級・上級向けが欲しいなら、初心者にとって難しいかどうかは関係ないでしょ?
人数、平均値、標準偏差で
平均値の差の検定のやり方教えてください
こ れ か ら は 世の中 統 計 学 が 面 白 く な る わ け だ が
統計解析でよく使われるという「SAS」ソフトウェアに付いて詳しく教えて下さい。
異業種(化学専攻を卒業)を退職し現在無職。SASのオペレーターへの転職を検討中
です。
30代にして人生この先、食べていけるでしょうか。
はじめまして。
株の値動きについてシステム化しようと思い、統計学を基礎から学ぼうと思っています。
このような方面の人にお薦めの統計学の良書をいくつか教えてください。
統計解析学になるのでしょうか?
ブランドのポジショニング分析をしたいのですが
SPSSとかで可能でしょうか
主成分分析を勉強しています.
あるデータセットで主成分分析をし,主成分得点の表を作ったのですが,その時
求められたの軸を使って,他のデータセットの主成分得点の表を作るにはどうした
ら良いのでしょうか?
わかる方,よろしくお願いします!
ポートフォリオとかでしょ。
多変量解析の中でも特に主成分分析を使うと思います。
タイトルは統計解析よりむしろ多変量解析で探した方が良いと思います。
最初に得られた固有ベクトルでスペクトル分解して
各固有ベクトル方向の値を求めれば主成分得点が得られます。
しかし、他のデータセットを加えて改めて主成分分解してみる
ブートストラップってどういう理論の元に成り立ってるのですか?
本を読んでもいまいちわからなくって・・。
学部生です。最尤法をつかうことになってしまって相談させて
ください。
JavaないしMapleVでできますか?いまんとここれしかできないす。
しかしJavaには数値計算ライブラリあるのかすら知らないし、
Mapleは数式処理しかしたことなくて、データをロードして
数値計算したことないっす。
文系学生から質問です。
統計解析なんてSASなどのソフトの使い方を
知っていればそれでじゅうぶんなのでは?
うちのゼミでは背景にある理論的なことまで
(確率分布の話とか)
やっているけど何の価値があるのかわかりません。
学生な上に文系だから。
そう、価値がないんだよ。
気が付いた?
> ポートフォリオとかでしょ。
> 多変量解析の中でも特に主成分分析を使うと思います。
> タイトルは統計解析よりむしろ多変量解析で探した方が良いと思います。
レスありがとうございます。ずっと待ってました(w
多数の銘柄間の値動きの分析と言うよりは、一つの銘柄の、一定期間の値動きを
分析しようと思っています。
,156
単純に、最初のデータセットで求められた固有ベクトルの式に代入すれば良いんじゃないの?
スペクトル分解って何?
高校生にスペクトル分解は無理かもな(w
ちょっと言っている意味がよく掴めていないのかもしれないんだけど、
『一つの銘柄の一定期間の値動き』というのは
主成分分析の場合は、他の多くの銘柄と連動しているから、
それらとどの程度関係があるかを主成分で観る訳だよね。
『一日の日中の値動きや1週間の値動きの癖』
主成分を計算するためのデータ一つ一つが期間の平均値として扱うだけ
ということでは不充分なんだよね?
大学生でもスペクトル分解わかりませんが何か?
宮廷理系ですが何か?
欝山車脳。
は別にあってるんじゃないか?
何度もレスありがと。
銘柄によってはまったく他の銘柄と相関関係の無い物もあるのですよ。
あと、例えば9時半に各銘柄がその日の高安値がつくとか、3月後半はいつも高い、
等の癖があるので、それを見分ける為に統計学を利用出来れば、と思いまして。
微分的と言われると数分単位なのかもしれませんが、教えていただいた時系列分析の
書籍を探してみます。
やりたいことはパターン認識っぽいね。
ニューラルネットワーク、GA、ヒドンマルコフモデルとかざっと調べるといいかも。
補足。取引毎のデータを扱う統計学は最近かなり発達してる。
専門の研究室にいないとデータを手に入れるのが大変かもね。
質問!
1つのピークしかもたない分布は、
平均、分散などでその形を評価できますよね。
2つピークをもつ分布を評価するようなものってありませんか?
ここでの評価ってのは、複数の分布を比較して差異を明確にする
って意味で書きました。
この分野はこの本を読めばもう大丈夫っていう代表的な本を教えて
ベイズ統計学ってのは最近どうなんでしょうか?
意思決定に使われていますか?
私もベイズ統計に興味があります。
どなたか現状を知っている方いませんでしょうか??
理論とか、実解析だとか
少し簡単に今回の件にかんして解説しておきますと
スポーツブックにメジャーリーグを対象とした賭けがありまして、
勝ち負けを予想するもので普通はどちらのチームも1.9倍くらいの
倍率なんですが、首位と最下位とかの試合になると、
その倍率が1.3 倍と3.5倍とかになるのです。
で、その3.5倍の方があまりにオイシイのでは?ということです。
最下位でも勝率350くらいはあります。3回に1回くらいはかちます。
いくら首位が相手でも、投手も打線も水物の野球というスポーツで
賭博の場合は、両チームの実際の勝率よりも、それぞれのチームに
何人が賭けると考えられるかの方が重要だったりします。
胴元は「試合の勝敗」ではなく「賭けの結果」で儲かる儲からないが決まるのです。
それは胴元にとってだけ重要な問題であって、
賭ける側には(胴元が破産しない限り)関係ない。
>>数学ヲタ
._,,,,,,。,,、 广'x、 ,,、._ 」'゙''i、
,,,,,_.,,,,、广゚┐ .,,,v―冖"~゛ ゙'i、 .ト ,|,_ riゃ .} .,i´ '冖i、
.] ` f゙,l° ,i´ .゙l_ .y-┐ 'や'゙"゙’ _,,,vr" .゙ト.゙'x,,,,广 ィ・'''゙~ .._,,v・゚ヒ''''・x、
入、rУ ,iレ-v,,,、 .,r°."'''l゙ ,|√゙゚'i、 匸 ._ .y・'゙゚,,,v―-, .:゚ーa .√ ._,rll_ :}
.,r''y|゛゙゙l..,i´ ,i"゙l, .゙ト ,r°,,, .., ._,,vぐ .`√ .,i´l广._,,,,,,,,i´ ,,i´ ,i´ ,「 .:| .~''''″
.r″ .|゙l、 “ .,i″.yi入-イ il∠i、.` .,メ| | 」'ト .,,i´ .,i´ ,, ̄ .[ .,i´.,,,,,,! .]_
.゙l_,i´,レ .'?_,,,,レ ~''┐ .,r°.,i´.| .| ,l゙ :゙l、 ,,i´ ,i´ l゜.゚L__ .:―ヤ゚″_ :~''=、
倍率決めるのは胴元だろ?
そうだけど、質問者が聞きたいのは、胴元がどうやって
倍率を決めているかについてじゃなくて、
すでに決まっている倍率についてどっちに賭けたら得か
と言うことだろ?
>>数学ヲタ
._,,,,,,。,,、 广'x、 ,,、._ 」'゙''i、
,,,,,_.,,,,、广゚┐ .,,,v―冖"~゛ ゙'i、 .ト ,|,_ riゃ .} .,i´ '冖i、
.] ` f゙,l° ,i´ .゙l_ .y-┐ 'や'゙"゙’ _,,,vr" .゙ト.゙'x,,,,广 ィ・'''゙~ .._,,v・゚ヒ''''・x、
入、rУ ,iレ-v,,,、 .,r°."'''l゙ ,|√゙゚'i、 匸 ._ .y・'゙゚,,,v―-, .:゚ーa .√ ._,rll_ :}
.,r''y|゛゙゙l..,i´ ,i"゙l, .゙ト ,r°,,, .., ._,,vぐ .`√ .,i´l广._,,,,,,,,i´ ,,i´ ,i´ ,「 .:| .~''''″
.r″ .|゙l、 “ .,i″.yi入-イ il∠i、.` .,メ| | 」'ト .,,i´ .,i´ ,, ̄ .[ .,i´.,,,,,,! .]_
.゙l_,i´,レ .'?_,,,,レ ~''┐ .,r°.,i´.| .| ,l゙ :゙l、 ,,i´ ,i´ l゜.゚L__ .:―ヤ゚″_ :~''=、
あげ
数学者さま、あっちにもぜひ降臨してください。
冷静にいきたいんなら勝率とか投手のローテとか考えて
賭ければいいんじゃないの。
もっとも賭けてるやつの大半は、ファンだからとかのご祝儀賭け
なんではないかと思う。
ところで胴元より儲かることってあるのか?
> 胴元より儲かることってあるのか?
どういう意味だ?
たとえば、A×Bの試合で、どっちも倍率が1.8倍で、
両方に100万円ずつかかっていたら、胴元の儲けは20万円。
もし、当たった方に一人で50万円賭けてるヤツがいたら、
そいつの儲けは40万円。胴元より多い。
http://www2.rosenet.ne.jp/~piwo/sbook/ のプレイから辿っていき5スターってとこにいって、
「リアルプレイ」→「スポーツブック」→「ベットライン」
→「BASEBALL」→「MLB Game LInes」にいくと配当とかがみえるけど、
先発投手はあらかじめ発表されています。
この時間だと試合中が多いので倍率出てるのは少ないのですが、
みてもらうとわかるとうり、弱いチームは+210とか+250とか出るわけです。
ちなみに他のスポーツは知りません。
ただ、ホッケーやアメフト、ラグビーにくらべて
圧倒的に野球の方が番狂わせがある気がするんですよ。
ラグビーとかは社会人と学生でも70ー0とか平気でありますよね。
野球の場合そうはならないと思っています。
理論的にも実務面でもまだまだおもしろいことはありそうな気がするが、
現実には手回し計算機時代の遺物として化石化していくんだろうな。
また疑問が湧いたので頭のいい人おしえてください。
例のやつですが、100ドルチップを買うと10ドルもらえます。
で、2チーム対抗の試合のデフォルトの倍率が100/110+1です。
つまり、100ドルチップをかって110ドルになるので、
その110ドルをすべてそのデフォルト倍率にかけると
2分の1で自分の応援したチームがかち、その場合100ドルプラスになる。
当然2分の1で負けるので100ドルマイナスになる。
つまり100ドルプラスになるのも2分の1、100ドルマイナスになるのも
と、すると、イーブンと思うのだが、あっているだろうか?
ただ、ここで疑問なんだが、デフォルトの倍率が100/110+1
なのでそのまま賭けをつづけると、だんだん減る事になる。
これは結果としてどういうふうに判断すればいいのだろうか?
最初の10%ボーナスがあるから期待値はプラスマイナスゼロのはず。
なのになんかいずれ損する可能性がある。
意味わからん。
期待値プラスマイナスゼロがどうしてマイナスになるのだろうか?
わからん。結果としてこれは期待値どうなの?イーブン?マイナス?
説明の意味がよく分かんないのだが、
100ドルチップ買って何もしないと10ドル儲かるの?
どうやらそうらしい。
なんもせんでも、10%はご祝儀としてもらえるらしい。
ふたりで行ってそれぞれが対抗チームに賭けると
どちらが勝っても総計20ドルの儲け?そんなバカな‥!
要するに、10%貰う代わりに、そのお金を
一回以上掛ける義務があるのね。
とすれば話は簡単。
一回目の賭けだけ、(ボーナス分を込めて)期待値はイーブン
二回目以降は期待値はマイナス。
だね。
あと未解決な問題としては野球というスポーツに3倍と1、3倍という
開きがあっておかしくないかってことだね。
例の掲示板見てきたが、昨夜3チーム3倍以上のチームがあって
それらに20ドルづつ賭けた奴がいたが、当然3連敗しない限りは
マイナスにならないということだ。
このことが統計的にどう考えられるかということだね。
相対関数ってなんでしょうか?
突然調べる必要があって、適当な入門書を探しているのですが、google
ではそれらしき物を発見できませんでした。確立過程ってのが関係ある
ようなのは見付けましたが、あとはわかりません。
レベルは数学専攻でない学部1年生ぐらいはあるかなぁ。昨日、ポアソン
分布、正規分布について勉強しました。まぁまぁ分かったかな。
やはり負けが込んでるね。
ついに777円出しました。
買った内容は
セノビー 140円
Dr.GRIPのシャーペン 500円
消しゴム 100円
です。
あわせて740円で消費税入れて777円ですた。
ということで以降のレスはは神だけで1000まで
目指すスレになるからよろしこ
流れに従えず、すまそ。すいません。これわかりません。
従業員たちはある仕事を平均10分、標準偏差1.5分で仕上げる。
ところがあるエンジニアが新たな作業方法を発明した。
そのエンジニアによれば、サンプル64人の従業員が新しい
作業方法を使うと平均8分で同じ仕事を仕上げることが
できたとした。
1)サンプル平均X64が8分以下で仕上げる可能性を求めよ。
2)1)の結果を元に、そのエンジニアの新しい作業方法を
採用すべきかどうか答えよ。
初歩の初歩だね。
標本平均が8になるのが、標本平均の分布の棄却域に入ってるか否かを調べればよい。
標本平均は(10、1,5/√64)=(10、0,1875)に従うから、10より2もずれているということは、
このサンプルが与えられた分布に従ってる可能性は非常に低いことになる。
したがって与えられた分布からのサンプルではない、言い換えれば母平均が少ない作業時間のサンプルから選ばれたと結論できる。
age
ガウス分布にぴったり完全に従うような事例を発見できればなにか賞もらえますか?
象印賞を差し上げます
すみません、どこで聞けばいいのか分からなかったのでここで聞かせてください。
私経済学畑出身のものです。
全然知識がないのに、計量経済学(時系列分析)でデータセットを与えられて「これはARMA(p,q)プロセスだから、pとqを求めなさい」と言われました。
一応その先生推奨のソフトウェアを使ってそれなりにいじくってみたのですが、p値だのt値だのと出てきて、その読み方(解釈の仕方)がわかりません。
誰か簡単にこれらの意味を教えていただけないでしょうか?
あと、t値やp値などの基礎から応用まで詳しい英語の参考書とかって誰かご存知でしょうか?
数理統計の本はどれがいいのでしょうか?
P値って俺も分からない。誰か教えて。
t値は仮説検定で母分散が分からない時標本不偏分散を用いてt検定をするが、その時のずれの度合。
標準偏差×〇の〇の部分に当たるものだと考えればよく、絶対値が大きいほどずれが大きく仮説が間違っているといえる。
重回帰分析でしょっちゅう出てくると思う。
ホーエルの入門数理統計学は記述はいいが、章の順序が良くない。
統計を勉強するなら、どこの大学院がいいのでしょう?
実験計画法をやりたいのですが・・・
統計数理解析研究所
t値とは、平均の検定に用いられる統計量で大きければ帰無仮説は棄却される。
p値はその帰無仮説の下でそのt値をとる確率。
t値が大きければ、p値は小さくなる傾向にある。
Rao、C.R. Linear stastical inferences and its applications
宮岡、野田 数理統計学の基礎
この二つはいい本だと思う。ただ読みとおせるかどうかは別問題。
宮岡、野田というのは知りませんが、
素人にラオを薦めるのはいかがなものか。
と思うわけです。
間違いなく名著ですが。
もうちょっと初心者向けのお願いできないでしょうか?
入門書なんだど、理論に飛躍が無く、ちゃんと証明ものってるやつ。
こんなこと言うと怒られそうだけど。
初心者で申し訳ないのですが質問です。
レンガの買い手は近頃のレンガの品質はどうも低下しているようだと思っている。
過去の経験では、レンガの平均破壊強度400ポンドで、その標準偏差は20ポンドであった。
100個のレンガをとってテストした結果、その平均は390ポンドであった。
平均品質は低下したという対立仮説に対して、それは変わっていないという仮説を検定せよ。
これはどのような検定をすればよいのでしょうか?
名前だけでいいので教えてもらえませんか。。
アニキたち、漏れは数学は中学以来やってないド素人です。
ポアソン分布の証明がよく分かりません。
特に、lim n→∞ (1+λ/n)n乗=eの-λ乗ってとこが分かりません。
どうか人助けと思って教えてやって下さい(泣
それは、微分積分の本を開いて、e^xの定義のようなものを
書いてあるところ探した方が良いんじゃないの?
201と同じ
ただの統計学でなく数理統計学の本だからなあ。
ネイマン・ピアソンの定理や尤度比検定が載ってる入門書は限られてくる。
数理統計学ではないが、「経済分析のための統計的方法」が式展開がしっかり書かれてて読みやすい。
e=lim n→∞ (1+1/n)^n という定義だから、
lim n→∞ (1-λ/n)^n=e^-λとなる。
>e=lim n→∞ (1+1/n)^n という定義だから、
>lim n→∞ (1-λ/n)^n=e^-λとなる。
説明になってない…。
213と214が逆でした。
lim n→∞ (1+m/n)^nでm/n=pとおくと与式=lim n→∞ (1+p)^m/p=e^mとなる。
の式間違ってるよ。
lim n→∞ (1+λ/n)n乗=eのλ乗
ならばこれはまさしく定義。
高校の数学3の教科書にいろいろ載っているはず。
微積のときにうっとうしい係数が出てこないように作られた数。
eの定義としては微分したものが元の関数と等しくなるような指数関数の底ということ。
この時 (a^x)`=lim b→0 [a^(x+b)-a^x]/b=a^x(a^b-1/b)=a^xより
lim b→0 (a^b-1/b)=1
a^b-1/b=1よりa=(1+b)^1/b となり、lim b→0 a=lim b→0(1+b)^1/b=e となる。
>与式=lim n→∞ (1+p)^m/p=e^m
lim p→0 (1+p)^m/p=e^m の間違い。
ああ疲れる・・・・
統計の一般的な基礎理論を勉強するなら
東京大學出版会の自然科学の統計学とか数理統計学(しょうかぼう)がいいと思う。
前者は厳密な証明がのってるわけじゃないけど、直感的にわかり易くて網羅的。
後者は前者よりも厳密に理論を展開するけど前者よりは項目数がすくないかな。
どちらにしろ(他の本でも)、
漸近理論や尤度を使ったりするところで証明をしていないことがほとんど。
そういうところはまた別にやっていくしかないと思う。
t検定について聞きたいのですが、
t検定をする場合、
平均値、標準偏差、t値、P値というのを検出すればいいんですか?
その場合、平均値と標準偏差は出るんですが、
t値とP値はどのように出せばよろしいのでしょうか?
ちなみに
平均値 標準偏差
A 21.9643 9.8413
B 32.3923 11.6376
です。
多分アナタ全く分かってないんじゃないの?
t検定では標準偏差と言う言葉は使わない。
大体なにがいいたいかはわかるんだけど。
あと、母平均をいくつと(帰無仮説では)仮定してるわけ?
はい、おっしゃるとおりほとんど分かっておりません・・・
母平均は等しいと仮定しています。
標準偏差というのはないんですか??
だからAとBの母平均はいくつと仮定してるわけ?
あと標本数の情報も必要だね。
その辺の事はだれでもわかるような本にも書いてあると思うので、それ読んでから書き込んでね。
標本数は28です。
Aの合計が615 Bの合計が907なので、
それぞれ28で割るとA 21.9643 B 32.3923
と出てきます。
母平均は未知なのでいくつとか仮定できないのですが・・
だから未知の母数(ここでは平均)を仮定して検定するのが仮説検定でt検定はその一手法なんだけど。
大体言いたいことは推測つくので母平均をpと仮定してAについて求めてみると、
9.8413^2*28/27=a(標本不偏分散)を求めてその後
21.9643-p/{(a/27)^1/2]を計算する、これがt値。
AとBの母平均が等しいか否かを検定するためには、
まず、AとBの母分散が等しいか否かF検定する必要があります。
それによって検定のためのt値は変わってきます。
中心極限定理について。
確率変数Xがあり、-∞ < X < ∞の変域で、
n回の試行での平均をYnとすると、つまり、
Yn=(X1+X2+・・・+Xn)/n
で定義されるYnの分布は、正規分布に従うのが中心極限定理ですよね。
ところで、これは、Xの変域がR全体でないときにも正しいのですか?
たとえば、[a,b]や、[a,∞]でも正しいですか?
区間を絞ると、正規分布からずれるような気がするのですが。
それは必要ないでしょう。
t検定は不等分散について十分頑健ですヨ。
ほしゅったらあげろ!
YnはE[X]に(適切な意味で)収束する。正規分布には従わない。
きみは大数の法則と中心極限定理を混同してる。
2標本のt検定が全く分からないです(爆
分かりやすく書いてある良い本ないですか?
平均方向μ、集中度κのパラメータを持つ円周正規分布
f(θ;μ,κ)=exp{κcos(θ-μ)}/2πI(κ) 0≦θ<2π において
α(1),α(2),・・・,α(n)〜f (i.i.d)とする時
f(α(1),α(2),・・・,α(n))
=Π[i=1,n]f(α(i))
={(1/2πI(κ))^n}*[exp{κ?納i=1,n]cos(α(i)-μ)}]
=exp{κcosμ?納i=1,n]cosα(i)+κsinμ?納i=1,n]sinα(i)}*{(1/2πI(κ))^n}
=[exp{κ(cosμ)(Rcosζ)+κ(sinμ)(Rsinζ)}]*[(1/2πI(κ))^n]
で、κが与えられた時のμの十分統計量を求めよ。
という問題なんですが、1つのパラメータを推定するのに
Rcosζ、Rsinζの2つ必要なのでしょうか?
だからと言って1つだとどっちなのかも分かりません。教えてください。
μとκが未知の時のμとκの十分統計量はCとS、
μが与えられた時のκの十分統計量は?把os(α(i)-μ)だと分かったのですが・・・。
ここだ!ヽ(´ー`)ノ
ふぅ、やっと見つかった。あっちこっちの掲示板で放置されつづけた
おいらの疑問に答えてくれ〜。
↓コレ
>パチンコにおける標準偏差の出し方について教えてください。
大当たり確率1/315、確変割合1/2(大当たりした時1/2の単発
絵柄だとそこで終了。確変絵柄だと次回大当たりまで玉が減らず、
次も確変だと・・・と単発絵柄が出るまでループします)という
初当り(確変中の当りを覗いたもの=通常時の大当たりをさします)
に対する期待大当たり回数が2回の台の場合。
10000回転させた時の標準偏差はどれくらいになるんでしょうか。
確率p、回転数nとしたときのノーマル機の標準偏差√[pn(1-p)]
までは何とか理解したんだけど、確変のバラツキをどのように考慮
すればいいか分かんないんす。誰か分かりやすく教えて〜。
簡単のため、 p = 1/315 とおく。
確率 1-p で、大当たり回数 0回。
確率 (1/2)p で、大当たり回数 1回。 ← 一回目で通常絵柄
確率 (1/4)p で、大当たり回数 2回。 ← 一回目で確変絵柄 二回目で通常絵柄
確率 (1/8)p で、大当たり回数 3回。 ← 一二回目で通常絵柄 三回目で確変絵柄
…以下同様
なのだから、回転数1回のときの分散は
( (1/2)p 1^2 + (1/4)p 2^2 + (1/8)p 3^2 + … ) - (2p)^2
となる。あとは単なる無限数列の和の問題。
A = ( (1/2)p 1^2 + (1/4)p 2^2 + (1/8)p 2^3 + (1/16)p 4^2 + … ) ▲ とおくと、
2A = ( p 1^2 + (1/2)p 2^2 + (1/4)p 3^2 +(1/8)p 4^2 + … ) ●
4A = ( 2p 1^2 + p 2^2 + (1/2)p 3^2 + (1/4)p 4^2 + … ) ★
なので、★-2●+▲ の両辺を計算すると、
> 確率 (1/8)p で、大当たり回数 3回。 ← 一二回目で通常絵柄 三回目で確変絵柄
逆だ。(w
スマソ。
うぁ〜、ありがと〜。さすが統計学スレ〜即答〜。
でも、バカチンだからピンとこないや(ププッ
よし、ガンガッテ理解するぞ。
ひぃっ。数式が難しすぎるぅT,T
これを見て、ノーマル機の標準偏差も全然理解してない
ことがわかりましたぁT,T(アポでしたぁ
と、とりあえず確変のバラツキを考慮しない標準偏差(2√[p(1-p)n]
←あってますよね;;)を上で出していただいた√[2p(3-2p)n]から
差し引いてみまして、確変のバラツキというのが√(2pn)ほどある
という理解でよろしいでしょうか(汗
しかし、
>なのだから、回転数1回のときの分散は
( (1/2)p 1^2 + (1/4)p 2^2 + (1/8)p 3^2 + … ) - (2p)^2となる。
ってあたりは、すっごく初歩的な問題なのですか?(汗だく
>確変のバラツキ
というより、確変によるバラツキでした(ヒィッ
サンプル数が多いと有意差が多くなる事が統計学の限界のように論じられていますが何が問題なのですか?
精密さが増してるだけでしょ?
サイコロが胡散臭いかどうか調べようとして行き詰まりました。
スレ違いだったらすいません。
500回振ってみて、カイ2乗値とゆー値を計算したら67になりました。
その値を何と比較すればいいんでしょうか?(まるで見当違いでしょうか?)
20面体のサイコロなので自由度は19らしく、カイ2乗分布表を見たところ、
0.995のとき6.84・・などとなってます。
カイ2乗値が6.84だったら99.5%胡散臭くない、という意味なんでしょうか?
振る回数が500回で十分かどうかも自信ないです。
自信もっていい。
振る回数以外のことも教えてほしいんだけど。
どーか教えてくださいage
カイ2乗値(例えばピアソンの適合度基準の値)が大きいとき,
そのサイコロは“胡散臭い”とみなし,大きくないとき,“胡
散臭くない”と見なす.
“カイ2乗適合度検定”をキーワードにして調べてみ.
「統計学」の限界というのは意味不明。
念頭においてるのは仮説検定?
学校の授業でSASというソフトを習っているんですが、
まったくわかりません。
上っ面だけでもいいから初歩的なことを
一通り学べるやさしい本やホームページはないでしょうか。
(・∀・)リサンガタデシタ
はV[X]が負
P(A∪B)=P(A)+P(B)-P(A∩B)
の証明を教えて下さい。
ベン図を書けばすぐわかる事。
こんなんでました
【1】700ページの本に700個のミスプリントがあるとする。
1ページに3個以上ミスプリントがあるページはどれくらいあるか?
【2】ある集団では1パーセントが胃癌にかかっている。胃癌にかかっている人を
少なくとも1人含む確率が95パーセントを超すためには少なくとも何人を抽出し
なければなならないか
【3】パン屋のぶどうパンに干しぶどうが10個未満しか入ってないのが全体の
5パーセントを超えると苦情が入る。干しぶどうは一個1gでパン一つに対し小
麦粉30グラム使用する。300kgの小麦粉に対して干しぶどうを何kg仕込めば苦
情を受けないか。
【3】ヒント
30分の300×1000=10000個のパンを作ろうとしている。10000χg=10χ?sの干し
ぶどうを仕込めば1個当たり平均χ個の干しぶどうが入る。
Pχ(0)+Pχ(1)+…+Pχ(9)<0,05となるようなχの最小値を求めればよい。つまり
1+χ+2の階乗分の1×χの2乗+…+9の階乗分の1×χの9乗<0.05eのχ乗
となるχの最小値を求めればよい。
マルチすんな、ヴォケ!
[1] どのページについても「同様な確からしさ」でミスプリントが存在するという
保証がないと、なんともいえない。それがあってこそ、確率という扱い方ができる。
しかし、この問題ではそのことには一切言及していない。従ってこれは条件の不備。
条件が不明なのに推論を続けるのは科学的には極めて危険で、下手に強引に推し進め
るのは、宗教や政治に悪用される結果に終わるので、そんな癖はつけない方がよい。
[2] これは、授業を聞いたかどうかをチェックしている問題である。定義そのままと
いってもいいくらいである。つまり我々が代返しても無意味。参考書という「なかった
ことをあったことにするための道具」がある以上、そちらをお勧めする。
[3] 素直な感想は「ここまでヒントが出てるのに?」である。わからない問題スレや
くだらない問題スレで「解き方」尋ねる分には、多くの者が助けてくれるだろう。
「解く気がないのに答えを聞く」分には、完全に叩かれるか、阿呆が自慢げな答えを
書いてくれるかに終わるだろうが、自信過剰な阿呆のすることだから間違ってても
気づかない。そんな人の答えはうのみにしない方が身のためだろうことお伝えしておく。
親切に答えてあげるが、全部ポアソン分布でいいんじゃないの。
まあ260の言う通り。
は (゚∀゚)イイッ!こと書いてるね
すいません、統計の専門の皆様にお聞きしたいのですが。
今、正規分布N(μ1,σ1^2),N(μ2,σ2^2),..,N(μn,σn^2)が与えられていて、
ここから、サンプリングするプログラムを書いてます。
ところが、制限があって、
x1+x2+…xn=a(定数)という条件を満たさなければなりません。
(x1,...,xnはそれぞれの正規分布からとった数)
で、やりたいことは、この制限を満たしつつ、(x1,..,xn)の組を
たくさんとったとき、それらの組があたかも元の
N(μ1,σ1^2),N(μ2,σ2^2),..,N(μn,σn^2)を再現できている
かのようにサンプリングしたいのです。
(すいません、伝わっているでしょうか?下手な文ですいません)
ところがうまく再現できるたくさんの組が作れません。
みなさんの、お知恵を拝借したいです。
最初は和の制限なしにたくさん(x1,..,xn)をサンプリングして
和がaになるものだけでフィルタリングしたのですが、
結論からいうとできない。
n=2 のとき x2=a-x1 だが、x1 が正規分布なら x2 は正規分布でありえない。
他の n でも同様。何かモデルを変更する必要がある。
> 最初は和の制限なしにたくさん(x1,..,xn)をサンプリング
> して和がaになるものだけでフィルタリングしたのですが、
N(μ1,σ1^2),N(μ2,σ2^2),..,N(μn,σn^2)
に従う独立なn個の確率変数x1,…xnの実現値が,
x1+x2+…xn=a(定数)
を満たす確率は0ではない?
質問です。
センター試験など選択科目による格差を無くすための処理で、
科目別に偏差値を算出することで、ある程度格差を吸収できると思うのですが、
それぞれの科目の選択者の集団の、
それ以外の科目(たとえば英国数)での結果に大きな差が発生してる場合、
または科目の選択が自由でなく、敢えてレベル別に分けて受験させた場合、
どういう補正や手法が適切でしょうか?
いわゆる偏差値の定義ってなんだっけ?
M点満点のとき得点Xの偏差値S[X]は標準偏差σと平均点E[X]でどう表せるの?
どもありがとうございます。確かにn=2のときはできないですが、
他のnだと本当にダメですか?というか、正規分布になるように
たくさんのデータを生成したいのです。。。説明が下手ですいません。
もちろんその確率は0ではないです。
今、思ったのですが、多次元正規分布なので、correlationを考えれば
いいような気がしてきました。多次元正規分布って、レシピにのってた
かなぁ。。。
age
厨な質問でスマソが、相関係数rの算出法を
ありったけ知りたいのですが、誰か神様、おながいします。
猿でも分かる類の本でも載っているので、自分で調べろ。
これが、最大限の親切。
それは失礼というものです。
どれがサルでもわかる本か、わからないと思う。
それと猿を漢字で書くとよめないのかもしれない。。。
俺の理解が間違っているのかもしれんが
Ynは正規分布に収束するんでないの?
E[Yn]はE[X]で、Ynの分散がどんどん小さくなるという意味で
YnはE[x]に収束するんだろうけど、Ynの分布自体は正規分布に収束するんじゃ
ないかな。
ごめんこの解釈間違ってる?
誰も答えてくれない…。
すいません。 インターネットをいろいろ検索したのですが、
わからないのでお尋ねします。
世界各国成人男女の平均身長がわかる統計データが欲しいのですが、
どこで手に入りますでしょうか?
どなたか教えて下さい。
合ってると思う
たとえば簡単なケースとして、X1,…,Xnが有限の平均μと分散σ^2をもつi.i.d.なら
ば、その分布がどのようであろうとも(もちろん変域も問わない)、n→∞のときYn
は平均μ,分散σ^2/nの正規分布に“近づく”。
ただしこの言い方だと近づく先もnに依存しており、δ関数的になっていくから、普通
は標準化して「(Yn-μ)/(σ/√n)が標準正規分布に近づく」と言う形で表現するが。
という事はが間違いだったのか。
というより232が曖昧すぎ(Xiの仮定たとえば独立性とかも書いてないしn→∞のとき
とも書いてない)。
n→∞のときYnが「何かに収束する」という形で述べるなら235のいうように大数の法
則しかない。近似としては相手側もnに依存してよいが、「漸近的に等しい」とかそう
いった形にしなければならない。正規分布に「収束する」という形で述べるにはYnで
はなく(Yn-μ)/(σ/√n)を考える必要がある。235はそのことを想定していたのだと思
われ。
2次元のデータから回帰直線を書くときに、
yの予測値とyの誤差の二乗合計を最小にする方法はわかったのですが、
直線からの距離を最小にする場合の方法がわかりません。
検索等もやってみたんですが、前者しか見つからなかったんで、
何かいいHPや、書籍(できればプログラム付き)があったら紹介お願いします。
y=a+bx+cz+u uが撹乱項
というモデルで
Σe^2=Σ[y-(a'+b'x+c'z)]^2
を最小にする推定方法が最小二乗法ですよね。(a',b',c'は推定値)
これじゃだめなのですか?
この時yのベクトルとyの予測値のベクトルとの距離は
最小になってると思うのですが。
サッカーで今期45試合フルに出て26点とる選手がいたとする。
来シーズン50試合にフル出場できると仮定して今期と同じ確率で得点
できるとする。この時、50試合で35点とれる確率はいくらか?
ただし来シーズンも同じチーム、同じリーグでプレーしたとすること。
海外に移籍することはない。
誰かヘルプ〜。
どのようなモデルを採用するかによって結果は異なると思われ。
それに26点が期待値でなく実現値の一つならばなおさら分からない。
性器分布表が手元にないのでパス。
281は垂線の和が最小という意味だろうから、違う。
>直線からの距離を最小にする場合の方法がわかりません。
その直線が統計的にどういう意味を持つかは訊いてみたい。
直線 ax+by+c=0 とデータ点の距離を計算して
最小値を探せばいいだけじゃないの?
計算量は多くなるんでしょうけど。
俺もうろ覚えなのだが、多変量解析の一つにその直線を求めるようなものがあったと思った。
だれか詳しい人教えて。
皆さんレスありがとうございます。
私が読んだ本では、x,yの両方とも誤差を含んでいると考えられる場合や、
x,yのどちらが原因、結果であるか不明である場合、
そちらの方が良いとありました。と個人的に理解しました。
その通りです。
が、自分の知ってる数学の範囲だと、ちょっと解けそうにないです。
V(aX+b)=a^2*V(X)
とあるんですが、どうしてこうなるのか教えて下さい。
途中の式変形書いてもらえるとありがたいです。
それ、計算機で力ずくではダメなの?
E( aX+b ) = aE(X) + b
だから
V( aX+b ) = Σ( aX + b - aE(X) + b)^2 /N
=Σa^2( X -E(X) )^2 /N
=a^2 Σ( X -E(X) )^2 /N
=a^2 V(X)
ありがとうございます・・
でも全然わからないのですが・・
Nって何ですか?
1行目は期待値の演算は線形性をもっているということは書いてあった
のでいいとして、その次の
V( aX+b ) = Σ( aX + b - aE(X) + b)^2 /N
はいったい・・
分散の定義は
V(X)=??(x-E(X))^2*P(X=x)
しか知らないのですがほかに何かあるんですか??
あーなんか納得できました
292さんありがとうございます
えーと、なんか標本を分析してる状況が頭にあったので P = 1/N のつもり・・
自分のPCで計算させようと思ってます。
y方向の誤差最小の場合はわりと簡潔に書け、速度も軽かったので、
こちらも最終的なパラメータ算出の式や方法が分かれば、
自作ソフトの一部に組み込む方向で何とかしたいと思ってます。
素人でスマソ
偏差値のことですが、あるグループで55.5
別のグループで67.0だとしたら、この間には
差があるのかないのかっていうのはこの値から
判断できるのですか。
ためしに試行関数を cos[t]X+sin[t]Y+c = 0 と置いて各点からの
距離の二乗和を最小にするt,cを探そうと思ったら
c = -Ex cos[t] -Ey Sin[t]
(-Ex^2 + Vx)cos^2[t] + (-Ey^2 +Vy)sin^2[t] -(ExEy-Vxy)sin[2t] = 0
Ex,Ey :x,yの平均
Vx,Vy :x,yの二乗の平均
Vxy :xyの平均
のような条件になりますた・・・
> 分散の定義はV(X)=??(x-E(X))^2*P(X=x)
> しか知らないのですがほかに何かあるん
> ですか??
その定義じゃ離散型のXにしかあてはまり
ません.
V(X)=E((X-E(X))^2)
を定義にしときましょう.
# じゃあ,E(X)の定義は?とかいう?
299のもんだけど,ヒント.
299の分散の定義と,期待値の線形性を使えば,
V(X+a)=V(X)とかV(aX)=a^2V(X)とかはすぐでてくる.
あとは自分で考えること.
統計の質問
わからないので誰か教えてください。
ある新商品の検査で従来品との比較をしたときに、
両者の間に有意に差があるかどうかを知りたいのです。
検査は(新商品・従来品)を1セットとして行われますが、
複数の検査場でやられており、検査場間のばらつきが非常に大きくなっております。
たとえば、A検査場とB検査場で1セットずつ検査されており、
両検査場とも新商品のほうが優れていたのですが、A検査場の新商品の
成績とB検査場の新商品の成績がまったく違うような場合です。
セット間のばらつきを考えず、新商品と従来品の性能の有意差を出すためには
どうしたらいいでしょうか?
次の証明は正しい?正しくない?
非負整数を要素とするn×n行列が任意の0要素に対して、その0を
含む行和と列和を加えるとn以上であるという性質を満たしている。
このときこの行列のすべての要素の和はn^2/2以上であることを示せ
n=1の時、命題は成り立つ。
n=k-1の時、命題が成り立つと仮定し、k次の行列について考えるとこの行列が
0要素を含まない時、命題は明らかに成り立つ。i行j列の要素が0の時、この行列
のi行とj列の和は仮定よりk以上であり、この行列からi行j列を除去して得
られる(k-1)次の部分行列の要素の和は帰納法の仮定から(k-1)^2/2以上である
よって題意の条件を満たすk次の行列の要素の和は
(k-1)^2/2+k=(k^2+1)/2>k^2/2
よって命題は成り立つ。
スレ違いに見えるが、マジレスしよう。
命題自体は正しそうな感じだが、「証明」は間違っていると思われ。
理由:命題の条件をみたすk次の行列からi行j列を除去して得られた(k-1)次の部分行列が、
(k-1)次行列として命題の条件を満たしているとは限らないため、この部分行列に
対してn=k-1の場合の命題を適用できるかどうかわからないから。
たとえば、
( 0 1 1 )
( 1 0 0 )
( 0 1 1 )という3次行列は命題の条件を満たしているが、どの0成分に注目して2次
行列を作っても、その2次行列は命題の条件をみたしていない(結論はみたしている
が)。結論が成り立ってしまうのでわかりにくいなら、次のように言ってもよい。
303の「証明」は、命題の結論を「(n^2+1)/2以上」に変えてもそのまま通用する。
しかしその命題は成り立たない。たとえば4次行列
( 1 0 0 1 )
( 0 1 1 0 )
( 1 0 0 1 )
これ実際の会社での話?そんな性能にバラつきのある商品って売っていいの?
売り方しだいやろ。でなきゃADSLなんか提供できないよ
いわゆる「対応がある場合」の「平均値の差の検定」でいいんじゃないの? 統計の教
科書に載ってる。
つまり、新製品・旧製品ともに成績は正規分布に従うとして、検査場(i)ごとに新製品
の成績Xiと旧製品の成績Yiの差Di=Xi-Yiについて、標本平均と標本分散を計算して、
t分布を用いて検定するというやつ。ここで新製品の成績の分散(σ_x)^2と旧製品の成
績の分散(σ_y)^2が異なっていても大丈夫だが、「検査場ごとのばらつき」というのは
母分散(σ_x)^2や(σ_y)^2による標本のばらつきなのだから、単にσ_xやσ_yが大きいの
だと考えればいい。
遅レススマソ。埋もれてて見落としてた。
異なるグループにおける偏差値の比較は無意味。
偏差値は、あるグループ(正規分布と仮定)における標本(学生)の相対位置を標
準化して表しただけのもの。ある学生が、あるグループでは(平均50分散100に直し
たとき)55.5にあたる位置の成績を取り、別のグループでは(同じく平均50分散100
に直したとき)67.0にあたる位置の成績をとったと。( ´_ゝ`) フーン それで?
それ以上何が言える?
もし全く同じ試験の同じ成績を2つのグループで眺めた場合の話であれば、第一の
グループの学生たちの成績の方が第二のグループの学生たちの成績より全体によい、
くらいのことはいえるだろうが。
ありがとうございます。
この式なら私でもなんとか解けそうです。
それで各パラメータを求めることにします。
なろほど。
差をとってやるんですね〜。
やってみたら有意差でました。
遅くなったけどどうもありがとう!
コメントどうもです。
実際に売る予定の製品です。
地域や季節、使い方で大きく差の出る
機械で、いろんな条件でも有効だっていう
のをtestしてたのです。
フリーの統計ソフトG* Powerの起動の仕方を教えてください。
データ数とp値を入力すると、検定力を求めてくれるソフトです。
インストールして、スタートのメニューから起動するのですが、
真っ黒なコマンドウィンドウが出るだけで、先に進みません。
(オフィシャルにあるスクリーンショットと全然違う)
ちなみに、当方、ウィンドウズマシンです。
かなりいろいろと検索したのですが、「ソフトの起動の仕方」
なんてことは当たり前すぎるのか、どこにも載ってません。
あほらしい質問かもしれませんが、どなたかお願いします。
統計学とモデル理論の関わりについて研究はされてる?
当方,統計専攻の学生ですが,もともと基礎論に興味がありました。
でも,幾何学的モデル理論とかモデル理論がさまざまな分野に応用されているらしいので,
ひょっとしたら研究されてる方とかいらっしゃるんじゃないかと思って。
具体的な研究は知らないけど、モデル論は証明論と相補的な領域だから、
統計学からの接近なら逆に記述そのものに注目したところにあるんじゃない?
MDL や Kolmogorov complexity あたりから手繰ってみては。
極限同定に由来する学習理論のうちプログラムの学習はある意味そのものかも。
ありがとうございます。参考にさせていたたきます。
統計学に詳しそうなので質問させてください。
ANOVAについては分かるのですが,
Duncan's testという手法が手持ちの統計学の本では載っていません。
日本語でダンカンの検定ということと,
第一危険率があまり抑えられないということまではなんとなく調べられましたが,
どのような意図でこの手法を用いるのかなど,
お教えいただけないでしょうか?
難しそうだね。
ANOVAもDuncan's tesstも聞いたこともないや。
中心極限定理について教えてください。
例えば、身長のデータを30人分集めて、その平均を取るとします。
で、その試行を1000回繰り返します。
その場合の平均値のバラツキが正規分布になる、ということですか?
その時、平均、標準偏差、標本平均、標本標準偏差って、
どう当てはまるんですか?
1000個の平均値の平均が標本平均?
じゃあ、標本標準偏差を求めるときも、
1000個の値と標本平均を用いて求めるんですか?
中心極限定理の、σ/n^1/2 (n=データ数)
っていうのはどうなるんでしょう。
統計でわからない問題があるんですが、わかる方いたら教えてください。
・日本人の血液型の比率は、A:B:O:AB=40:20:30:10である。ある職業についている400にんについて
血液型を調べたところ、A型170人、B型70人、0型110人、AB型50人であった。
この職業についている人の血液型の比率は日本人の血液型の構成比率と同じであると
言えるかどうかを有意水準5%で検討することにした。検定統計量の値と検定結果の判断は?
やってみてもわかりません、どうなるんでしょうか?
そう、その理解でOKだと思う。
「適合度検定 カイ二乗分布」あたりでググるべし。
アンケート集計の解釈の仕方について聞きたいのですが、ここでいいのでしょうか?
◆わからない問題はここに書いてね◆スレでどのスレがいいか聞いたのですが
答えをいただけませんでした。
アサピー放送かな?
なんことでしょうか?あるスレ内でアンケートを取ったのですがその解釈の妥当性を
知りたいと思いまして。おすすめの板、スレはありますか?
アンケートの取り方や、何をどう解釈する(した)という話なのか判らないと、
レスはおろかオススメの判断すらできないよ。
>その時、平均、標準偏差、標本平均、標本標準偏差って、
>どう当てはまるんですか?
「どう当てはまる」という質問の意味がよくわかりませんが…。
母平均をμ,母標準偏差をσとすると、標本平均Xはnが大きいとき平均μ,標準偏
差σ/√nの正規分布に近づく。したがって(X-μ)/(σ/√n)は標準正規分布する。
これが中心極限定理ですよね。それだけ。
標本標準偏差Sについては特に何もいえない。ただ、S^2の平均はσ^2に一致する
(偏差平方和をn-1で割ってS^2を定義した場合)。
ちなみに、母集団が正規分布ならば、(n-1)S^2/σ^2は自由度n-1のカイ二乗分布
に従うし、(X-μ)/(S/√n)は自由度n-1のt分布に従う。これらの事実は中心極限
定理とは直接関係ないが。
母平均、母標準偏差は定数(既知か未知かはともかく)ですが、標本平均、
標本分散は確率変数です。そのことはわかってますか?
標本は母集団分布に従う確率変数で、標本平均・標本分散はn個の標本−−
独立同分布の確率変数−−から作った新しい確率変数。確率変数だから、分
布をもつ。どんな分布になるかは難しいが、標本平均については(驚くべき
ことに)中心極限定理によって、nが大きければ「正規分布」といえる。そ
の分布パラメータ(平均・標準偏差)が母集団分布のパラメータ(母平均・
母標準偏差)と一定の関係をもつのは当然。
実際の標本調査結果は、それらの確率変数(標本・標本平均・標本分散)
のひとつの実現値例。だから1000回調査して1000個の標本平均を得れば、
確率変数である標本平均の分布を1000個のデータの分布として見ることが
できる。1000回の試行結果例、というわけやね。
では、韓国の大統領選挙があったので、選挙の問題。
ある人口20万の市で市長選挙があり、投票率は50%だった。
開票率30%時点で一方の候補者の当選が確実になった。
確実になるということは99%以上の確率で当選ということと仮定して、その候補者の得票数
を求めなさい。
×人口20万
〇有権者数20万
20万人全員が立候補した場合も考えるのかよ?
ごめん、立候補者は2人。
正規分布
そうですね。では具体的に書きます。
下記のスレにおいてバナー掲示期間について投票をしていました。その投票結果の
解釈の妥当性をお聞きします。アンケート集計等にお詳しい方よろしくお願いします。
バナーA:ぎこ3発、バナーB:がんがれよ
"サカヲタ殿下"高円宮憲仁親王バナーを
#312
312 02/12/05 01:39
この時点での板のバナーはバナーBでした。そして、「何時までこのバナーを
あげるのか」 という形で投票が始まりました。その選択肢は、「1、今すぐ、
できるだけ早く 2、高円宮杯決勝終了の12/23 3、天皇杯決勝の01/01」の
3つでした。
より具体的にいえば、1とは(投票終了時点で)バナーBからバナーAへ変更を、
2とは高円宮杯決勝終了の12/23までバナーBで、3とは天皇杯決勝の01/01まで
バナーBでとなるかと思います。ただし、投票終了日時は未定のままでした。
続き
#576,584
しかし、576、586で投票はいつからいつまでの期間に対して行われたものであり、
暦の性質上、案3(12/10-01/01)賛成者は案2(12/10-12/23)期間にも賛成して
いたため、案1ではなく案2が本来の結論だとの指摘がありました。
指摘をまとめると、下記のようになります。
賛成反対と期間で整理
「12/10以降いつまで掲示するか」が質問。便宜上12/10を分岐日とした。
1、今すぐ、できるだけ早く………19票 (1)12/09まで
2、高円宮杯決勝終了の12/23…16票 (2)12/10-12/23
3、天皇杯決勝の01/01…………14票 (2)12/10-12/23 (3)12/24-01/01
…………………賛成……反対…
(1)12/09まで ……19…<…30…49
(2)12/10-12/23…30…>…19…49
X,Yはそれぞれ指数分布Ex(α),Ex(β)に従う互いに独立な
確率変数であるとする。以下の問いに答えよ。
(1)確率変数U=max{X,Y}の分布を求めよ。
(2)確率変数Z=X+Yの分布を求めよ。
教えて下さい。
(1)max(X,Y)の分布関数は、それぞれの指数分布の分布関数を乗すれば出るので、
それを微分する。
(2)たたみこみ
>分布関数を乗すれば
どういうことですか?
>(2)たたみこみ
これもどういう意味かわからないんですが
どうか教えて下さい。
(1)U=max(X,Y)とすると Pro(U=<u)=Pro(X=<u)Pro(Y=<u)
これを求めてuで微分
(2)Pro(Z=<z)=Pro(X+Y=<z)=Pro(Y=<z-X)
=∫[0 to z]∫[0 to z-x]f(y)dy f(x)dx
[a to b] は積分区間。
これを求めてzで微分。
どうしてわかるんですか?勉強しだいですぐにわかるようになるんですかね?
俺の言ってる意味がわからないようでは、無理。
分布関数を微分すると密度関数になるから。
指数分布の分布関数はすぐ出るでしょ。
ちなみに俺は339じゃないよ。
統計ぜんぜんわからないから教えてくください。
エクセルのt-検定 : 一対の標本による平均の検定ツール
の結果が次のようにでました。
これは有意差があるということを示していると考えてよいと思うんですが、
果たして、どちらが優れているのかって、どう判断したらよいのでしょうか?
ここでは、優れているとは0に近いということで、
ぱっと見では変数2のほうが優れていると思うんですが、
根拠をなんと言えばよいのかわかりません。
変数 1変数 2
平均0.1698800830.066920906
分散0.0082463310.002001865
観測数9696
ピアソン相関0.743882574
仮説平均との差異0
自由度95
あ、スペースが消えてしまった。ごめんなさい。
変数 1 変数 2
平均 0.169880083 0.066920906
分散 0.008246331 0.002001865
観測数 96 96
ピアソン相関 0.743882574
仮説平均との差異 0
自由度 95
t 15.55968082
P(T<=t) 片側 3.58222E-28
t 境界値 片側 1.661051101
P(T<=t) 両側 7.16445E-28
t 境界値 両側 1.985249583
見づらい。
整数にしてから計算しろ。
t検定とか、F検定とか
サンプル数が多ければ多いほどいいの?
めちゃめちゃ多いデータを入れると、こちらが予期していた結果が出ない。
なるべく、データを少なくしたいんだけど、、、邪道なのかな?
そもそも予期していた結果だけを得るものじゃないだろ。
都合のいい結果だけが欲しいなら検定なんかするなよ。
複数の集団があり、
0に近いほどよい集団だとする。
いくつかの集団は正の数だけ、いくつかは負の数だけというものがある。
このとき、集団の絶対値をとって、比較するのって意味がありますか?
また、ゼロに近いというのはどう判断したらよいでしょうか?
たとえば{1,3,4,2,4}と{1,4,4,1,4}
はどちらが0に近いといえばよいのでしょうか。
「0に近いほど良い」とする根拠は統計学の中にはないのだから、
どのような比較が妥当かは、その問題を扱う分野の常識や君の主張によって
正当化されなければならない。
レスありがとうございます。
なるほど。。。
重み付けはその分野によるということですか。
なるべく0に近いほどよいということで
単純に2乗するのってのはだめでしょうか?
根拠はないんですが、、、、
ところで、
分散は何で2乗してあるんですか?
平均からのばらつきの距離二乗の和ですよね。
似たような感じだと思うんですが、、、
0からの離れ具合を同じように示すことはできないもんでしょうか。
うーん。分散は平均からの差の平方を要素数で割って
平均からのばらつきを出してるから、
もしかしたら、0で引いたと考えて分散みたいにだせば、
0からのばらつきといえるのかもしれないね。
違うかもしれないけど、、、識者の方お願い。
例えば工場とかで製品を作っているときだったら、部品の寸法が1.00mmという
規格だった場合、そこから大きく外れたものばっかり作る生産ラインはよくない
ということになりますよね。そういう感じのことでいいのかな?
統計的には、標準偏差がどこまでか(どこまでばらつくことが許容されるか)で、
判断すればよいと思います。
分散とか標準偏差の定義式は自分で調べていただきたい。
ということはなるべくよい生産ラインを調べたいときは
標準偏差が小さいものを選べばよいという理解でよいですか?
今回考えている状況は、
部品の規定寸法はすべて違うのですが、
実際に作った部品との寸法の差がなるべく
小さいものを選びたいというものです。
背景によると思うよ。良いというのは評価だから、
評価することによって何か行動決定に使えないとあまり意味がない。
まあどっちにしても平均と標準偏差でデータを要約するのは基本技術だし
平均だけ見ても役に立たないことは多い。むしろ平均と標準偏差の関数で
決まるコストを想定して品質管理がされることが多いのでは。
例えば、バラツキが比較的小さいけど平均が0からちょっと外れたものと、
平均がピシャリ0だけどバラツキが比較的大きなラインはどっちが
良いかは、一概にはいえない。
コストをちょっとかければバラツキを抑えることができるとか、
バラツキを変えないまま平均を変更できるといった選択可能な行動と
そのコストが分からないと評価基準として使いにくいと思う。
ごめんなさい。
たぶん生産ラインの話をしてしまったから誤解を招いたかもしれません。
本当は、ある値を推定する推定式がいくつかあって、
その式からみちびいた値がどれだけ実測値に近いかを知りたかったのです。
なるべく実測値に近い値を出せる式がどれかを選び出したかった。
ということです。
そこで、統計学でそれが可能ではないかと思って調べていたんです。
そして、今現在調べているところなんですが、
どうやらこういうのには相関というものが関係してるようですね。
見当違いをしていました。
そこで、何度もお聞きして申し訳ありませんが、
相関が1に近ければ近いほど推定値を出す式の精度が高い
希望する地域と、どの程度の学力なのかを教えてください。
意味のない差を検出してしまうことがあります。
どのようなデータの取り方をしているのか、もうちょっと
説明してもらえますか?
場合によっては乱塊法も使えるかと思うのですが・・・・
もし規格があるなら工程能力指数を計算するのが良いと思われ。
さて214や320が言ってる
「○○は同じといえる」や「○○と○○は変わっていない」
を検定しようと、母平均の差の検定や適合度検定をやって、H0が棄却されないのを望む
というやり方は「有意水準」という観点からもどうかと思う。
基本的に検定推定では「有意差アリ」の検出は出来ても、「有意差ナシ」の検出は
できないと思うのですが・・・・
相関係数も一つの見方に過ぎない。それで満足ならいいけどね。
明らかに比例関係にない場合や、極端に離れているデータがある
場合は相関係数は有効でないことが多い。
356に話を戻すと、推定式の中にはおそらく定数が入ってる
だろうから、その定数をパラメータとみて変更することで
平均や分散がどう変わるかが問題なのでは。
ただし推定式のなかに十分良いものがあると信じれる場合は
その方法でもいいけど、そうでないかも知れない場合は、
推定式の次数あたりから疑ってみる必要もある。実際、
物理では現象を説明する式が予め分かるわけないから、
AICのような方法を使う場面もある。
おっとすみません。
357のカキコを見ずに適当なこと言ってしまいました。
ちょっとお聞きしますが、推定式とは回帰式のようなものですか?
それ以外の何かのモデルで導き出された予測値と実測値があって、
その相関係数で評価しようというのですか?
みなさん、ご意見ありがとうございます。
回帰式ではないです。
もともとサンプルがない状態で、
周辺情報から適当と思われる式を導き出し(でっち上げ)たものです。
相関の強さを見るために、クラメール係数の値がいくつ以上なら相関が強いといえるというような基準はあるんでしょうか。。。?
>基本的に検定推定では「有意差アリ」の検出は
>出来ても、「有意差ナシ」の検出はできないと
>思うのですが・・・・
言いたいことはわかるが、言葉遣いが不適切。
(有意差のアリ/ナシを決定するのが検定。)
帰無仮説が棄却されなかったとしても、それは、
「帰無仮説が正しくないとは言い切れない。」
という程度の意味であって、帰無仮説の正しい
ことが積極的に証明されたわけではない。
といわないと。まあ、検出力(第二種の誤りを
おかさない確率)を上げたい時はサンプルの数
を増やせばいいんだけどね。
>言いたいことはわかるが、言葉遣いが不適切。
>(有意差のアリ/ナシを決定するのが検定。)
>帰無仮説が棄却されなかったとしても、それは、
>「帰無仮説が正しくないとは言い切れない。」
>という程度の意味であって、帰無仮説の正しい
ことが積極的に証明されたわけではない。
この文章明らかに矛盾してます。
前半部分は「検定とは有意差アリ・ナシを決定するものだ」と言っているのに
後半部分は「検定とは有意差アリ・ナシを決定するものではない」と言っている。
まぁ文章を読む限り分かってそうだが、
検定ではアホみたいにサンプル数を増やせばいいというものではない。
使う分野にもよるだろうが、ヒストグラムが書ける程データをとった場合、
検定をすることに意味はありません。
>後半部分は「検定とは有意差アリ・ナシを決定する
>ものではない」と言っている。
言っていないよ。後半部分に「有意差」なんて単語は
出て来ていないでしょう?もしかして「有意差」とい
う用語を、あなたと私とで別々の意味で使っているの
かな?
保険のアク板より
今年のアクチュアリー試験の数学。
なんかこの問題だけ解答がでないよー。
問題そのまま写すよ。
>>ある植物の種の重さを、10gきざみの度数分布表(例、0g超10g以下、10g超20g以下…)に整理して平均を求める。
平均の誤差が 0.2g 以下となる確率が、0.95以上となるためには、種の数を[ ]個
抽出すればよい。ただし、種の数は十分大きいとし、中心極限定理を用いて求めよ。
母集団の分散が未知なのに…。統計板の人ならどう思いますか?
1個の誤差は平均0分散2,5の一様分布に従うので、それに中心極限定理をあてはめる。
つまり、x個平均すれば誤差の分散は2,5/√x
ってなるからそれに正規分布をあてはめればいいんじゃないの。
分散は2,5^2=6,25だね。
俺もこの問題0点だな。参った。
XとYの相関係数について
分子がXとYの共分散で、
分母が√(V(X))√(V(Y)) (V:分散)
なのですが、分母が覚えづらくって困っています。
「ある2数のルートの積を取る」行為に名前はあるのでしょうか
無ければどなたかネーミングしていただきたいのですが。
(現在は2分散の根号積と覚えています。金剛石みたい)
分散の平方根を標準偏差というわけだが
ない。比較して初めて意味を持つ。
「根号積」はへんだよ。
「根号」は記号の一種だから。
それから「根」だって、「平方根」と
しないと何の根なのかわからない。
略さないでそのまま「2分散の平方根の積」で
いいのでは?
遅レススマソ。こういうことですか?
でも分散値は25/3になるんですけど?
X_i(i=1,2,…)は(μ-5,μ+5]上の一様分布に従うとする。(μ=5,10,15…)(X_1,X_2,…はi.i.d.)
するとE(X)=μ,V(X)=10^2/12=25/3
Y_n=(X_1+…+X_n)/nとおくとき,
√3n(Y_n-μ)/5 は n→∞のとき,N(0,1)に従う。
よってP(|Y_n-μ|≦0.2)≧0.95
とすると,0.2・ √3n /5 ≧ u(0.025)=1.96
∴n≧800.333…
ゆえに801個
確かに計算してみると分散は25/3になるね。悪い悪い。
(∫[5 to -5]x^2・1/10dx=25/3)
だから標準偏差は5/√3でx個集めて平均すると5/√(3x)となるので
0,2,96・5/√(3x)となりx,3となって君が正しいね。
いや、ヒントありがとうございます。
アク試験僕はさんざんでした。
むこうの板の人の評価では「数学」易化されているらしいっす。
もう1年確率統計みっちりやります。(今年は精密法2問…。なんも知らなかった…。)
ニュアンスの問題なんですかね?
基本的に私とあなたの考えていることは一緒だと思います。
初心者相手に”母平均の差に関する検定”等の説明をする時、
「有意差ナシ」と言うと、
「有意差ナシ」=「2つの母集団は完全に同じものだ」と誤解されることがあるので、
基本的に私は「有意差ナシ」という言葉は使わないのです。
「母平均の差に関する検定」でいうなら、私は
「有意差アリ/ナシ」という言葉を、以下の様
に理解しています。(簡単の為、母集団は両方
とも、分散1(既知)、平均未知の正規分布とし、
帰無仮説を「2つの母集団の平均は等しい」で
あるとします。)
・標本平均の差の絶対値が、ある数a(これは有
意水準から定める)以上になったとき、「有意
差アリ」という。
・標本平均の差の絶対値が、上記のa未満になっ
たとき、「有意差ナシ」という。
で、となったわけです。有意差という言葉
を上記以外の意味で使うなら、話はかわってくる
んでしょうね。
つまりあなたが意味するところは、
解析の結果としての「有意差ナシ」という意味なんですね。
分かりました。
ちなみに私の専門分野は品質管理なんですが、
あなたの専門は何ですか?
参考までに知りたいです。
いま、統計学勉強してる工学部の学生ですが、
特性関数やら積率母関数やら意味不明です。
とりあえず、特性関数ですが、
なんの為に必要なんでしょうか?
中心極限定理を厳密に証明するときに使う>特性関数
もし、確率論を全く勉強してないなら平行して勉強することを勧める。
統計学だけやっても意味が分からんだろうし、単なる how to になっちまう。
でも統計学は how to として使えるほど単純じゃないからね。
経済学部学生です。初歩的な質問で恐縮ですが、仮説検定の趣旨について教えてください。
「帰無仮説」とは相関性の不在を仮定する説、「理論値と観測値の間の乖離は有意ではない」
即ち「理論が正しい」と仮定する説、という事なのですか?
そして理論と観測値の間の乖離の程度を示す χ2の値が大きく、棄却域に入れば、帰無仮説は
棄却される=理論値と観測値の間の乖離は有意である=理論の妥当性は疑わしい、と判定できる
という筋道なのでしょうか。
棄却域に入らなければ乖離は有意でなく、理論はほぼ正しいと言える、という事ですか?
も二つ、臨界値って一言で言うと何?臨界値より大きいとどうなる?
小さいとどうなる?
確率値ってのは「そのような理論と観測の乖離が発生し得る確率」って事ですか?
で、その確率値が小さければ、「それ程極端な乖離が発生する可能性は極めて低い、
異常事態だ」=「その理論ちょっと違うんじゃない?怪しいよ」ってな筋道になるん
でしょうか?
>棄却域に入らなければ乖離は有意でなく、理論は
>ほぼ正しいと言える、という事ですか?
「棄却域に入らなければ乖離は有意でなく、理論が
間違っているとは言い切れない。」が正しい。
その他の部分はマル。
384だが、すまん。「その他の部分はマル」と言ったが以下の部分は意味がよくわからん。
>「帰無仮説」とは相関性の不在を仮定する説、「理論値と
>観測値の間の乖離は有意ではない」即ち「理論が正しい」
>と仮定する説、という事なのですか?
統計的検定における「帰無仮説」とは、母集団に関する仮説で、検定によって棄却する/しないの判断にさらされるもの(検定によって無に帰するかもしれない仮説)、をさす。
統計的検定における「理論値」とは、帰無仮説が正しいと仮定した上で確率論的(理論的)に導かれる値である。従って、「理論が正しいと仮定する説」という部分は意味がとれない(統計的検定では、確率論(ランダムネスに関する理論)が正しいかどうかは問題にしていない。)
は、「臨界値」や「確率値」といった言葉をどういう意味で使っているのかが分らないのでコメントできない。
理論値は例えば5である。実験を行った。観測値を見たら5,1だった。
この0,1の差は偶然生じたものなのか、それとも理論に何か欠陥があるせいなのか。
帰無仮説とは取りあえず「その差は偶然生じたものでしょ、0,1くらいの差は起こり得るって。」と仮定する説・・・と
考えていたのですが・・。
「相関性の不在」とは理論値と観測値と間に何か関連がある、つまり何か理由があって理論値と観測値は乖離している、
という意味で書いたのですが。ああ、何か分かんなくなって来た。
要するに帰無仮説という言葉の定義が判らないんだよお。(末期的)
も一つ、確率密度関数というのは頻度をヒストグラムで表した場合の縦軸に相当する
ものですか?で、それを積分したものがグラフの面積=確率に相当するのですか?
全然違ったら恥ずかしいので教官と対面して質問することが出来ません。
匿名の世界を有効活用しよう。
>帰無仮説とは取りあえず「その差は偶然生じたものでしょ、
,1くらいの差は起こり得るって。」と仮定する説・・・と
>考えていたのですが・・。
例をあげてみる。
あるコインがあるとする。コインに関する仮説、
H_0:そのコインを投げたとき、表のでる確率と裏の出る
確率はどちらも0.5(50%)である。
を考える。これを検定しよう。検定において棄却する/しないの判断にさらされる仮説を帰無仮説という。いまはH_0を帰無仮説として検定を行う。
コインを100回投げ(これは大きさ100の標本を抽出することに相当する)、表の出た比率aを計算する。このaが「観測値」とか「実測値」などとよばれるもの。
H_0を「正しい」と仮定したときの表の出る比率の期待値は確率論的(理論的)に厳密に計算でき、0.5である。この値0.5が今の場合の理論値。
訂正。相関性の不在とは(略)関連がある「わけではない」、(略)乖離している
「わけではない」という意味で書いたのですが。
そう!多分その有意水準とやらだ!(いい加減・・)
>匿名の世界を有効活用しよう。
そんなことをするより、今すぐ本屋へ行って、確率統計の入門書を買え。それからでないと、質問すらもまともにできないぞ。
多分この説明じゃわからないと思うけど・・・
帰無仮説ってのはようはその仮説があってるかどうかを確かめたい
仮説って事です。でどうやって確かめるのかというと
その仮説のもとでその統計量がどういう分布をするかを
考えるという方法で確かめます。
この統計量はこの帰無仮説のもとでこの分布に従うというような
事を言うわけですが、だからもしその仮説が正しいのならだいたい
その分布の平均値が出るはずですよね。もしその分布の元で
5%以下の確率でしかないような値が出たのであれば
その分布に従っているとは考えにくい、つまりその仮説が
あっているとは考えにくい → その帰無仮説を棄却
となるわけです。
例えば最尤推定量なら標本数が大きくなっていくと推定値は
漸近的に真の値を中心とした正規分布に従っていくわけです。
この時平均はわからないけど分散は推定できるので
その推定した分散が1だとしたら真の値を中心として
分散1の正規分布に従っているわけです。
でもし仮にここで帰無仮説として真の値は0という
仮説を検定したいとしましょう。その時に
推定値が7だとしたら、平均0分散1の正規分布が
7という値をとる確率はほとんど0です。
そんな値が出ると言うことは平均が0であるという
仮説が正しいとは考えにくい → 帰無仮説の棄却となるわけです。
逆に真の値が7という帰無仮説を考えると
平均7分散1の正規分布が5〜9という値をとる確率は
だいたい95%くらいあるので7という推定値は
おかしくない → 帰無仮説を棄却しない
となるわけです。
参考になりました。どうも有難うございます。
そうですね、やはり一定程度自学してからでないと質問は出来ませんね。
私の手元に在る参考書では離散型確率を以下のように説明しています。
「とり得る値がa1、a2・・・のように列挙できる確率変数」
列挙できるとはこれ如何に?
例えば複数のサイコロを投げた時の目の出方は離散型ですか?
>列挙できるとはこれ如何に?
この場合の「列挙できる」とは、厳密には、
とり得る値が有限個か、または、とり得る値全体の集合と自然数全体の集合との間に一対一の対応がある。
という意味です。数学ではこの事を「とり得る値全体の集合が高々可算集合である」といいます。
>例えば複数のサイコロを投げた時の目の出方は離散型ですか?
1,2,3,4,5,6 と列挙できる。よって離散型。
>「とり得る値全体の集合と自然数全体の集合との間に一対一の対応がある」
とはどういう事でしょうか?
例えば、「コインを投げて表が出れば1を裏が出れば0を与える」という試行があるとして、
生起する事象は表か裏かどちらかしかなく、表なら1、裏なら0に対応している、
という意味でしょうか?
>例えば、「コインを投げて表が出れば1を裏が出れば0
>を与える」という試行があるとして、生起する事象は表
>か裏かどちらかしかなく、表なら1、裏なら0に対応し
>ている、という意味でしょうか?
確率変数Xを次のように決めます。
コインを投げて表が出ればX=1、裏が出ればX=0。
Xの取り得る値全体の集合は{0,1}。これは有限集合なので、
確率変数Xは離散型(Xは離散型の確率変数)です。
連続型分布の例にはどんなものがあるのでしょうか?
身長、体重などですか?
「連続型分布において、定義区間にわたって確率分布を積分したものは1にならなくてはならない」とありますが、
これは要するに「定義区間の中のどれかの値は必ずとる」という事と同値なのでしょうか?
連続型では「特定の値をとる確率は0に等しく、一定の区間に対してしか確率を付与することは出来ない」
でしたっけ?これは「確率変数xが特定の値aをとる確率は0に等しいが、xが区間aからbの間に存在する確率は0以上」
という事でしょうか?これが離散型と異なる点ですか?
例えば、生徒の身長の分布において、165,22244556cmだとか175,9845736cmとかの特定の数値が
得られる確率は0であり、知ることが出来るのは165cmから175cmの間の値をとる確率ぐらいだ、
ということですか?
その理解でいいだろう。
(まあ、つっこみどころがない訳ではないが。)
どういうつっこみどころが?
無作為に選ばれたX人の誕生日で1年分のカレンダーを埋めることができる可能性が10%を超えるような最小のXていくら何でしょうか…
選ばれた人の誕生日には偏りがなくどの日に生まれるかは同様に確からしいとして
混乱してきた…逝ってきます
ところで今度は確率密度関数の話ですが、確率密度関数の高さをf(x)、xの周りの幅の区間をΔxと表すと、
母集団における平均μは
「μ=インテグラルxf(x)Δx」と表せると。
で、f(x)Δxは相対頻度(=生起回数/試行総数)に対応し、
f(x)は確率密度関数の高さを、Δxはxの周りにある区間の幅を表すと言うのですが、
柱状図に当てはめて考えてみると、f(x)は柱の縦幅の長さを、Δxは横幅の長さを表し、
縦掛ける横でその柱の面積が求まり、これが相対頻度即ち確率変数Xが或る値xの周りにあるΔxの幅の区間
に入る確率となる、ということでしょうか。
ほんで、平均(期待値)は、xにxが生起する確率f(x)Δxを掛けて各場合を合計する事で求まると。
離散型の場合のΣで各場合を合計する処理が、離散型の場合の積分に相当するという事ですか?
20人くらいじゃないの?
・・・・て煽りは置いといて、(考えなくても影響はないと思うが)2/29生まれに注意しないといけない。
さらにややこしい事に1900年は閏年じゃないな。
(1900は100の倍数でかつ400では割り切れないので。2000はたまたま400で割れたから閏年)
これらの要素が大勢に影響を与えないとしたら話は簡単で、
E(1)=1
E(2)=E(1)*(364/365)
E(3)=E(2)*(363/365)
・・・・
E(n)=E(n-1)*((366-n)/365)
と進めて、E(X+1)=<0.1<E(X)が成立する自然数Xを求めればよい。
りんご みかん メロン ・・・
x1 54 10 20
x2 15 33 5
x3 13 41
例えば上のようなテーブルがあったとして、空欄に予想評価を与えるには
最小二乗誤差法という手法を使うと聞いたのですが、
Webで計算式調べてもさっぱりです…上の例で言うとどのような計算に
なるでしょうか?
age
確率変数って何か実際に分かってる人って少ないね。
大間違い。
(^^)
x 人集めてきて、1年(365日)のうちちょうど i 日がカバーされる確率 Qi(x) を考える。
Qi(1)=C(365,i)*(i/365)**1、
Qi(2)=C(365,i)*(i/365)**2 - Qi(1)、
Qi(3)=C(365,i)*(i/365)**3 - Qi(1) - Qi(2)、
...
もちろん i>x のときは Qi(x)=0 とする。
Q1(x)からQ364(x)を全て加えたものが 0.9 を下回る最小の x が求める値。
と思う。でも、これでは手計算できない。
教科書にある以下の記述について御教示下さい。
?@「確率密度関数とは相対頻度分布の極限、換言すれば母集団の相対頻度分布である」
・・・データを増やしていけば極限的漸近的に確率分布は正規分布に近づいて行き、
確率密度関数とはこの正規分布に近似される分布を表す式である、という事でしょうか。
またこの記述は離散型ではなく連続型分布を想定しているものでしょうか。
?A「確率密度関数の高さは確率を表すものではない。飽くまで確率の密度を表すものに過ぎない。」
・・・「確率の密度」とは?
?B「母集団の分布が離散型分布である場合、母集団の相対頻度分布を特に確率関数という。」
・・・?@と併せて考えて、母集団の相対頻度分布を以下のように捉えたのですが、間違いありませんか。
連続型の場合:データを無限に増やしていった時に漸近していく相対頻度分布の極限。正規分布で近似される。
確率密度関数と呼ぶ。
離散型の場合:とり得る値は可算個なので、データを増やす程、正規分布で近似される滑らかな曲線
に漸近していくという事はない。確率関数と呼ぶ。
?C中心極限定理が以下のように説明されています。
「確率変数Xiの和?狽wiの分布、及び平均?狽wi/Nの分布は正規分布に近づく」
・・・「(データを増やすほど)正規分布に近づく」という事ですか。
?D一致性とは標本数を増やして行くほど推定値が真の値=母数に漸近して行く
という事ですよね。これは要するに大数の法則と同値ですか?
一致性は当然満たされれるべき性質だと思われるのですが、殊更に提示するのは、
一致性を満たさない推定量も存在しているからなのですか。
?E不偏性とは「母数Xの推定量をX^とすると、X^の平均がXである」という事だそうですが、
いまいち良くわかりません。
例えば10個の標本X1、X2、X3・・・・X10から成る母集団Yがあったとしましょう。
X1の平均をXバー1、X2の平均をXバー2・・・・として、Yの平均(=母平均)をμとすると、
μ={(Xバー1)+(Xバー2)+・・・+(Xバー10)}/10
が成立する時にXバーiは不偏推定量といえる、という事でしょうか。
統計で嘘をつく方法
突っ込みどころ満載だが、とりあえず一つだけ。
>例えば10個の標本X1、X2、X3・・・・X10から
>成る母集団Yがあったとしましょう。
これは意味不明。「標本」「母集団」という言葉の意味を調べてみること。
言葉づかいの間違いが一つや二つなら、前後の文脈から類推して
逐次エラー訂正して読みすすめる事もできるが、,の
様に間違いが多いと、もはやそれもできない。何が言いたいのか
さっぱりわからない。
>データを増やしていけば
「データ」を増やすのではなく「標本数」を増やすのでは?
>極限的漸近的に確率分布は正規分布に近づいて行き、
何の確率分布が正規分布に近づいて行くのか?
「中心極限定理」をキーワードに調べてみること。
この辺(414の(1))でいきなりつまずいているので、後の方
の文章がすっちゃかめっちゃかになっているようだ。
>「(データを増やすほど)正規分布に近づく」という事ですか。
「データ」を増やすのではなく「標本数」を増やすのでは?
(「データ」を「標本数」の意味で使っているのか?自分の
主張を他人に理解して欲しいなら、曖昧な言葉遣いはしない
ことだ。)
>一致性とは標本数を増やして行くほど推定値が真の値=母数
>に漸近して行くという事ですよね。
「漸近して行く」とはどういう意味で使っているのか?
もう少し調べて、数学的に述べてみよ。
あと、「確率変数」「統計量」「推定量」といった言葉の意味
はわかっているか?(この辺を曖昧にしたままだと後が大変。)
質問がたくさんあるので最初の質問に答えます。
あとは誰か順番に答えてあげてください。
まず?@の質問について
?@「確率密度関数とは相対頻度分布の極限、換言すれば母集団の相対頻度分布である」
・・・データを増やしていけば極限的漸近的に確率分布は正規分布に近づいて行き、
確率密度関数とはこの正規分布に近似される分布を表す式である、という事でしょうか。
またこの記述は離散型ではなく連続型分布を想定しているものでしょうか。
「」内はまぁいいと思いますが、そのあとの記述について、
データを増やしていっても相対頻度の形は正規分布に近づいていきません。
中心極限定理とごっちゃになっているみたいです。
和の分布が正規分布に近づくというのはそのn個の和を一個の標本として考える
という事です。そのnを増やしていったときに正規分布に近づくという事です。
あと「」内の記述は離散も連続もあてはまるでしょう。
すいません一つ訂正しておきます。
離散確率変数のときは確率密度関数とは呼びません。
Probability mass functionと呼びます。
日本語訳は知りません。
ちなみに確率密度関数はProbablity density function
ですがこの2つは本質的には同じものです。
ついでだから?Aと?Bの質問にも答えておきます。
まず?Bから。
ちゃんと読んでみると
「」の内の記述は結局Probability mass functionの事ですね。
つまり、日本語訳は確率関数だったんですね。
誤解の元は中心極限定理をまちがって理解している事のようです。
420でも書きましたが相対頻度の形は標本数を増やしても
正規分布の密度関数の形にはなりません。
その確率変数の確率密度関数や確率関数の形にどんどん近づいていきます。
?Aはこの点が確率関数と確率密度関数の違いなのですが、
密度関数では区間の面積がその区間をとる確率なのに対して
確率関数の方はその点の値がその点をとる確率なのでこのように
説明したんでしょう。連続確率変数が一点を取る確率がゼロというのは
一見おかしく見えますが、それを説明するのは測度論や
無知晒しまくりでお恥ずかしい限りです・・初学者ゆえ何卒ご容赦下さい。
訂正して再度お尋ねします。
?@ヒストグラムを書く際に、標本数を増やしそれに応じてグループ分けを細かくしていけば
(10刻みから5刻みへ、5刻みから1刻みへ、1刻みから0,2刻みへ・・・)、ヒストグラムの概形
は次第に滑らかになって行きますよね。「極限的漸近的」とは、標本の相対頻度分布が、標本数
を増やすにつれてどんどん母集団の相対頻度分布に近づいていく有様を述べたつもりです。
で、母集団の相対頻度分布を、
(1)連続型の場合は確率密度関数と言う。区間の面積がその区間(の中にある或る値)をとる確率を
表す。つまりxという特定の値をとる確率は0であり、?凅という区間に対してしか確率を付与する事はできない。
確率変数が区間?凅の中に入る確率は、面積f(x)?儿で表される。
(2)離散型の場合は確率関数と言う。或る特定の値(例えばサイコロの3の目)に、確率変数がその値(3という値)
をとる確率(1/6)を付与する事ができる。
冷静に参考書を読んでみると、確かに中心極限定理と混同していることが分かりました。
「正規分布に近づいていく」ではなく、「母集団の相対頻度分布(=確率密度関数or確率関数)に近づいていく」
で宜しいのですよね。
すいません!
条件付き確立の定義ってどういったものですか?
?C中心極限定理を以下のように解釈しましたが宜しいでしょうか。
「複数の独立な確率変数の和(若しくは平均)を一つの確率変数Xとして捉えると、
要素となっている確率変数それぞれの分布がどのようなものであれ、Xは正規分布に
従う。」
?D一致性は以下のように解釈しました。
「確率変数Xの推定量をX^とする。εをXとX^の間の乖離の許容限界、即ち何とかぎりぎり
許される誤差の最大範囲とする。
X^が区間[X−ε、X+ε]の中に入る確率が、標本数を増やすにつれてどんどん1に近づいていく時、
X^は一致性を満たすと言える。」
?E不偏性については要するに以下のような事を考えていたのですが。
「日本人の平均身長を推定するために、東京の平均身長と大阪の平均身長を用いる。
この時、日本人の平均身長は(推定の対象となる)母平均に、東京の平均身長と大阪の平均身長はそれぞれ
推定量に相当する。
日本人の平均身長=(東京の平均身長+大阪の平均身長)/2
が成立する時、東京の平均身長と大阪の平均身長はそれぞれ不偏推定量である、という事が言える。」
やっぱり違いますかね。何か他に適例があったら御教示ください。
>「確率変数Xの推定量をX^とする。
確率変数について理解できていないと思われます。「確率変数」という言葉の意味を調べてみて下さい。あなたの教科書にはなんと書いてありますか?
すみません、?D誤解している部分がありました。
「確率変数X」ではなく「母数X」に訂正して下さい。
おっしゃる通り確率変数の定義を未だによく理解していないので教えて下さい。
教科書には「確率的にいろいろな値をとる変数。略式に言うと偶然に左右される変数。」
とあるのですが、具体的にイメージできません。
或る確率分布を背景に伴って動く変数、という事ですか?
例えばさいころの目をXとすると、Pr{X=i|i=1,2,3,4,5,6}=1/6という確率分布を
伴いつつ、Xは1から6まで色々な値をとる、という事ですか?
>教科書には「確率的にいろいろな値をとる変数。
>略式に言うと偶然に左右される変数。」とある
>のですが、具体的にイメージできません。
確率変数の定義は、「文系用」や「やわらか工科系用」の
教科書などでは、分かりやすく書こうとするあまり上記の
用に(初心者には)意味不明な説明がされている事が多い。
とはいえ、厳密に説明すると、これもまた初心者にとって
意味不明になる。以下のような説明ではどうか?
確率変数とは、
(1)確率実験が行われる前には値が代入されていない。
(2)確率実験が行われると、その瞬間に値が代入される。
(3)代入される値は、実験結果に応じてあらかじめきめ
はそれでいいと思います。ただ一つ言うと極限と漸近は違います。
簡単に言うと漸近とは極限に行くちょっと前に状態と考える事ができす。
ものすごく極限に近いけど極限ではない状態の事です。
は?@は正規分布に近づくと言い換えれば、いいと思います。
一致推定量の定義は真の値に確率収束する推定量のことです。
直観的な理解としては標本数が増えれば増えるほど真の値に
近づくというだけで十分だと思います。
不偏推定量とは推定量が確率変数だということを理解して
その期待値が真の値と等しいという事です。
(1)一致推定量だが不偏推定量でないものや
(2)不偏推定量だが一致推定量でないもの
両方ありえます。
確率変数を測度論的に厳密に定義すると集合の話から始まって
いろいろと(ここで書くには)面倒な定義をしないといけないので
実験前はXと大文字で表され、実験後判明した実現値・観測値はxと小文字で表されるんでしたっけ?
Xはxとして実現されるという事ですか?
具体的に言うと、さいころを振る前に、これから出るであろう目をXと事前に表現しておき、
実際に振った後例えば3が出たら、X=3と代入される、という事ですか?
この場合3が小文字のxに相当するという事ですか?
確率変数を大文字(例えばX)であらわし、実際に実験を
したときにその確率変数に代入された(される)値(こ
の値の事を確率変数Xの「実現値」といいます)を小文字
(例えばx)であらわす流儀があり、一般に広く採用され
ています。
>具体的に言うと、さいころを振る前に、これから出るで
>あろう目をXと事前に表現しておき、実際に振った後例
>えば3が出たら、X=3と代入される、という事ですか?
>この場合3が小文字のxに相当するという事ですか?
そうです。
「標本数が増えれば増えるほど新の値に近づく」
・・・要するに、大数の法則に従う、という事ですか?
「不偏推定量とは、推定量が確率変数だということを理解して、その期待値が
真の値と等しいということ。」
母数を推定するために用いる推定量が、或る確率分布に従いつつあれこれ変動し、
変動しつつもその平均値は母数とピシャリ合致する、という事ですか?
n個の標本に対応する確率変数を、
X1,X2,・・・,Xn
とする。
Y=(X1+X2)/2
Z=(X1+X2+・・・+Xn)/n
とする。YもZも、母平均の推定に関する不偏推定量だ。
Zは、一致推定量でもある。しかし、Yは一致推定量で
はない。
>中心極限定理を以下のように解釈しましたが宜しいで
>しょうか。「複数の独立な確率変数の和(若しくは平
>均)を一つの確率変数Xとして捉えると、要素となっ
>ている確率変数それぞれの分布がどのようなものであ
>れ、Xは正規分布に従う。」
「確率変数それぞれの分布がどのようなものであれ」の
部分だが、要素となっている確率変数それぞれは、全て
ある一つの確率分布に従っていなければならない。
>母数を推定するために用いる推定量が、或る確率分布
>に従いつつあれこれ変動し、変動しつつもその平均値
>は母数とピシャリ合致する、という事ですか?
言葉遣いがなってません。(従って意味がとれません。)
「推定量」という言葉と「推定値」という言葉を、しっ
かり使い分けて、上記の文章をもう一度書き直してみて
ください。
「推定量が」「あれこれ変動する」なんておかしいと思
いませんか?
「推定量」と「推定値」の区別がついていないところが、
あなたがこんがらがっている一つの大きな原因でしょう。
「推定量」と「推定値」の意味を調べてみてください。
分散を算出する時,なぜn-1で割るのか教えてください。
単にデータが2個しかないときの整合性のためです
回答者の皆さんわざとか知識不足かはしりませんが、
結構嘘が混じってますよ。
おいおい。そりゃないだろ。
母分散を推定する時に用いる標本分散の分母がn-1なのは、
そうしないと不偏推定量にならないからだろ。
しょうがないので一致推定量の定義をちゃんと書きましょう。
(ここで数式を書くのは書きにくいし書けないのもあるのでいやなんですが)
まず確率収束を定義します。
limPro(|m(n)*-m|>=e)=0
ここでm:定数 m(n)*:ある数列 >=は不等号です。
limはnが無限大になるように取ってます。
これがが任意のeで成り立つとき(つまりどんなに小さな正のeで成り立つ)
m(n)*はmに確率収束するといいます。
そして推定値が真の値に(nが大きくなるにつれて)確率収束
するような推定量を一致推定量といいます。
大数の法則とは(実は大数の法則にもいろいろあるんですが一番最初に習うのを)
標本平均が確率収束するという事です。推定量が標本平均だったら
大数の法則から推定量が一致推定量であることが言えます。
不偏推定量とはさっきの書き方を使うと
Wilcoxson順位和検定って、
サンプル数が多くなってもちゃんと有意差を検出できる?
>ここでm:定数 m(n)*:ある数列 >=は不等号です。
m(n)*:ある確率変数列
>そして推定値が真の値に(nが大きくなるにつれて)確率収束
>するような推定量を一致推定量といいます。
nが大きくなるにつれて真の値(推定したい母数)に確率収束
するような推定量を一致推定量といいます。
弱一致推定量であることは,
その推定量の分散とバイアスがともに0に収束することと
同値である.
推定値まで真の値に確率収束するのは強一致の方な.
まあこの場合は確率収束するだけじゃじゃないけど.
統計学初心者ですが、問題でどうしても解けない問題があります。
周りに聞く人もいないので正直困ってます・・
何方か『解いてやるよ〜』って方いませんか?
その際はメールで問題お送りします。
お願いします・・・
問題は重回帰分析等です。
教えてください。
Q、ある空港の駐車場を拡張する計画がある。平均駐車時間が以前に比べ長くなっているなら拡張しなければならない。
平均駐車時間が従来どおり42,5分であるかどうか検定したい。入出時間が記録されている駐車券を36枚サンプリングし
て調べると、その平均は46分であった。今までの経験から、標準偏差は7,6分であることがわかっている。この時、有意
水準を5%として仮説検定を行ないなさい。
おいおい。446は自分で考えるつもりが全くないだろ。(レポートか?)
まずは一冊くらい入門書読んでみろよ。こんなの3ページくらい
読んだら分かることだろ。
ヒント:分散が既知の場合の母平均の仮説検定
ごめんなさい。参考書持ってなくて気がついたら提出明日だったんです。
ちょうど講義休んだ時ので、わからなくて。
帰化仮説:μ=42.5 対立仮説:μ.5
42,5+1.64*√(7,6)^2/36=44,58
標本平均=46.58⇒帰無仮説を棄却
∴拡張が必要
でいいんですか?どうか教えてください。
結果は合ってるね
途中全然わかりません。教えてください。
最小二乗法の問題点と、そのチェック方法と解決法ってなんですかね?
どなたか教えてください
一度回帰診断について調べてください.
ここでは書ききれん
誰が何を書いたか明確になるよう、以後名前を付けて書き込みたいと思います。
母平均に対する推定量について。
>(X1+X2)/2は不偏推定量だが一致推定量ではない。
>ΣXi/nは不偏推定量かつ一致推定量である。
前者も後者もその期待値が母平均と等しいという点で不偏性を満たす。
しかし、後者がnの値を増やしていくにつれ、母平均との誤差が0である確率が1に収束していく
という点で一致性を満たすのに対し、前者は(標本数が既に2と決定されているという点で)そのような
事態が起こり得ないから一致性を満たさない、ということですか?
不偏推定量について。
>「推定量が変動するなんておかしい」「推定量と推定値とを区別せよ」
推定量とは確率変数(実験前に事前的に値の取り方が確率分布によって規定されている変数)の
一種ですよね。「あれこれ変動する」とは「変数が或る一定の確率分布に従いつつ色々な値をとる:
例えばさいころの目が1から6まで色々な値をとる」事を表現したつもりです。
で、推定値とは推定量を具体的に計算した結果、言うなれば定数という事ですか?
また、「確率変数の平均」「推定量の平均」という言葉が今まで余りピンと来なかったのですが、
また、「推定量」という言葉を調べていて新たに発生した疑問。
「統計量とは標本から構成される確率変数である。標本の関数と言ってもよい。推定のために
用いられる統計量を特に推定量と言う。」とあるのですが・・。
標本平均は母平均に関する推定量ですよね。
標本平均は標本の和をn(標本数)で除したものであるという点が、「標本から構成される」に相当するのですか?
要素となっている標本それぞれは確率変数だから、その和をnで除した標本平均も確率変数になる、という事ですか?
「標本の関数」とは、どのような標本を採るのか、或いは採られた標本がどのような値をとるかで、標本平均の値
が決まって来る、という事を指しているのですか?
一致推定量について。
私は「一致性」という言葉を「誤差の許容限界内に推定量が入る確率が、標本数を増やすにつれて1に収束
していく」と捉えて425の?Dにも書いたのですが、言っている事は同じですかね。
推定量の分散と誤差が0である確率が1に収束する、という事ですか?
普通「一致推定量」と言ったらこの弱一致推定量を指すのですか?
母分散の不偏推定量が、Σ(Xi−標本平均)^2/(n−1)である理由について。
数学的な証明ではありませんが、直観的には以下のように捉えて宜しいのでしょうか。
仮に母平均が既知であったら、母分散=Σ(Xi−母平均)^2/nと推定されますよね。
然るに今残念ながら母平均は未知である。仕方がないから標本平均を用いて母分散を推定するしかない。
しかし、幸いΣ(Xi−母平均)^2>=Σ(Xi−標本平均)^2
即ちΣ(標本−母平均)^2>=Σ(標本−標本平均)^2
である事だけは判明している。(証明は後述)
Σ(Xi−母平均)^2/n・・・?@
Σ(Xi−標本平均)^2/n・・・?A ?@>=?A
母平均が分かってさえいれば母分散を?@と推定できるのに、分からないゆえに標本平均を
用いて推定するしかない。?Aと推定してしまいそうになるが、?@>=?Aであるから、
もう少し?Aを大きくして?@に近づけるために、?Aの分母をnより小さな数で割った方がよさそうである。
nより小さな数で割る理由は大雑把にはこのように捉えられるのでしょうか。
不偏分散の期待値を計算すると母分散になるんだよ。
母分散の期待値を計算すると母分散より大きくなっちゃうんだよ。
どちらも一致推定量だけど、何度も実験を繰り返したら、
平均値が真値になるほうが、なんとなくすっきりするだろ?
だから、不偏分散の方が好まれるんだよ。
ただ、いつでも不偏推定量が良いというわけじゃないんで、
その辺はじっくり勉強してくんな。
>「不偏分散の期待値を計算すると母分散になる」
・・・これが不偏分散が「不偏」たる所以な訳ですか?
>「母分散の期待値を計算すると母分散より大きくなる」
・・・「母分散の期待値を計算する」とは?
Σ(Xi-標本平均)^2/nを計算する、という事ですか?
そしたらこれは母分散より小さくなりませんか?
>「平均値が真値になる」
・・・「不偏分散の期待値を計算すると母分散になる」事を指しているのですか?
不偏分散の平均値(=期待値)は母分散と等しい、という意味ですか?
物わかり悪くてすみません。
因みに459は私です。(名前入れるの忘れました。)
436は別の方です。
すみません、460も名前忘れてました・・。
442が僕の間違いを指摘しているようなので少し書き足しておきます。
まず最初の指摘ですが、これは別に間違いではありません。
普通の意味で収束するなら確率収束するのは定義から明らかですから。
何も確率変数列に限定する必要はありません。
2番目は確かにそう書かないとだめですね。
弱一致と強一致の違いを指摘している人がいます。
僕はこの二つの違いをうまく説明できません。
というのも僕はalmost sure convergenceというのがまだ
よくわかってないからです。もう少し勉強してきます。
誤差の許容限界内というのがよくわからないですが多分あってると思いますよ。
に関連して、中心極限定理について少し書いておきます。
中心極限定理と一口に言っても実はいっぱいあります。まず普通一番最初に習うのが
Lindeberg-Leby の中心極限定理というものでこれは独立同分布すれば
(正規化したものが)正規分布に分布収束するというものです。
次が多分 Lindberg-Feller の中心極限定理というものでこれは
独立だけど同分布でない確率変数用です。
同じくLiapounovの中心極限定理というのもあります。
独立でなくしかも同一の分布でない確率変数には例えば
Wooldrige-Whiteの中心極限定理というものがあります。
これは計量経済学を専門でかなりコアにやるつもりの人なら
そのうち知る事があるかもしれません。
他にもマルチンゲール差分列の中心極限定理だとかいっぱいあります。
これらの中心極限定理は例えば独立という仮定を緩めたりすると
モーメントに関する条件が強くなったり、いろいろと他の条件が強くなります。
そういう意味で独立性や同分布性とモーメントやら他の条件の間にトレードオフ
>本当にわからないのだが、結局、434の指摘になにかまずいところでもあるの?(独立の条件と同一分布の条件を(同時
に)うまく変更することで、定理の変型がいろいろ考えられます、という話は434にどう関係があるの?いろいろ変型が
できるという事も書いておくべきでは?ってことかな?それとも425はそのままで間違いでは無いということかな?)
>いろいろと長く書くのに疲れたのであとは他の人に聞いてください。では。
すくなくとも私にはいろいろと勉強になりました。どうもありがとう。
今度は仮説検定の話に行きたいと思います。
χ^2基準を計算して有意水準を5%と設定し、Pr{χ^2>a}=0,05となるようなaを求め、
「χ^2基準の計算結果<a」であれば(理論値と観測値とがこの程度乖離する確率は5%以上あるから)仮説は棄却されず、
「a<χ^2基準の計算結果」であれば(理論値と観測値とがこれほど乖離する確率は5%以下しかない)仮説は棄却される、という道筋ですよね。
χ^2の値は理論値と観測値との乖離の程度を表す指標であり、その乖離が発生する確率が
5%以上あれば「まあその仮説は妥当と言えるだろう」と判断でき、
5%以下しかなかったら「そんなに小さい確率でしか発生しない乖離が生じるなんて、その仮説の妥当性は怪しいのではないか」と判断できる、
という趣旨ですよね。
ところが授業で課せられたレポートでは、こういった5%有意水準で棄却・受容という方式を採っていないのです。
χ^2基準の計算結果がaで、Pr{χ^2>a}=0,08という確率値を出して、
「この確率値は十分小さいとは言えないので帰無仮説を棄却することはできない」という道筋なのですよ。
確率値を算出する過程で、自由度(r−1)*(s−1)のχ^2分布を参照する他に何か色々やっているのですが・・。
5%有意水準棄却/受容という論理展開も誤りでないとあって、むしろそちらの方がポピュラーだと思うのですが、
>確率値の大小に対する客観的な判断基準ってあるんですかね?
それは、検定する対象によってちがうと思いますよ。たとえば、検定の
結果の誤りが命に関わるような場合は、(例え検出力を犠牲にしても)
なるべく安全側におちるように有意水準を低く低く設定したり。逆の
ケースでは有意水準を高めにしたり。(でも大体0.95とか0.98が多い
よね。これって慣習?>詳しい人)
>(でも大体0.95とか0.98が
0.05,
0.02 ?
いつの間にかレポートの質問スレに…
ものすごく遅レスだけど、統計学における未解決問題って例えばどういうのがありますか?
所謂「尤度比統計量」、「Neyman-Pearson尤度比基準」、「Bartlettの統計量」
は3つとも同じものと考えてよろしいのでしょうか。
間抜けな質問ですみません。
つまり
χ^2=−2logλ
と。
先日の、中心極限定理の話題についていけなかった初心者です。
蒸し返してすみませんが、もう少し基礎的なところを教えても
らえないでしょうか?
参考書に中心極限定理は「確率変数 X1,X2,・・・・,Xn が互いに独立で
平均 m 分散が σ^2 の同じ分布に従うものとする。このとき
X1+X2+・・・+Xnを標準化した確率変数 Z=Σ(Xi-m)/((√n)σ) は
標準正規分布 N(0,1)に収束する」
って書いてあったのですが、これは
母集団(平均m 分散σ^2)から標本を1個とってきてその観測値をXiとする
と、 (ΣXi-m)/((√n)σ) は正規分布に収束するということですよね。
ということは、Xiの平均はmに近づくということでしょうか?
もし、そうだとすると、これは、大数の法則と同じ事(大数の法則を
含む事)を言っているのでしょうか?
よくわかってない質問ですみません。
473です。
もう少しさかのぼってログをよんだら、232,235,275,319 あたりでも
中心極限定理が話題になってたことがわかりました。でも、それをよんでも
今ひとつ、よくわかりません。
どうか、よろしくお願いします。
あー、そうそう、小さくなる、で合ってます。間違えてごめんです。
小標本では一致性より不偏性か平均二乗誤差が小さいことが好まれる、
と言いたかったのさ。
434の指摘のうち「全てある一つの確率分布に従っていなければならない。」
という記述は誤りで、従っていれば中心極限定理は簡単に証明できるし、
同一の分布に従ってる必要はない、と言いたかったのでしょう。
統計のグラフの書き方について質問です。
y軸方向にエラーバーつけるときは、普通は標準偏差(SD)をとりますよね。
別に標準誤差(SE)をエラーバーにしても問題ないですか?
ちなみに、医学生物学系の論文です。
数理統計学でお勧めの和書ありますか?
そもそも数理統計学とは何なんでしょうか?汗;
東京大学教養学部「統計学入門」は数理統計学の教科書とは言えないのでしょか?
ちょっと初歩統計学試験に出るんで教えて欲しいんですが。
傾向分析の方法と公式と相関分析の求め方と、推定の
教えて君が集うスレはここですか?
翻訳でよければP.G.ホーエルの「入門数理統計学」(培風館)が定番。
数理統計とは−−ってよく分からんけど、証明を略さずに定理を公理
から厳密に導いて見せてるっていう叙述のスタイルなんじゃないの?
違ったらスマソ。詳しい人教えて。
すみません、初歩的で申し訳ないのですが、
質問させてください。
統計学で第一種のエラーと、第二種のエラーについて
具体的にはどういう例があるのかがピンときません。
どなたか、具体的に(魚を10匹釣って、とか)解説していただけないでしょうか。
また、有意水準を5%とすると
H0とH1を置いたとき、
H0が真なのに、H1を採択してしまう間違いが第一ですよね。
これはH1は95%の可能性でのみ正しいと言えばいいのですか?
第二種の場合は、H1が真なのに、H0を採択する場合ですよね。
この場合、H0は95%の可能性でのみ正しいと言って問題ないのですか?
すみません。
第一種の誤り 第二種の誤り 具体例
でgoogle
H0が帰無仮説ならまあそれほど間違いではない。
つーか教科書よみなされ。どれ読めばいいか分からんならとりあえず以下を。
わかりやすい統計学 松原望 丸善
統計学入門 東京大学教養学部統計学教室 東京大学出版会
デルフォイ法について教えてください。デルフォイ法は○○の一種と穴埋めが
あったんですがわかりません。あと、デルフォイ法自体の概要もお願いします。
検索かけてもなくて(涙)
サイコロの分布関数はどのように表せばよいのでしょうか?
デルファイ法では?
数学や物理の場合、若いうちに開花していないとその後モノになることは無いと、
よく聞きますが、統計学にもそういうのあるのですか?
ひょっとして、定義域を離散にしようとして困っていない?
出た目が x 以下である確率をF(x)とすれば、実数軸(R)上できれいに定義できる。
そういや確率密度関数の離散版を英語で probability mass function
ということがあるが、確率質量関数って訳語はあんまりみないな。
質点系と連続体の対比になってて分かりやすい言葉だと思うんだけど。
スレ違いでないことを祈りますが、
統計学を学ぶのにイイ大学院に心当たりはありませんでしょうか?
私は経済系の学部卒社会人です。
米国にはこういうパスを歩む人も多いみたいで、ちょっと考えてみました。
統計数理研究所つーか総合研究大学院大学
例えば当たり確率0.1(1/10)のAクジと当たり確率0.01(1/100)のBクジがあるとして、
ABどちらかわからないクジを引き続けて、
当たりの出現率から、95%信頼度でA,Bどちらなのか推定するとします。(AなのかBなのか判定したい)
この時に95%推定できる試行回数というのは、どのように求めればよいのでしょうか?
あまりにも基本的な質問でしたらゴメンナサイ。教えてください。
A,Bどちらなのかって検定は基本的にできないよ。
とにかくたくさん引いてそこから大当たり確率を推定して
それが0.1と有意に異なっているかどうかっていう検定はできるけど。
でもこれは大当たり確率が0.1かどうかって話で、もし棄却されたとしても
じゃあ0.01かっていうとそんなことはいえない。逆もしかり。
両方やればいいんだけどね。
技能検定の学科試験問題で悩んでいます。
問 ある製品Aの長さは、平均10.00mm、標準偏差1.00mmの正規分布に従う
ことが分かっている。この製品Aをランダムに16個取り出した場合、
その長さの平均値が10.50mm以上となる確立を求めなさい。
教科書を見ても解き方が書いてないし、工業高校で習ったおぼえも無し。
馬鹿な高卒でも分かる解説をできればお願いします。
大きな本屋か図書館へ行って、確率統計の入門書を何冊か
手に取ってみて、自分のレヴェルや性にあったものを探し
てみな。なるべく例題や練習問題の多い本を選ぶと良いだ
ろう。みんなそういう事をやって勉強しているんだよ。
495 の様な問題はスタンダードな練習問題だから、どの本
でも触れられているはず。「正規分布」「正規母集団から
の標本」などをキーワードにして探してみな。
基本的に検定をするのに標本数は関係ないよ。
もしその統計量の分布が正確にわかっているなら
例え一個の標本だろうと95%だろうが何%だろうが検定できるから。
標本数の大きさが重要になるのは、検定に漸近分布を使うときだけ。
, あたりがいい説明をしてるからそれを見てみたら?
実際には493の場合は漸近分布を使う事になるだろうけど、
(493のような検定をするとして)
その場合にも何個以上とかいう明確な基準はないよ。とにかく大きければ
大きいほどいいというくらい。どれくらい大きければ正規分布をよく近似するか
とかはもとの分布に依存するし、そのための客観的な基準とかってないと思う。
素人考えでゴメン
ベイズ統計使うってのはダメ?
>基本的に検定をするのに標本数は関係ないよ。
関係はあるんじゃないですか?
同じ有意水準でも標本数nが増えると検出力が上がるのが
普通ですよね。検出力が高い方が「良い検定」ですね。
>例え一個の標本だろうと95%だろうが何%だろうが検定
>できるから。
できますね。
>どれくらい大きければ正規分布をよく近似するかとかは
>もとの分布に依存するし、
そうなんだけど、今回の場合はもとの分布は二項分布(と
いうかベルヌイ分布か)ですよね。ベルヌイ試行一回の
下記の本を読んだ人の感想をお聞かせください。
W・フェラー
確率論とその応用?T(上下)?U(上下) 紀伊国屋書店
かなり有名な本ですが、どうなんでしょう?
数量化理論について、多重共線性の問題が解決されていない、っていうのはどういう意味なんでしょうか?突然ですが・・・
経営学板住人です。経営学板ではこれら↓が簡単だといわれてるのですが、
みなさん的にはどう思われますか?なんでもいいので、この本をご存知の方、
ご存知でない方、感想をきかせてもらえると幸いです。
(1)初歩からの多変量統計 三土 修平 (著)
(2)数学の要らない因子分析入門 三土 修平 (著)
(3)誰も教えてくれなかった因子分析―数式が絶対に出てこない因子分析入門
松尾 太加志 (著), 中村 知靖 (著)
「標本分散が不偏推定量ではない」ことを直感的に説明するには
どうすればいいのかな?まぁ二乗をとってるから偏るのは当たり前なんだけど
標本分散をとる基準である標本平均自体が平均からぶれるからでしょう。
1001 :
1001:
このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。