統計を知らんDQNが多いと思うのれす

このエントリーをはてなブックマークに追加
1primero
なんか世の中、統計を知らない方が少なくないと思うのれす。
でも、どこに立てたらわからんので(数学版ではだめらしい)
ここでお付き合いしてくれればと。(統計学は理系じゃない?)

例えば、こんなぺいぢはどうでしょう。心理板で、1年弱前から叩かれてます。
http://www2.justnet.ne.jp/~shozo_owada/index.htm

他にも、内閣支持率で95%信頼区間を出してるところが少なかったり(特にTV)
「80%から50%に、30パーセント減少しました。」とか言うアナウンサー。
50人に調査して、パーセント表記の円グラフ。
みのは2人の更年期主婦を実験にして、この食品は体にイイと言う。
つーかどこでも「平均」オンリーだし。

関連・参考スレ:
統計学なんでもスレッド(数学) http://cheese.2ch.net/test/read.cgi/math/1012782106/
血液型と性格の関連性ver3(心理) http://yasai.2ch.net/test/read.cgi/psycho/1011917717/l50

レスくださるとうれしいです。
2Nanashi_et_al.:02/02/07 13:21
>>1
ガウス分布の性質について述べよ。
3primero:02/02/07 13:38
性質 --- もっこり

一瞬ガンマ分布と見まちがえた.
関係ない話ですが、私の専攻の某教授は、ガウシアンとしか言わない。
4Nanashi_et_al.:02/02/07 13:39
じゃあ正規分布の性質教えて
5primero:02/02/07 13:47
normal distributionでしたっけ。
何次元もあるけど、とりあえず最初は、N(μ, σ)ってやつで。
やっぱ、もっこり、左右対称。だいたい -1.96<z<1.96 で95%

2人しかいないのがさびし。
というか、正規分布とガウス分布が同じがどうか
あやふやな漏れもドキュソかも。とりあえず飯食っていいですか。
6Nanashi_et_al.:02/02/07 14:28
同じだから聞いたのに、、、
もっと高等なことを答えてくれるかと期待してた。
ガウス分布が実際に使われる場面や、なぜガウス分布があるのか
って言ったことを答えてほしいな。
7Nanashi_et_al.:02/02/07 14:30
ガウスの誤差原理は中心極限定理をものすごく大雑把に使うと
出てくるみたいです。
8Nanashi_et_al.:02/02/07 14:31
まあ、西遊推定と言うことでいいんじゃないの?
9Nanashi_et_al.:02/02/07 14:35
そうそう中心極限定理で出てくるね。
10Nanashi_et_al.:02/02/07 14:36
ついでに相関関係をすぐに因果関係につなげる間違いも多いね。
もっとひどくて相関関係もなくて単なる思い込みだったりすることも多いけど。
11primero:02/02/07 14:46
Nanashi_et_al.って、この板の七誌だったと今気付いた。
みなさん、レスだうもです。

6> スマソ。 (あ、文字通り性器分布)
場面: 悪い例では偏差値(なぜか10かけて50足す)
t-検定のnがじゅうぶん大きいとき など
なぜ: ガウスのこじつけってのは答えにならないか。

「こんないい加減な結果もってきてこじつけんなよ。」ていうのとかあります?
12Nanashi_et_al.:02/02/07 14:56
統計得意な方、頼む教えてくれ。

極座標表示した時、振幅は常に1で位相は一様分布。
でこれのN個の和の分布が正規分布になることを知りたい。
有限な分散と平均持っていれば中心極限で正規分布に収束するのは分かったが
卒論なんでそんな中途半端なことは書きたくない。誰か頼む。
13あほ:02/02/07 15:14
N個の和が正規分布??
exp(j2πn/N) の和でしょ。
んでもって一様分布なわけだから。
1412:02/02/07 15:53
書き方が悪かったかな。要するに
f(t)=Σexp(j2πωt)
で、ωはランダムに与えられる。
で、fの分布が実部、虚部ともに正規分布になる事の証明。
15DQN:02/02/07 16:11
ども。コイントスの結果を100回中59回当てたという実験結果があったとして、
そこから「被験者はコイントスの結果をある程度予知できた」という結論を導いてOKでしょうか?
http://www.nhk.or.jp/gatten/archive/2002q1/20020102.html
を見ていて感じた疑問。
16Nanashi_et_al.:02/02/07 18:19
ワナビー祭り。
ワショーイ!
17Nanashi_et_al.:02/02/07 19:21
>>14
どっちかというと正規分布になるというより正規分布からのずれの確率が
求められるんじゃない?もちろん n -> ∞ なら問題ないけど。

>>15
検定でそういう積極的なことはいえないでしょう。
18Nanashi_et_al.:02/02/07 19:38
>>17
検定してんの?
19Nanashi_et_al.:02/02/07 21:32
>>15
成功  失敗
実測値 59 41
期待値 50 50

でカイ2乗検定か?あるいは2項検定?どっちがいいのだろう。
2018:02/02/07 22:33
2項分布で検定では?
21Nanashi_et_al.:02/02/07 22:46
>>15.19
貝事情賢帝、に1300ガウス。
2212:02/02/07 22:56
>>17
n -> ∞ の時、正規分布に収束する事の証明が欲しいんです・・・
中心極限の定理により・・・って書くのはなんだか胡散臭くて。
シミュレーション動かせば正規分布に収束するかはすぐわかるんですけど
卒論なんでスマートに解いておきたいんですよ。

分かる方には分かると思いますけど、
レイリーフェージングの包絡線の分布です。
23Nanashi_et_al.:02/02/08 00:02
>>12
謝辞に「2ちゃんねらに教えてもらいました」ってちゃんと書けよ
24Nanashi_et_al.:02/02/08 00:08
ちょっとレスの内容が違うかも知れないが
社会調査に関しては

・眠れる夜のグーゴル (アスキー出版??)
・社会調査のウソ  (文春文庫)

がよいです。

専門書の数式から離れるのもたまにはよいのでは??


25Nanashi_et_al.:02/02/08 00:11
>>22
中心極限で行くんだから、適当な本から導出を写せよ。
26Nanashi_et_al.:02/02/08 00:25
>>23
Nanashi et el.
もな。
2712:02/02/08 00:30
>>25
中心極限の厳密な証明って難しかったような気がします。
分布ごとの個別の証明だったら簡単なんで
レイリーフェージングの場合も簡単な証明がありそうですがどうでしょう?
とりあえず図書館で統計の本を一冊読んで探してみます。
28Nanashi_et_al.:02/02/08 00:36
>>27
厳密ではないかもしれんが、工学系の確率過程の本とかに書いてあるよ。
29...:02/02/09 00:26
age
30Nanashi_et_al.:02/02/09 03:39
http://www.nkgw.ics.keio.ac.jp/jap/basic_research/channel/
レイリーフェージングは↑見てわかったけど、
どうして、こういう確率密度関数ができるのかわからん。
まさしく統計をしらないDQNですが教えてください。
31Nanashi_et_al.:02/02/09 13:25
俺は電波関係はよくしらんが
上のページのレイリーフェージングの式は
p(r)=r/(σ^2)・exp(-r^2/2σ^2)
0≦r<∞
とある

どんな確率分布から出てくる変数でも
それが互いに独立で分散が∞じゃないのなら
その変数の部分和は中央極限定理から正規分布の形にできる
ので変数rの確率分布はexp(-r^2/2σ^2)の形になる
で、それを0から∞まで積分したときの値は確率の定義から1でなくては
いかんので、
1=α・∫exp(-r^2/2σ^2)dr (0≦r<∞)
をとくとα=r/(σ^2)となる。αは正規化項

ってのでいいのではないのかな
おれもきちんとわかってるわけではないので訂正誰か求む
3231:02/02/09 13:28
よくみたらちがった、すまん。逝って来ます
33名無しさん:02/02/09 16:13
>>12
おいらも、おそらく貴方と同じ分野の研究をやっています。
フラットレイリーフェージング通信路のモデル化ですね。
がんばってください。おいらも、修論でその部分を書いてるけど
文献の引用ってことですませています.

>>30
移動通信で移動局にマルチパス通信路をとおった電波が
アンテナにn波の到来波が2π/n間隔でやってきて、さらに
移動による電波のドップラー変動をモデル化したところ
から始まります.
34Nanashi_et_al.:02/02/09 16:18
スレタイの割に良スレ。

心理屋は統計だけで食ってる人種が多いから、下手な理系よりは統計に強いはず。

でも統計的手法を絶対視するので、考え方に偏りが多いケースも一概に良し悪しは言えない。
3534:02/02/09 16:19
×考え方に偏りが多いケースも
○考え方に偏りが多いケースもあり
36卵の名無しさん:02/02/09 16:26
いくつかのスレッドに同じこと書いてしまってる
のですが、どうしても教えてもらいたくて書きました。
ある集団で胃癌15人、大腸癌2人、食道癌1人、肝臓癌1人、
だったとして、胃癌が多いですよ、ってことを検定するには
何検定を用いればよろしいのでしょうか。
教えてくださいませ。
37最新50:02/02/09 16:28
>>36
ソロバン検定がよろしいかと
3812:02/02/09 17:13
>>31
どんな確率分布から出てくる変数でも
それが互いに独立で分散が∞じゃないのなら
その変数の部分和は中央極限定理から正規分布の形にできる

この厳密な証明ってないですかね。
どこみても、中心極限の定理より・・・なんですよね

>>30
上の中心極限の定理が正しいとすれば
移動通信環境における複素包絡線の実部、虚部の分布は
N波の平均合計電力をσ^2とすると
f(x)=N(0,σ^2/2)=1/(σ*sqrt(pi))*exp(-x^2/σ^2)
f(y)=N(0,σ^2/2)=1/σ*sqrt(pi)*exp(-y^2/σ^2)
ともに独立なので
f(x,y)=1/(σ^2*pi)*exp(-(x^2+y^2)/σ^2)
ここで極座標変換をする
r^2=x^2+y^2
確率密度*微小面積が確率で、これは一定でなければならない
f(x,y)dxdy=f(r,θ)drdθ
それぞれの座標での微小面積の関係は
dxdy=rdrdθ
よって
f(r,θ)=r/(σ^2*pi)*exp(-r^2/σ^2)
θに関して一様分布なのは明らかで、また独立なのも明らかで
f(r)=2*r/σ^2*exp(-r^2/σ^2)
微妙に式が違いますが、基準の取り方が違うだけで基本的に同じ(はず)です。

>>33
レイリーの証明って、ランダムな角度で到来するN個の波を与えて
やったほうがより厳密だと思います。
まあ、どうやっても結局は最後は中心極限なんですけど。
3933:02/02/09 17:27
>>12
まだいる?中心極限定理を知っているならそれでいいのでは・・
つまり、虚部も実部もそれぞれ正弦波を確率変数とする
足し合わせってことだから。厳密に式で証明したいのかな?

4033:02/02/09 17:36
>>38
すまそです。うちでは、位相を固定して
シミュレーションしているんで・・。
どうやらそっちに頭が固まってしまって
いうようです。
411です:02/02/09 19:59
>34
> スレタイの割に良スレ。
すまそ。最初はタイトルのように、みんなで彼らを小馬鹿にしようかと
思ってたのですが、統計の問題を考えるスレってものいいですね。
おれも来週あたり質問しようかなぁ。
4231:02/02/09 22:38
手元に中心極限定理の証明があるが・・・
あぷする?>>38
43Nanashi_et_al.:02/02/10 17:27
12の言っている「厳密」の意味がわからないけど。
中心極限定理って厳密ではないのかな?
式を用いて表したいという意味なら、単に中心極限定理での確率変数(条件あってればね)に
sin、cosを当てはめればよいのではないかと思うんだけど。
それとも、38を見た感じでは、N→∞をとりたくないという意味かな?
44Nanashi_et_al.:02/02/10 19:00
>>36
ガンはその四種類しかないのか?

キム仮説:胃=食堂=大腸=肝臓
でカイ2乗かユードヒ検定してみては?イーブンではないとはいえるだろう。
ただそのデータだけじゃ積極的に胃がほかより多いとはいえんだろ。
45Nanashi_et_al.:02/02/10 21:33
>ただそのデータだけじゃ積極的に胃がほかより多いとはいえんだろ。
+ その件数でカイ二乗もなさそう
46Nanashi_et_al.:02/02/10 22:01
サンプル数が少なくてもやれる検定があった気がするが・・・
47Nanashi_et_al.:02/02/11 05:05
>>1
読み方なんてどうでも良いと思うけどなぁ・・・。定義だし。

理解しているかどうかが大切だろ。理解してないけど。

48Nanashi_et_al.:02/02/11 06:31
確率統計って結構使う局面多いけど、きちんと教える授業って意外と
少ないんだよね。
中心極限で正規分布になるってのはある条件の元だけだよね。極限に
もっていき方によってはポアソンになったりするしね。(大学3年級)
統計は未だに飯食える奴もいる分野だから奥は深いよ。
大学院のカリキュラム終えてもまだまだ入り口。
49名無しの研修屋:02/02/12 00:11
>>36
胃癌の発生率は他の癌よりも高いということを検定したいという意味なら44の言うとおり自由度3のカイ二乗検定をすれば良いと思う。
また、その集団の胃癌の発生率が平均の胃癌発生率よりも高いかどうかを検定したいという意味なら二項母集団の母比率の検定をすれば良いのでは?
50Nanashi_et_al.:02/02/12 00:53
>>38
ほとんどの場合正規分布に持っていけるけど、どんなプロセスを考えているかで
微妙に持って逝き方が違うから、厳密な証明したければ仮定まで書かないと無理
だよ。

というか、多分そこは誰か頭のいい人が数十年前にやっているから、苦労する割
にはありがたがられないよ。
51Nanashi_et_al.:02/05/24 02:07
良スレのような気がする
52Nanashi_et_al.:02/05/24 02:59
そもそも、こういう現象にはフラクタル性が見える場合がある。
この場合、分布はべき分布になり、中心極限定理は成り立たない。
平均値も分散も意味があるかないか分布見て決めて欲しいよね。
マスコミの市場調査の結果、「分布を見せろ〜!!」って言いたい。
53Nanashi_et_al.:02/05/24 03:03
>「80%から50%に、30パーセント減少しました。」とか言うアナウンサー。

これってどこが変なの?
54nanashi:02/05/24 05:57
>>53
80から50に減少だから、(80-50)/80*100=37.5%減少が
正しい(但し母集団が同じ場合)。

あるいは、こういう場合は普通「30ポイント減少しました」と言う。
55Nanashi_et_al.:02/05/24 06:00
単純に考えて37.5%減と思うが…普通「30ポイント減」って言うっけ?
56Nanashi_et_al.:02/05/24 06:04
あ、カブった。
57Nanashi_et_al.:02/05/24 06:04
ところでガウシアンとかローレンチアンってなんなの?
なんの役に立つの?サイコロ振るとそういう分布になるの?
なんでX線のスペクトルと関係あんの?それは実際に広がりを持ってるわけじゃなくて
測定器が鈍感ちゃんだからなの?それとも実際に広がりを持って放射してんの?
だとするとなんで広がりを持ってるの?
58Nanashi_et_al.:02/05/24 10:31
>>57数が少ないと正規分布にならない。
59Nanashi_et_al.:02/06/09 02:04
統計なんて適当にやっておけば(・∀・)イイ! のでは?
60Nanashi_et_al.:02/06/10 20:42
>>59はDQNだが正しいね。
61Nanashi_et_al.:02/06/10 21:03
>>36 >>46
期待度数5以下のセルが全セルの20%以上あるときはχ2検定は不適切。
この場合、直接確率計算法(Fisher's exact test)が良いのでは?

どうしてもχ2検定をしたいのなら、度数の小さいセルを併合するか
標本を増やすことが必要。
62Nanashi_et_al.
このスレ、勉強になるね