統計学Part16

このエントリーをはてなブックマークに追加
1132人目の素数さん
前スレ
統計学Part15
http://wc2014.2ch.net/test/read.cgi/math/1365172541/

統計学なんでもスレッド14
http://uni.2ch.net/test/read.cgi/math/1326471964/
2132人目の素数さん:2014/09/09(火) 21:11:02.65
統計検定HPの2級の過去問の問11[1]の解答が2番になってるけど3番の間違いではないか?

これどなたか教えてください!
3132人目の素数さん:2014/09/10(水) 15:24:51.58
2だよしつこいなw
納得しなさい
4132人目の素数さん:2014/09/10(水) 18:43:22.64
/200!?
5132人目の素数さん:2014/09/10(水) 22:19:35.50
なんで2なの???
6132人目の素数さん:2014/09/11(木) 15:48:38.22
もうこの話題はやめないか。馬鹿らしいから。
7132人目の素数さん:2014/09/11(木) 17:00:50.37
説明できないの?
8132人目の素数さん:2014/09/11(木) 17:26:55.40
放置しとけよwwwww
構うほうもバカww
9132人目の素数さん:2014/09/11(木) 19:47:45.77
いやいや説明できるなら説明すればする終わる話題だろ
説明できないで逃げようとするからいつまでも追いかけられるんだよ
10132人目の素数さん:2014/09/11(木) 22:00:12.90
その前に問題をアップしろよ。
11132人目の素数さん:2014/09/11(木) 23:02:23.08
ある組立工場では,作業内事故の低減に努めている。この工場の 2 つの部署でそ
れぞれ起こった 1 日あたりの事故数 y について 200 日間記録した。この期間内で
の,部署 A の事故数の平均 y ̄A は 11.8 件,標準偏差 sA は 2.4 件であり,部署 B
の事故数の平均 y ̄B は 8.1 件,標準偏差 sB は 2.0 件であった。労務担当者は,これ
ら 2 つの部署間で事故数に違いがあるかどうか検討することにした。ただし,事故
数は部署ごと,日ごとに独立であり,母分散が等しいと仮定して有意水準 5% で評
価するものとする。
〔1〕まず,2 つの部署の事故数の合成した分散 s^2 を,2 つの部署の標準偏差 sA,sB
から求める。その s^2 の式として正しいものはどれか。次の 1 〜 5 のうちから
適切なものを一つ選べ。
12132人目の素数さん:2014/09/11(木) 23:20:16.79
>>11

s^2=[(200-1)sA^2+(200-1)sB^2]/(200+200-2)=[sA^2+sB^2]/2
13132人目の素数さん:2014/09/12(金) 06:49:45.63
うむ。よろしい。
14132人目の素数さん:2014/09/12(金) 07:54:35.23
線形結合して共分散が0で
s^2=sA^2+sB^2
じゃ無いの?
15132人目の素数さん:2014/09/12(金) 13:52:06.33
>>14
合成と合計がごっちゃになっている、ようするにt検定をやろうとしていることを留意しよう
>>14は分散の合計で、(A,B二部署からなる)工場で起こる事故数の分散だ
求めたいのは1部署で起こる事故数の分散の推定値

ただ[1]だけだと>>14になるようにも読めるので、選択肢に>>14が無いんだと思う

試験勉強してる人なら2群の平均の差のt検定の式で即座に>>12が思い浮かぶはず
16132人目の素数さん:2014/09/12(金) 14:46:18.53
>>15
母分散が等しいと仮定しているから
母分散の点推定値として分散の平均を使うってこと?
17132人目の素数さん:2014/09/12(金) 15:53:33.70
>>15
単に標本数を増やした感じか
18132人目の素数さん:2014/09/12(金) 17:12:21.69
そうか、統計検定2級程度も受かるか怪しい奴らが
このスレにたくさんいるってことだな。
19132人目の素数さん:2014/09/12(金) 17:15:59.39
その発言は逆に君の馬鹿さを露わにするぞ
ここに書き込むために有形無形を問わず何か関門でもあったか?
20132人目の素数さん:2014/09/12(金) 17:50:02.17
>>16>>17
計算は同じだな
解釈の仕方が違うだけで
21132人目の素数さん:2014/09/12(金) 23:12:47.36
>>19
そうか、馬鹿はそういう発想をして自分を慰めるんだな。
22132人目の素数さん:2014/09/12(金) 23:28:02.55
等分散仮定下での合併分散の式がなんで↓になるのかなんて、正直考えたこともなかった
{ (m-1)Va + (n-1)Vb } / (m+n-2)
誰か賢い人教えてor良い参考資料紹介してくだせー
23132人目の素数さん:2014/09/12(金) 23:31:09.61
>>21
>>19を統計検定2級程度も受かるか怪しい奴と決めつけることで自分を慰めている、と受け取れる
24132人目の素数さん:2014/09/12(金) 23:50:26.89
>>23
そうか、馬鹿はそういう受け取り方をするんだな。
25132人目の素数さん:2014/09/12(金) 23:52:29.38
>>24
ごめんな、確かに>>19の人は言い過ぎだった、許してやって
2622:2014/09/12(金) 23:57:43.48
各群からの推定母平均(μa, μb), プールデータからの推定母平均(μe)

>>22式から、
Σ{(ai -μa)^2} + Σ{(bi - μb)^2} = Σ{(ai -μe)^2} + Σ{(bi - μe)^2}
が導かれるけど、計算したら左から右になるんで?
それともμa = μb = μe を仮定?
27132人目の素数さん:2014/09/13(土) 00:07:21.81
統計検定の過去問の質問をした者だが
俺のおかげでスレが盛り上がってよかったね
28132人目の素数さん:2014/09/13(土) 00:26:21.65
>>25
そうか、ごめんな、馬鹿よばわりして。
正直者なんで本音がでちゃった。
ちなみにこのスレの半分は俺が書き込んでるのでよろしくw
29132人目の素数さん:2014/09/13(土) 00:27:57.92
結論としては
統計検定2級すら受からない馬鹿が
このスレに大勢いるということですか?
30132人目の素数さん:2014/09/13(土) 03:51:44.99
>>29
相変らず性格悪いですね。偏差値70超えてますよ。
31132人目の素数さん:2014/09/13(土) 09:55:07.19
>>26
標本集合A+標本集合Bを標本集合C
と考えたら
(ai-μa)^2+(bi-μb)^2=(ci-μc)^2
じゃね?

sA^2がna度数、sB^2がnb度数観測された
と考えたら
(na*sA^2+nb*sB^2)/(na+nb)
32132人目の素数さん:2014/09/13(土) 11:48:05.41
>>31
上の方は一般には成り立たないかも

例えばAとBが左右に離れていた場合
Cの値は大きな値になりそう
33132人目の素数さん:2014/09/13(土) 23:47:04.03
統計学がブームとかすごいステマ臭がするんだけど
こんなのやって一体何の役に立つんだ?
34132人目の素数さん:2014/09/14(日) 02:14:55.71
ギャンブルしなくなる。
35132人目の素数さん:2014/09/14(日) 02:41:31.43
正規分布でない(ピークが無いフラットな)標本で、
「母集団と個体の関係、個体間の相対関係」に絞り適当に把握したい場合
(他グループとの比較やパーセンタイルは除外)、
学力の偏差値計算を用いた場合の問題点を教えてください。
36132人目の素数さん:2014/09/14(日) 03:10:00.99
>>26
t分布を使って母平均の差を検定するから
帰無仮説として母平均の差=0を置く
そうした帰無仮説の元で計算した値と
標本から計算した値を比較する
そしてt分布で有意水準以下の確率だったら帰無仮説を棄却する
37132人目の素数さん:2014/09/14(日) 03:13:31.85
>>36
補足
だからμa=μb=μeは帰無仮説を数式で表したもの
38132人目の素数さん:2014/09/15(月) 12:27:13.79
好きな確率分布を教えてください
39132人目の素数さん:2014/09/15(月) 13:45:59.77
Aさん、Bさん、Cさんの3人のテストの得点が
平均 ua, ub, uc
標準偏差 σa, σb, σc
の正規分布となる場合、Aさんが3人の中で一番点数が高い確率は?
40132人目の素数さん:2014/09/15(月) 16:01:16.71
>>39
NB>NC ∩ NA>NB の確率と
NC>NB ∩ NA>NC の確率との和

共分散が判らないから計算できなくね?
41132人目の素数さん:2014/09/15(月) 18:35:36.99
>>36-37
なるほど、すっきりしました
どうもありがとうございます
42132人目の素数さん:2014/09/20(土) 21:04:18.18
統計検定2級って言ったらスゲーじゃん!誰でもホイホイ撮れるもんじゃねぇやん
43132人目の素数さん:2014/09/20(土) 21:32:52.08
2級の合格率見たら47.87 %だった。
おれの持ってる資格は合格率数%のものばかりなんでたぶんすごくないと思う。
44132人目の素数さん:2014/09/22(月) 18:22:25.73
過去問見る限り2級はヘボい
1級と2級の差は相当ある、英検とかと一緒だな

2級落ちてるやつは強制受験か棚ボタ狙いだろ
ちゃんと勉強したのに2級落ちるやつは残念ながら相当頭弱い
45132人目の素数さん:2014/09/22(月) 19:02:35.05
受かってない奴がドヤ顔でwww
46132人目の素数さん:2014/09/22(月) 19:43:50.96
おれもここで初めて存在を知ったし、受験地も東京と大阪だけだし、
受験者数も1000人程度と少ないし、一体誰が受けているんだろう?
47132人目の素数さん:2014/09/22(月) 20:31:07.04
始まってそんな経ってないんじゃないか
48132人目の素数さん:2014/09/23(火) 10:59:12.79
>>46
相当、統計に自信がある強者ばかりが受験している最高峰の試験だよ。俺はかなり出来る方だけど、まだ3級挑戦中
49132人目の素数さん:2014/09/23(火) 12:31:36.59
RSS/JSSのほうもあるね
高いけど
50132人目の素数さん:2014/09/23(火) 12:52:42.35
>>48
その割には半端なく合格率高いし、問題が簡単ですねw
51132人目の素数さん:2014/09/23(火) 14:39:20.90
実地で統計使ったことある人なら2級まではカスみたいなもんだろ
座学オンリーの奴には難しいのかもしれん
52132人目の素数さん:2014/09/23(火) 17:18:18.08
子どもの勉強と違って「わからないことがあったら質問できる人」が
存在するかどうかがとても大きい。
53132人目の素数さん:2014/09/23(火) 19:31:47.86
大学受験合格率
A判定 80%
B判定 65%


10000人のA判定の人間が試験を受けたら2000人は落ちる計算
嘘つけよ
実際そんなに落ちてねーだろ
ちゃんと数えて統計採れよ
80%は事実上の98%くらいだろ
それでも200人は落ちるって考えられんけどな
そこまでの御墨付きをもらって何をどうやったら
落ちるんだよ
不調でも受かるだろ
54132人目の素数さん:2014/09/23(火) 20:06:33.86
??
55132人目の素数さん:2014/09/23(火) 23:32:12.74
しっ見ちゃいけません
56132人目の素数さん:2014/09/24(水) 19:57:26.14
統計検定の受検対策にはアクチュアリーの過去問がいいね
57132人目の素数さん:2014/09/25(木) 12:40:14.05
SPSSとJSTATってそこまで検定結果に差が出たりします?
ANOVAとF検定、Tukeyによる多重比較くらいしかしませんが…
58132人目の素数さん:2014/09/25(木) 14:36:21.76
ドアホ
同じことやらせたら同じ結果がでるに決まってるだろ
各ソフトで同じことやってるのか違うことやってるのか解らない脳なしはSPSSでがちゃがちゃぽんやってろ
ま、p値算出以外ならExcelでいけるような検定なら好きなソフト使えばいいよ
59132人目の素数さん:2014/09/25(木) 19:23:28.98
ソフトの信頼性がどうなのか聞きたいんじゃない?
聞き方がアホなのには変わりないけど
60132人目の素数さん:2014/09/25(木) 22:49:48.07
だったら複数ソフトで同じデータの検定すれば良くね?
データ量が多くなければ手計算もやって正しいかを確かめれば良い。
61132人目の素数さん:2014/09/26(金) 01:22:49.16
>>58
基本的なのだったらpeachもExcelで計算できる
T検定とかanovaとか
62132人目の素数さん:2014/10/01(水) 03:21:51.25
単回帰分析で惜しくもp<0.05にならなかった因子が、
重回帰分析で他の因子との組み合わせによりp<0.05になることはありえますか?
63132人目の素数さん:2014/10/01(水) 14:19:58.61
とりあえず>>62は回帰分析についてまるで解っていないことが解った
勉強しろ、率直にいって凄く間抜けな質問してるぞ?

ありえるに決まってる
例えば「体重」の「身長」による単回帰分析と「身長」と「ウエストサイズ」による重回帰分析を考える
「体重」よりも「ウエストサイズ(つまり体型)による影響を取り除いた体重」の方が「身長」ときれいに相関するだろうから、
重回帰分析の方が「身長」のp値は下がる
64132人目の素数さん:2014/10/01(水) 17:37:27.58
>>63
3回読んで納得しました。
ありがとうございました。
65132人目の素数さん:2014/10/01(水) 22:05:24.37
つーかある因子のp値から逆算して他因子を考慮するか考えるなんて、クソにもほどがある
66132人目の素数さん:2014/10/03(金) 22:37:30.90
>>1
スレ趣旨テンプレを省略するなよ。

以下のお約束を守った上で統計学について何でもどうぞ。
1)学校の宿題の丸投げはやめましょう。
2)質問者は質問の前に相当程度調べるなり、考えるなりしましょう。
3)荒らしは基本的にスルーでお願いします。
67132人目の素数さん:2014/10/03(金) 22:40:07.80
>>2
過去スレ
統計学なんでもスレッド14  
http://uni.2ch.net/test/read.cgi/math/1326471964/
統計学なんでもスレッド13
http://uni.2ch.net/test/read.cgi/math/1297356696/
統計学なんでもスレッド12
http://kamome.2ch.net/test/read.cgi/math/1283521346/
統計学なんでもスレッド11
http://kamome.2ch.net/test/read.cgi/math/1258355122/
統計学なんでもスレッド10
http://science6.2ch.net/test/read.cgi/math/1245043541/
統計学なんでもスレッド9
http://science6.2ch.net/test/read.cgi/math/1226981666/
統計学なんでもスレッド8
http://science6.2ch.net/test/read.cgi/math/1211786770/
統計学なんでもスレッド7
http://science6.2ch.net/test/read.cgi/math/1193183539/
統計学なんでもスレッド6
http://science6.2ch.net/test/read.cgi/math/1169836298/
統計学なんでもスレッド5
http://science5.2ch.net/test/read.cgi/math/1145362721/
統計学なんでもスレッド4
http://science4.2ch.net/test/read.cgi/math/1123896809/
統計学なんでもスレッド3
http://science3.2ch.net/test/read.cgi/math/1097491056/
統計学なんでもスレッド2
http://science3.2ch.net/test/read.cgi/math/1068288283/
統計学なんでもスレッド
http://science.2ch.net/test/read.cgi/math/1012782106/
68132人目の素数さん:2014/10/03(金) 22:44:49.21
>>2
関連スレ1 ソフトウェア
【R言語】統計解析フリーソフトR 第4章【GNU R】
http://kamome.2ch.net/test/read.cgi/math/1294561909/
統計ソフトSTATAの部屋 Ver.2
http://kamome.2ch.net/test/read.cgi/math/1284083650/
統計・解析ソフトについて
http://hibari.2ch.net/test/read.cgi/bsoft/1012298063/
【統計分析】機械学習・データマイニング【集合知】
http://toro.2ch.net/test/read.cgi/tech/1286200810/

関連スレ2 試験
【会計士】★統計学part2★【選択科目】
http://kohada.2ch.net/test/read.cgi/exam/1260227046/
【通信】  統計士・データ解析士  【高杉】
http://ikura.2ch.net/test/read.cgi/lic/1288016000/
統計・プログラミング選択あつまれー
http://kohada.2ch.net/test/read.cgi/kouri/1323147411/
センター数学2Bで統計選択のやつ集まれ〜 2011
http://kohada.2ch.net/test/read.cgi/kouri/1318831930/

関連スレ3 その他
統計学は低脳のやる学問?
http://uni.2ch.net/test/read.cgi/math/1310989332/
心理統計学スレ
http://awabi.2ch.net/test/read.cgi/psycho/1324507670/
偏った標本調査・世論調査・統計を吊し上げるスレ
http://ikura.2ch.net/test/read.cgi/sim/1322885523/
【泰野くん】(独)統計センター2【藤田】
http://uni.2ch.net/test/read.cgi/koumu/1284048045/
【さよなら】(独)統計センター3【ラスプーチン】
http://uni.2ch.net/test/read.cgi/koumu/1285335261/
69132人目の素数さん:2014/10/03(金) 22:46:10.07
>>2
関連スレ4 kamome鯖霧散消失前スレ
【統計学】統計的仮説検定!!
http://science6.2ch.net/test/read.cgi/math/1201535084/
◆統計学について語るスレ
http://kamome.2ch.net/test/read.cgi/sim/1012828891/
生物学での統計学スレ
http://kamome.2ch.net/test/read.cgi/life/1127772845/
統計ソフト統合スレッド−SPSS・SAS以外
http://yasai.2ch.net/test/read.cgi/psycho/1012801769/
SASスレ
http://yasai.2ch.net/test/read.cgi/psycho/1012738237/
SPSSスレ
http://yasai.2ch.net/test/read.cgi/psycho/1012388599/
70132人目の素数さん:2014/10/03(金) 22:52:24.92
>>2
関連スレ5 数学板現役スレ
統計ソフトSTATAの部屋 Ver.2
http://wc2014.2ch.net/test/read.cgi/math/1284083650/
統計学の分かりやすい本教えろください
http://wc2014.2ch.net/test/read.cgi/math/1337166984/
【R言語】統計解析フリーソフトR 第5章【GNU R】
http://wc2014.2ch.net/test/read.cgi/math/1380168442/
統計数理研究所について語るスレ
http://wc2014.2ch.net/test/read.cgi/math/1405864800/
71132人目の素数さん:2014/10/03(金) 23:31:58.04
>>66
スレ趣旨テンプレは同意するが、関連スレは居るか?特に死んでるスレ
72132人目の素数さん:2014/10/03(金) 23:39:21.17
>>68
一部URL訂正
統計・解析ソフトについて
http://peace.2ch.net/test/read.cgi/bsoft/1012298063/
偏った標本調査・世論調査・統計を吊し上げるスレ
http://hello.2ch.net/test/read.cgi/sim/1322885523/
73132人目の素数さん:2014/10/04(土) 04:57:32.32
質問の仕方でアンケートの結果が変わるって言うけど
その質問の仕方の違いによるアンケート結果の違いの統計ってないの?
74132人目の素数さん:2014/10/04(土) 20:36:30.12
そんぐらい自分で探せよ・・・
ありがちなテーマだし先行研究なんぞ山ほどあるでしょ
75132人目の素数さん:2014/10/05(日) 01:28:04.75
レジの違算に関してですが、違算に作為が無ければ長い目で見れば結局は±0で落ち着くと言うことで大丈夫ですか?
お釣りが少ない場合は言いに来るは排除で。

知り合いの相談で聞けば聞くほど可笑しいなと思ったので。
そもそもマイナスの違算ばっかりなのに客からお釣りが少ないと言われた事が一度も無いらしい。
など総合的に考えて作為を疑っているので意見をお願いします。
76132人目の素数さん:2014/10/05(日) 02:51:48.73
昔のコンビニバイトの経験からの話なんだが、レジミスは長期的に見て±0には絶対にならない

なんでかというと、レジは大抵弾くような動作を繰り替えして金を取るんだが(基本的に1弾きで1枚)、
人間の感覚的にいって、1弾きで2枚取ったことを見逃す率よりも、0枚を見逃す率のほうが明らかに少ない
この動作を山ほど繰り返すため、釣り銭ミスは少なく渡すよりも多く渡す方が絶対に発生しやすい
さらに、少ない場合のみその場クレームが発生する可能性があるのでこの傾向に拍車がかかる
なのでレジ違算は長期的にみると基本マイナス方向に偏るため、それだけでは盗難の有無の推測は難しい

しかしまぁ個人的意見だけど、店長が怪しいと感じたのなら十中八九店員が盗んでるよ
ダスキンへの支払い等、レジ金を使った客以外とのやり取りの計上ミスはないというのが当然の前提だけどね
77132人目の素数さん:2014/10/05(日) 10:32:40.11
>>75
釣銭の間違い金額を確率変数として一定期間でのその分布の母平均値の点推定値が0
と言う帰無仮説を立ててT検定すれば?

仮説より事実の方が正しいと判断するのが普通だと思うけど

なぜその事実になるのかは詳しく調査しないと分からないだろうけど回帰分析とかでわかるかも
誰かの時に有意に外れているとか
78132人目の素数さん:2014/10/05(日) 10:39:51.56
http://maguro.2ch.net/test/read.cgi/edu/1408743817/664

予備校講師が、分散と標準偏差と交換法則の関係について
凡人には理解できない高尚な議論をしています。
79132人目の素数さん:2014/10/05(日) 10:40:00.48
ANOVAか?
80132人目の素数さん:2014/10/05(日) 15:02:12.37
>>77
測定できるのは現金の実際額とレジの記録との差額だからこれを目的変数にするのかも
81132人目の素数さん:2014/10/06(月) 01:01:59.55
>>75ですが違算のデータが無いのでアレですが参考になりました。
82132人目の素数さん:2014/10/07(火) 00:07:06.91
GJ = 1.4 HP + TMP + .72 AGR + .43 (TMP) (AGR)
HP = HR^+ + LDGBR + LBI - HPM
TMP = 3.6 EJG + 4.7 √PT + KR - TMPavg
AGR = 1.5√T^2 + CP + 1.3HBP + 2.2TOSEB

薬物使用の証拠を示す方程式・・・
使われてる統計手法はアレです 
83132人目の素数さん:2014/10/11(土) 01:24:13.89
今更だけど、>>75は単位時間1レジを1標本として、
レジ違算〜会計回数+勤務従業員+会計回数:勤務従業員、で推定できそうだな

万人共通の偶発ミスなら会計回数が、ミスしやすいアホがいるなら交互作用が、
盗まれているなら勤務従業員が反応するはず
84132人目の素数さん:2014/10/17(金) 19:34:46.15
クラスタリング(?)の方法について教えてください。

標本サイズ100のデータが50種類あるとします。そして、この50種類のデータは10グループ、
各グループ5種類に分類されており、グループ内の相関はあるが、グループ間の相関はないと仮定します。
ここで、各データがどのグループに所属するかが未知であるときに、50種類のデータを正しくグルーピング
するアルゴリズムはあるでしょうか?もしあった場合、何種類くらいまで実際に計算できるでしょうか?
85132人目の素数さん:2014/10/20(月) 01:17:55.14
ニック・マークスとかいう統計学者の唱える「地球幸福度指数」で
みると、世界一幸せな国はコスタリカ、日本は何と75位らしいね。
スーパープレゼンテーション 「統計学者が語る 世界一幸せな国とは?」
NHK-Eテレ  2014.10.15
http://www.nhk.or.jp/superpresentation/backnumber/141015.html
86132人目の素数さん:2014/10/20(月) 12:46:08.45
例えば「植物の成長期した長さや花の大きさと日照時間の相関関係」を調べたいときはどのような検定方法を使えばよいでしょうか
たとえば日照時間をなし、二時間、四時間、六時間…と多条件を立てた場合です
87132人目の素数さん:2014/10/20(月) 14:15:28.12
すみませんこれだと相関分析ができてしまいますね
では「花の長さや大きさに影響を与えるのは葉緑体の数の増減ではないか」と考えたとします
日照時間によって葉緑体の数が変わり、結果として成長に影響を与えたということです
日照時間の違いとそれによる葉緑体数の変化、その結果生じる植物の長さと花の大きさの違いの相関を見るにはどうしたらよいでしょうか
88132人目の素数さん:2014/10/21(火) 10:11:08.87
背景がわけわかめ

日照時間長い>葉緑体密度があがる>光合成効率が増える>たくさん成長する、ってこと?
どっちかというと、日照時間長いとたくさん成長して葉緑体数が増える、んじゃない??

というか葉緑体数は推定値があるの?
89132人目の素数さん:2014/10/21(火) 12:57:23.10
>>88
すみません、例を挙げたまでなので意味が分かりませんね…

日照時間が長いほど成長が良いという事実が得られたとして、では成長の要因はなんだ?となったときに、葉緑体数と成長に相関関係があるのか検定するにはどうしたらよいでしょうか
90132人目の素数さん:2014/10/21(火) 13:30:04.26
>>89
>>83みたいな交互作用を考慮した重回帰分析とか
葉緑体のレベル毎に成長を測定して分散分析とか
なのかな?
単純な相関関係なら相関係数とか回帰分析のR^2でいいような気もする
ただ相関関係が有っても因果関係の向きや直接なのか、外や間に何かあるのかは判らないのでは?
91132人目の素数さん:2014/10/21(火) 13:39:13.50
相関関係と因果関係は別物だぞ?

手持ちのコマが日照時間と最終状態(長さ、花サイズ)しかないんだったら、因果関係の検証なんぞムリ
つか何が聞きたいの?例えが酷すぎる、実験系に問題あり、で終わり
92132人目の素数さん:2014/10/23(木) 12:43:37.09
知恵袋の質問ですまんが、これわかる人いる?
2chだと画像の貼り方がわからん。
結構困ってるので誰か助けてくれ...
93132人目の素数さん:2014/10/23(木) 13:11:12.21
>>92
アンタある意味すげえな
94132人目の素数さん:2014/10/23(木) 13:37:52.50
絶対、分からんわな
95132人目の素数さん:2014/10/23(木) 13:40:58.40
やっぱりそうか
96132人目の素数さん:2014/10/23(木) 13:57:39.61
97132人目の素数さん:2014/10/23(木) 14:08:28.71
2chに知恵袋のリンク貼って大丈夫かビクビクしてる
98132人目の素数さん:2014/10/23(木) 15:39:00.13
おめでとう、やっぱりだめだよ
99132人目の素数さん:2014/10/23(木) 16:10:08.74
>>96
まったく意味不明の所を見ると
これ以前に前提となる情報があるんだろう
100132人目の素数さん:2014/10/23(木) 17:03:38.64
>>99
前提となる条件って言ってもモーメントの定義式くらいしか…
質問の意味はわかりますか…?
101132人目の素数さん:2014/10/23(木) 17:05:57.35
>>99
前提となる条件って言ってもモーメントの定義式くらいしか…
質問の意味はわかりますか…?
102132人目の素数さん:2014/10/23(木) 19:23:42.74
物理板で聞いた方がよくね?
103132人目の素数さん:2014/10/23(木) 20:06:08.51
本当に正しいのこれ
104132人目の素数さん:2014/10/23(木) 23:19:30.85
統計はまったく知らない人なんですけど、教えてください

番組A 視聴率 11.8%
番組B 視聴率 10.0%

俺「番組Aに比べて番組Bは視聴率が落ちた」

友人「そうとはいえない。標本数600で調べた視聴率だから、標本誤差というのが2%超えるくらい出る。
    だから意味のある差があるとはいえない」

俺「番組Bだけ誤差が発生したなんて考えられない。番組Aもその誤差が発生したとすれば結果としてでてる数字は
  確かな物になるし何も変わらないじゃん」

友人「お前は馬鹿だ。さっぱりわかっていない。」


と、こんなやり取りだったんですが、俺どこかまちがってますか?
両方に誤差があるなら、結果としては同じことだと思うんですけど。
何がまちがってますか?
初心者なんで、わかりやすく説ほしいです。お願いします
105132人目の素数さん:2014/10/23(木) 23:25:44.94
物理より数学に近いと思って...
>>103
多分正しいとは思うんだけど、自分で考えて計算すると最初の2項目までしかでてこない...
Σijのijに1,1を入れるとμ_2ー(μ_1)^2になってこれは標準誤差の考え方と同じで分散の定義そのもの
がでてくるんだけど、やっぱり3項目以降がなんであるのかわからん。
普通モーメントってどの次数も独立だよな...?
106132人目の素数さん:2014/10/23(木) 23:32:20.58
>>104
標本数が少ないとゆらぎが大きくなる。だからその揺らぎ2%だったとして、ABの差がその揺らぎ以上
の開きがないと本当にAの視聴率のほうがいいとは言えない。例えばABと名前のついた二つのサイコロ
があったとして、5回サイコロをふった時の出た目の平均がA:3.5、B:2.9だったとする。そこから「Bのサイコロより
Aのサイコロの方が大きい目の出やすいサイコロだ」という結論を出してしまうのは間違ってるのは明らかだよね?
107132人目の素数さん:2014/10/23(木) 23:51:38.32
>>104
誤差があるので、データ通りにA>Bの大小関係があるとはいえない

例えば、目測で木の高さを測るとしよう
2本の木を同時に視界に入れて測るのではなく、1本目を単独で測った後、別の場所にある2本目の木を測る
1本目は12メートル、2本目は11メートルとなったが、目測には誤差があると考えられるので、
確実に1本目>2本目である、とは言えない
108132人目の素数さん:2014/10/23(木) 23:54:37.45
やっぱりわかるひといませんか(;;)
109132人目の素数さん:2014/10/23(木) 23:58:38.75
というか、モーメントって統計学のジャンルであってるよね??
110132人目の素数さん:2014/10/24(金) 00:25:59.56
合ってるよ
111132人目の素数さん:2014/10/24(金) 02:30:42.29
>>104
Aが高い誤差の値、Bが低い誤差の値
かもしれないからAの視聴率がBより高いとは言えない

全世帯調べる事が出来ないからサンプルを600とって調べるけど600の選び方によって視聴率の調査値は変わる
別のサンプルではB>Aの値になるかも
112132人目の素数さん:2014/10/24(金) 02:40:18.45
>>96
分散共分散行列って2次モーメントの行列じゃね?
n次モーメントの分散ってなってるから
物理のモーメントって回転とかのヤツでは?
113132人目の素数さん:2014/10/24(金) 04:16:18.82
>>112
そうそう、対角要素がそれぞれの次数のモーメントの分散(二次のモーメント)になってる。紛らわしいが。それで、普通に計算するとたとえば3次のモーメントの分散だとE[(x^3-μ_3)^2]でしょ?
これを計算するとμ_6-(μ_3)^2になって二項目までしか出てこないんだわ。
参考までによく出てくる算術平均の分散(一次のモーメントの分散)はE[(x-μ_1)^2]で、これを計算するとよく知られた式
μ_2-(μ_1)^2が出てくる。みなれた形で書くならE[x^2]-E[x]^2。
114132人目の素数さん:2014/10/24(金) 04:16:56.01
>>112
そうそう、対角要素がそれぞれの次数のモーメントの分散(二次のモーメント)になってる。紛らわしいが。それで、普通に計算するとたとえば3次のモーメントの分散だとE[(x^3-μ_3)^2]でしょ?
これを計算するとμ_6-(μ_3)^2になって二項目までしか出てこないんだわ。
参考までによく出てくる算術平均の分散(一次のモーメントの分散)はE[(x-μ_1)^2]で、これを計算するとよく知られた式
μ_2-(μ_1)^2が出てくる。みなれた形で書くならE[x^2]-E[x]^2。
115132人目の素数さん:2014/10/24(金) 04:17:35.49
間違って連投してしまったごめんなさい
116132人目の素数さん:2014/10/24(金) 06:04:50.96
というかi,j=1,1のときどうすんだこれ
117132人目の素数さん:2014/10/24(金) 08:48:56.50
>>104
どんなに誤差があろうと0.1%でも視聴率が高いほうが、
実際の視聴率も高い可能性が高い。
118132人目の素数さん:2014/10/24(金) 10:56:20.04
>>116
i,jに1,1と入れると>>114の最後で言った式がでてくるよ。μ_0=0だからこの場合は
3項目以降は消える。3項目以降がでしゃばってくるのは高次の時
119132人目の素数さん:2014/10/24(金) 12:07:52.41
>>118
Sigma_{1,1}=μ_2??μ_1^2
にならないか?
120132人目の素数さん:2014/10/24(金) 12:09:57.70
今μ_nはn時の中心モーメントを表しているので、

ああ、そういうことね
121132人目の素数さん:2014/10/24(金) 13:04:42.73
>>117
バカは黙ってろ
122132人目の素数さん:2014/10/24(金) 18:08:31.43
>>117
そう考える理由は?
123132人目の素数さん:2014/10/24(金) 18:21:49.04
>>117
そのとおり。
124132人目の素数さん:2014/10/24(金) 20:50:57.20
>>119
あってるよー
125132人目の素数さん:2014/10/25(土) 08:23:07.28
>>123
重ねて言う

バカは書き込むな
126132人目の素数さん:2014/10/25(土) 08:49:48.89
>>125
何か勘違いしてるよー
127132人目の素数さん:2014/10/25(土) 09:12:30.21
測定誤差は正規分布するから。
128132人目の素数さん:2014/10/25(土) 10:46:55.88
プロスペクト理論ではパチンコ依存を説明できない
129132人目の素数さん:2014/10/25(土) 14:57:12.95
>>127
A, Bを比較するんじゃねーの?
あと測定誤差が正規分布するとしてそのパラメータは同じなのか?
130132人目の素数さん:2014/10/25(土) 18:05:19.24
Aの視聴率>Bの視聴率 という結論を出せるかどうか

Aの視聴率>Bの視聴率となる確率が、Aの視聴率<Bの視聴率となる確率より高い、という結論を出せるかどうか

この二つを混同している人がいるのかもしれません
>>104の「友人」が前者を問題にしているのは明らかですが
131132人目の素数さん:2014/10/25(土) 18:24:48.98
>>130
AとBの視聴率を区間推定したら
132132人目の素数さん:2014/10/25(土) 18:36:57.26
>>131
え?なに?
133132人目の素数さん:2014/10/25(土) 18:48:16.49
>>132
誤差は視聴率の値と標本数によるから
一般的には調査値がA>Bだから
真の視聴率も同様とは言えなくね?
どんな組合せでも言える?
134132人目の素数さん:2014/10/25(土) 18:51:00.00
>>133
ごめん、その若者言葉みたいなのやめて
文意が曖昧になってしまうから
そして、何故任意の組合せの可能性を持ち出したの?
135132人目の素数さん:2014/10/25(土) 19:04:12.43
>>134
上の具体的な値も計算してみないと判らないのでは?
任意の値でA>Bなら計算しなくても良いけどな
136132人目の素数さん:2014/10/25(土) 19:28:46.71
「任意の値」と「任意のデータ」は大違い
137132人目の素数さん:2014/10/25(土) 19:48:04.50
視聴率に限定すれば
見た or 見てない の2値?
あと時間も関係するか
毎分とか毎時間とか
138132人目の素数さん:2014/10/26(日) 12:39:07.72
>>130
その友人は屁理屈しか言ってないですよね。
体重計でも温度計でも測定誤差はありますが、
測定誤差±0.2度の温度計が22.1度から22.2度に上がったら、
上がってはいない、誤差の範囲だ、意味がないと言うつもりなのでしょうか。
139132人目の素数さん:2014/10/26(日) 13:51:51.43
>>138
マジレスすると
その測定誤差±0.2度というのは、温度計自分自身との誤差ではなく、(理論的に定まっていると考えられる)真の気温との誤差のこと
…流石に釣りで冗談言っただけだよね?
140132人目の素数さん:2014/10/26(日) 15:19:42.11
>>139
大きな釣り針だなぁ。

基準電圧ひとつとっても揺れてるのに、計測回路はアナログ要素だらけで
真の気温とやらが一定でも計測するたびに結果も揺れるよ。
141132人目の素数さん:2014/10/26(日) 15:30:55.38
>>140
>>138に教えてあげたら?
答えはyesだと
142132人目の素数さん:2014/10/26(日) 15:37:16.91
>>138
答えはYesらしいので、その人とは友達止めるべきです。
143132人目の素数さん:2014/10/26(日) 16:15:32.54
温度計がふらふらするところを見た事ないなー
144132人目の素数さん:2014/10/26(日) 16:22:17.90
ここまで無知で調べる気すらないとさすがにもう相手にしてられないな。

ググレカス。
14512:2014/10/26(日) 18:10:40.29
>>144
そんな事言わずに楽しくやろうぜ
146132人目の素数さん:2014/10/26(日) 23:36:55.54
相関のあるAのデータとBのデータがあり
Bが0の時のAの推定値を求めるのに
散布図を作り線形近似曲線から切片を出そうとした場合

・AのデータをXに、BのデータをYにした時のX切片
・BのデータをXに、AのデータをYにした時のY切片

この2パターンがAの推定値となるのですがこの2つの値は異なる値となります。
相関係数が高ければ高いほどこの2つの値の差は小さくなり相関係数=1で差=0になるため
この2つの値の差は誤差のようなものと考えていいものなのでしょうか?
それとも「Bが0の時のAの推定値」を求めるにはXとYは必ず固定されなければならないのでしょうか?
147132人目の素数さん:2014/10/27(月) 00:00:59.56
解が異なるのは回帰直線を求める際の
最小二乗法をyで取るか、xで取るかの違いと同じ
148132人目の素数さん:2014/10/27(月) 00:09:16.25
>>146
相関があると分かったら何をしたいのか?
ただ相関があると知りたいだけなのか?
149132人目の素数さん:2014/10/27(月) 00:46:14.91
気になっただけだよな?
その手の解析の切片の数値なんゼロかゼロ以外か程度にしか気にするもんじゃないと思う
150132人目の素数さん:2014/10/30(木) 23:21:00.08
>>138
それは、完全に同じ条件で温度測定できてないと成りたたないですね。
測定誤差±0.2度の温度計が22.1度から22.2度に上がったとしても、
たとえば日光が温度計に直接当たって気温よりも温度計の温度が上がった、
温度計を持つ手の体温が伝わった、などの要因が発生していれば、
それは気温の上昇を示す変化ではないと思います。
いわば温度を計測したときの条件が変わっているわけですから。
視聴率もそれと同じで、標本となる世帯がつねに入れ替わっているし、
番組Aの時には残業で帰れなくて視聴できなかったが、番組Bは残業がない日
だったので家でゆっくり見られた、というふうに視聴の条件が常に変化しています。
このように番組Aのときと番組Bのときの標本の条件は同じではないので、
別の機械で計ってるようなもの。
同じモデルの温度計を2つ用意して、片方が22.1度、もう片方が22.2度だった
という例えのほうが近いのでは?
151132人目の素数さん:2014/10/31(金) 13:18:16.95
そういうの含めて正規分布するのですよ。
みな全く異なる環境で育ってるのに身長が正規分布するようにね。
152132人目の素数さん:2014/10/31(金) 14:39:53.85
米国・SAT(大学進学適性試験)で中韓の学生の成績が正規分布から大きく外れていたそうなw
153132人目の素数さん:2014/10/31(金) 16:47:48.51
パチンコ台みたいな釘が多段に打ってある板を斜めにして
上の中央からパチンコ玉を落とすと
最初の釘によって左右にほぼ同確率で分かれる
次の段でも同様に左右にほぼ同確率で分かれる
その分布がガウス分布
154132人目の素数さん:2014/11/01(土) 00:00:43.08
>>153
間違っちゃいないんだが・・・
二項分布に中心極限定理を用いて正規分布を説明するのはなんか違わないか?
155132人目の素数さん:2014/11/04(火) 15:29:56.37
こちらで聞いていいのか分からないのですが・・・

二つのデータ群があってその二つの関係性(AがBにどう影響を与えているか)を分析したいとき
分散分析と正準相関分析のどちらが適しているのでしょうか?
正準相関分析は二つの相関を調べるので影響を与えているかを考えるときは分散分析の方が適しているのでしょうか?

つまらない質問だとは思いますがどうかご教授お願いします。
156132人目の素数さん:2014/11/06(木) 00:15:05.07
どんな解析やろうが因果関係なんてわからない
2群比較だけで因果関係があるといえるほど強い関係性があるのなら、どんな解析でも明白な結果がでる

2データ群の因果関係が言いたいのに手持ちがそれしかないのは実験計画の段階でミスってる
157132人目の素数さん:2014/11/06(木) 11:47:49.08
偏相関係数?
158132人目の素数さん:2014/11/06(木) 12:00:29.43
>>156
>>155が研究デザインを明示しない状況でそんなことは断言できないのでは。
観察研究か実験研究かも分からないし。
例えば、AとBとが昨日と今日の気温データだったら、
自己相関としての因果関係はある程度存在すると思うぞ。
159132人目の素数さん:2014/11/06(木) 12:41:54.99
>>155程度の情報では>>156みたいな返事が関の山ということ
的を得た助言を求めるにしては>>155は情報量が少なすぎる
160nontan67:2014/11/08(土) 13:07:19.51
ある雑誌に投稿したらreviewerから
“no real comparison between the different derived parameters
for sensitivity orspecificity (ROC curve or random effects analysis)
or Moment analysis.”のようなコメントを頂きました。
研究内容は、生体のある状態を知るために色々なパラメターを時間に沿って
測定したものです。生体のある状態は、動物実験では測定が出来るものですが、
生体では測定できません。
コメントにある、ROCは判るのですが、
random effect analysis, Moment analysisは判りません。
どなたか教えて頂ければ幸です
161132人目の素数さん:2014/11/08(土) 13:45:05.83
いやだね
162132人目の素数さん:2014/11/08(土) 14:06:48.54
>>117
分散はでかくてもいいけど不偏性の条件が必要だよー!
163132人目の素数さん:2014/11/08(土) 21:31:22.37
        ,.-─ ─-、─-、
      , イ)ィ -─ ──- 、ミヽ
      ノ /,.-‐'"´ `ヾj ii /  Λ
    ,イ// ^ヽj(二フ'"´ ̄`ヾ、ノイ{
   ノ/,/ミ三ニヲ´        ゙、ノi!
  {V /ミ三二,イ , -─        Yソ
  レ'/三二彡イ  .:ィこラ   ;:こラ  j{
  V;;;::. ;ヲヾ!V    ー '′ i ー ' ソ
   Vニミ( 入 、      r  j  ,′
   ヾミ、`ゝ  ` ー--‐'ゞニ<‐-イ
     ヽ ヽ     -''ニニ‐  /
        |  `、     ⌒  ,/
       |    > ---- r‐'´
      ヽ_         |
         ヽ _ _ 」

     ググレカス [ guglecus ]
   (生没年不明)
164132人目の素数さん:2014/11/08(土) 21:45:46.64
誰だ、美術室から持ち出した奴は?
165132人目の素数さん:2014/11/19(水) 06:46:21.04
統計検定の受検表は届きましたか?
166132人目の素数さん:2014/11/19(水) 07:10:56.87
はい
今さら受けるのめんどくなってきた
167132人目の素数さん:2014/11/19(水) 19:49:49.52
会場は大学
168132人目の素数さん:2014/11/19(水) 22:42:38.15
この資格取ると何か良いことあるの?
169132人目の素数さん:2014/11/19(水) 23:46:33.55
良いことを求めて受けるわけじゃないから
いいことがあるかどうかは知らん。
170132人目の素数さん:2014/11/20(木) 07:08:01.51
ホームページによれば来年の6月試験から準1級試験を開始するらしい。
171132人目の素数さん:2014/11/21(金) 13:45:15.25
ちょっと解いてくれ

非負実数値をとる確率変数X,Yが互いに独立であるとする。それぞれの分布関数をFX(x),FY(x) (x≧0)とするとき、X-Yの分布関数P(X-Y≦x) (-∞≦x≦∞)を求めよ

東大の友達に聞いてもわからんとよ
172132人目の素数さん:2014/11/21(金) 19:12:41.98
173132人目の素数さん:2014/11/22(土) 16:52:00.73
それでよし
174132人目の素数さん:2014/11/23(日) 20:56:44.89
2要因混合計画の交互作用ってなんで被験者内要因として扱われるの?
S×A×BじゃなくてS×Bの自由度使うのが良く分からない

誰か詳しい人教えちくり
175132人目の素数さん:2014/11/23(日) 22:18:42.81
なんか色々心配になってくる質問だな

ググったら出てきたサイト
http://mcn-www.jwu.ac.jp/~kuto/kogo_lab/psi-home/stat2000/DATA/08/09.HTM
その三というのが2要因混合計画にあたるんだが(次のページでもう少し詳しく説明されてる)、
一人あたりの条件Aと条件Bの全組み合わせデータが得られていないので、S×A×Bは見れない

その一その二その三と例を眺めればなにか気づくんじゃないかな
176132人目の素数さん:2014/11/23(日) 22:47:19.23
>>175
一人あたりの条件Aと条件Bの組み合わせ とは
理解力なくてすまぬ
177pH7.74:2014/11/24(月) 00:10:29.02
自分の書き方が悪かった、すまん

>>175のリンク先の人名が載ってる表を見て欲しいんだけど、
その二では佐伯さん等について6通りの組み合わせすべてのデータが得られているのに対し、
その三(混合計画)では村山さん等について3通りしかデータが得られていない
つまりS(個人差)×A×Bは該当するデータが無いので解析できない、ということ
178132人目の素数さん:2014/11/24(月) 00:40:39.36
>>177

いや答えてくれるだけ感謝や

その一も一人における全通り分は得られてないけど?
179132人目の素数さん:2014/11/24(月) 01:29:16.25
>>178
うん、そう
だから個人に個人差の扱いがその一〜三で変わってくる
その一では一人一データだからS、その二ではSxAxB、その三ではSxB、という風になっている
180132人目の素数さん:2014/11/24(月) 01:48:53.86
>>179
何回もありがとう
なんとなく分かってきた
181132人目の素数さん:2014/11/25(火) 23:03:24.28
検定の準備できてねえ・・・
182132人目の素数さん:2014/11/25(火) 23:56:13.46
183132人目の素数さん:2014/11/29(土) 14:45:38.41
つい気になり覗いてしまう白痴君であったwww
184132人目の素数さん:2014/12/08(月) 00:03:56.03
この板に書き込むのが初めてなので質問の仕方が合っているか分かりませんが質問させて頂きます

全国(or1世帯あたり)でのゲーム機保有台数の載っているサイトは無いでしょうか?
一応総務省の統計データやググって出てくるPDFなどを読みましたが有りませんでした
どなたか知っている方が居られれば教えていただきたいです
185おらうーたん ◆Xw3H6Ylrn2 :2014/12/09(火) 19:08:43.21
数学を中学レベルくらいの基礎から統計学に必要なものだけに絞って勉強するとしたらどうすればいい
統計学はこれからくる学問だと思う
186132人目の素数さん:2014/12/09(火) 19:55:18.43
ごく普通に、大学のカリキュラム通りに、微積分→確率・統計
187132人目の素数さん:2014/12/09(火) 23:42:00.73
尤度比をλとしたとき-2logλは近似的にカイ二乗分布に従う

これどうしてこうなるのか誰か詳しく教えてくれ
手持ちの本見ても定理の一言で済ませてやがるちくしょう
188132人目の素数さん:2014/12/10(水) 09:51:50.28
確率論
189おらうーたん ◆Xw3H6Ylrn2 :2014/12/10(水) 20:25:32.06
>>186
大学は文系なんだが公認会計士で統計学選択しようと思っている
データサイエンスに興味がある
190132人目の素数さん:2014/12/10(水) 20:25:38.53
統計学、あるいは統計学の基礎となる範囲の確率論で、確率積分を使う機会はありますか?
191132人目の素数さん:2014/12/10(水) 23:53:52.28
>>189
データサイエンスは確率論よりもまずはプログラミング

>>190
ある
192おらうーたん ◆Xw3H6Ylrn2 :2014/12/11(木) 07:19:18.10
>>191
プログラミングはもちろん必要だ
でもそれはまた別のカテゴリーになる
データを分析するのに統計的思考が必要になってくる
193132人目の素数さん:2014/12/11(木) 13:27:07.05
>>192
統計検定を下の級から順番に受けていったら?
数学検定も。
194190:2014/12/11(木) 18:30:21.52
>>191
マジっすか…
195おらうーたん ◆Xw3H6Ylrn2 :2014/12/11(木) 19:55:51.98
検定とかはどうなんだ
あくまで最短距離をあゆみたい
196132人目の素数さん:2014/12/11(木) 20:38:09.93
数学向いてないよ
197132人目の素数さん:2014/12/11(木) 22:15:20.03
『漫画でわかる統計学』でも読んどけ
タイトルから想像されるような酷い内容ではないから
198おらうーたん ◆Xw3H6Ylrn2 :2014/12/12(金) 12:30:46.28
それはみた
鳥居先生の本ってどうなの?評判いいみたいだが
199132人目の素数さん:2014/12/19(金) 08:58:40.75
統計用語と実際の計算を教えて下さい。

掃除の危険度を計算するとします。
転んでケガをする危険度(確率)が0.1だとします。
塩素系の洗剤の危険度が0.0001だとします。
酸素系の洗剤の危険度も0.0001だとます。

塩素系と酸素系が合わさると危険度が0.7になるとします。
この2つの要素が合わさると寄与率が高まる事を統計用語で何と言いますか?
タバコだけ酒だけではリスクが低いが合わさると高まるみたいな時にどんな用語を使いますか?

実際の計算式はどうなりますか?
200132人目の素数さん:2014/12/19(金) 23:28:00.59
交互作用が存在する

危険度=転倒+塩素系+酸素系+a×転倒×塩素系+b×転倒×酸素系+c×塩素系×酸素系+d×転倒×塩素系×酸素系

>>199の情報だけでは各交互作用のパラメータa,b,c,dの具体的な数値は求められない
201132人目の素数さん:2014/12/19(金) 23:37:51.12
単純化して考えた時の話ね
きちんと考える場合には誤差構造に二項分布を仮定するなどもうちょい複雑になる
202132人目の素数さん:2014/12/20(土) 01:52:43.48
階差系列とは何ですか
ググっても用語解説が出てこないんですが
203132人目の素数さん:2014/12/20(土) 02:36:56.71
名前のまんまだろwww
204132人目の素数さん:2014/12/20(土) 03:10:20.76
あぼーんされてて見えない・・・
205132人目の素数さん:2014/12/23(火) 00:06:09.39
>>202
{a_n}の階差系列は{a_(n+1) - a_n}
206132人目の素数さん:2014/12/30(火) 20:47:03.52 ID:/QNwFcA5
教えて下さい

私達の分野(医療)で改善率という指標があるのですが、ある評価基準について、満点を100点として、治療前の点数が治療後に100点にどれぐらい近づいたかということで表されます。

例えば、治療前60点が90点になったら,
(90-60)/(100-60)=0.75
という具合です。治療後100点になれば1、治療後に治療前より点数が悪化すればマイナスとなります。この手法の問題は治療前の点数が100点だった場合には計算できないことにあります。

私の質問は、治療前の点数が100点だった患者を含んでいた場合の統計処理方法についてです。
(治療前100点でなぜ治療を受けるのかという点ですが、主の治療目的と別の、副次的な項目についての治療効果を調査したいためです。)

以下の2つの方法を考えたのですが、2.についての統計手法が分からずに困っています。

1. 100点だった患者を除いて、各患者の治療前後の改善率を計算、その平均について各治療法間で比較する。
2. 100点だった患者を含めて、治療前の点数の平均と、治療後の点数の平均を算出し、平均値の改善率について各治療法間で比較する。

1.については、治療法ごとの平均値の検定で対応できますが、2.については、治療法ごとの改善率を計算することは出来ますが、その差について有意かどうかの検定方法がわかりませんでした。

よろしくおねがいします。
207132人目の素数さん:2014/12/30(火) 23:52:15.53 ID:T/05DdMn
治療前の点数が100点だったということは、検査値に異常はないのに
患者さんにとっては具合の悪い自覚や他覚があるってことでしょ。
検査値に出てこないものを数値化しようとする時点で無理があるんじゃね
208イスラム金融系最高指導者遅獄先生−主対性卓上理論より実戦:2014/12/31(水) 00:02:13.31 ID:0KCnEDKk
異常な性欲とか。
209132人目の素数さん:2014/12/31(水) 00:20:19.24 ID:n7EcaxHl
正直まじあるかも。どっからどう見ても体に出てるだろ、けど検査値
異常なしって鈍感なおれが見てもたまにある。ただ検査値にあがってこないだけで。
めっちゃ悩む
210132人目の素数さん:2014/12/31(水) 06:54:00.37 ID:alDLCv0+
ありがとう。あくまで例えですが、もう少し具体的に説明します。
歯の治療をしたときに、肩こりが良くなるか、良くなるなら歯の治療の方法によって違うか、みたいなことを調査したい時。
治療前に肩こりが全くない人(100点)、とてつもなくひどい人(0点)とすると、

歯科治療A(患者1、患者2、患者3、患者4、患者5)として、
治療前、
100、80、60、40、20
治療後、
100、75、85、75、80

歯科治療B(患者6、患者7、患者8、患者9、患者10)として、
100、100、90、80、70
治療後
100、90、90、95、90

みたいな状況です。
治療前100点の患者1、患者6、患者7を除いて個々の患者の改善率を平均すると、治療A 0.43、治療B 0.47、
すべての患者の治療前の平均、治療後の平均を用いて改善率を計算すると、治療A 0.58、治療B 0.42
となります。

治療前100点の人が100点のままなのも意味があることだし、80点とかに悪化するようなケースを無視して優劣をきめるのもどうかと思ったわけです。
211132人目の素数さん:2014/12/31(水) 08:33:30.48 ID:4vvJaIXJ
>>210
治療法Bの副作用とかで悪化した度合いを数値化してやればいいだけでは?
(90-100)/100=-0.1とか
元々が100だったら100で割る
212132人目の素数さん:2014/12/31(水) 08:41:45.17 ID:4vvJaIXJ
>>211
元の改善率は改善する方向の余裕のうちどのくらいの割合で改善したかを表すものだった
ところが治療前が100だと改善方向の余地は無い
そこで悪化方向の余地のうちどのくらいの割合で悪化したかを表して、符号を改善方向に合わせると言う考え方
213132人目の素数さん:2014/12/31(水) 09:58:25.27 ID:n7EcaxHl
カンだけど、いくつかの治療法があっても上手くいかない場合
たとえば今まで痛くなかったのに痛くなったとか、かえって悪く
されたんじゃないかとか、実際あってはならないことへの線引の
基準って気がする。歯医者は底辺でそんなに凄いことにはなっては
いかないけど
214132人目の素数さん:2014/12/31(水) 10:53:13.69 ID:n7EcaxHl
>>210氏、気をつけなよ
紙の上ならいいけど時として生きるか死ぬかって患者さん家族とトラブったら
まじ人生詰んじゃうって聞く。ヤバそうだなっと思ったら大きな病院に送るとかw
215132人目の素数さん:2014/12/31(水) 11:29:35.38 ID:Ppgm7xRW
>>210
官能検査の範疇じゃないかと思う。
それと何となくだけど、株価チャートやWACCのβ値を出す時のような発想が使えるんじゃない?

こんなのが参考になると良いんだけど。
http://www.asevjpn.wine.yamanashi.ac.jp/JAJ/Vol/Vol-8-1997/2/105.pdf
216206, 210:2014/12/31(水) 11:51:51.51 ID:alDLCv0+
>>211, 212
ありがとう。参考になります。
ただ、そうすると、100点が99点の場合は-1/100ですが、
99点が98点になったときに、-1とするか、-1/99とするのか
さらに、99点が100点になったとき1とするのか、1/99とするのか、
という新たな問題がでてきてしまいます。

もともと、この評価方法自体が、60点から100点への改善と80点から100点への改善が同じ価値になってしまうなど、突っ込みどころが多い方法なのです。
かといって、単純に差で比較するのも、20点が60点になることと、60点が100点になることが同じ価値になってしまうのもどうかと思います(この場合は後車の方が圧倒的に満足度は高い)。

もっと良い方法があるとよいのですが。

>>213, 214
たしかに、一人の患者さんを相手にするときは、こんな紙の上の計算は役にたたないんですが、自分の治療法や他人の治療法が本当に意味があるのの物差しとして、統計などの紙の上の勉強が必要になるんです。
217132人目の素数さん:2014/12/31(水) 12:51:12.84 ID:bb7+HhvI
(y2 - y1)/(100.001 - y1)とでもすれば充分な精度に思えるが駄目なんか?
218132人目の素数さん:2014/12/31(水) 16:29:38.35 ID:GWYkp0m4
肩こり治療に対して、有意かどうかは単に2群のt検定をすれば良いのでは。
219132人目の素数さん:2014/12/31(水) 16:46:22.80 ID:HG1JPiIG
t検定は正規の仮定があるから使えないのでは
あくまで改善率にこだわるなら2つの改善率の比較したほうがいいと思うけど
ノンパラの検定になりそうでめんどくさそう
220206, 210:2014/12/31(水) 18:43:22.81 ID:alDLCv0+
>>215
官能検査やβ値始めて知りました。完全には理解できていませんが、面白いですね。
導入できないか考えてみます。

>>217
それだと、100点が100点になったときの改善率0となってしまうのがちょっとよくないんです。

>>218, 219
両郡の治療前の点数がそろっていれば、単純に治療後の点数に対して、t検定なりノンパラの検定なりで比較しればいいんですが、
今回のケースでは治療前の点数がそろっていないことをどうするかということが問題になっています。
自分の分野ではこの改善率という方法をつかうのですが、いろいろ問題があって困っています。
221132人目の素数さん:2014/12/31(水) 19:39:20.71 ID:U92I1NFj
>>220
いや改善率の二群ね
2つの改善率を比較してるんでしょ?

それか回帰にして100の場合をダミーにするか
変数とデータが十分にあれば意味があるかな
222132人目の素数さん:2015/01/01(木) 09:04:31.27 ID:RpMTMml6
>>216
治療前が100の時だけ例外計算する
元々の改善率の計算も治療前が100だと計算出来ないわけだし

あと改善率と言うからには100→100の改善率は0で良いと思うけど

治療前が100の時は近似的に99として改善率を計算するのでも良くない?
どれくらいの精度が必要か知らないけど
223132人目の素数さん:2015/01/01(木) 10:12:49.04 ID:taQAZBt3
>>222
それは一番やっちゃいけない
悪化する可能性もあるんだし、pハックとやってること変わらん
224132人目の素数さん:2015/01/01(木) 13:42:42.57 ID:GIFDCViJ
>>206
医学(疫学)の人間だけど、改善率って初めて聞いた。
治療前100点の患者を除くと、
治療後に悪化する(つまり100点を下回る)ケースの情報が欠落する。
やっちゃダメだ。
こんなところで質問するよりも、
改善率をアウトカムにした先行研究と同じ方法をとるのが無難だよ。
自分で勝手に定義しても良いアウトカムなら、
>>217のように、無限大になる指標を補正するときによく使われる手を使う。
補正パラメータを0.001として、
(治療後 - 治療前)/(100 - 治療前 + 0.001)とかね。
結果的に>>217と何にも変わらないが。
225206, 210:2015/01/01(木) 17:02:38.24 ID:T4gJkiRG
あけましておめでとうございます。
皆さんありがとうございます。だいぶ理解できました。

>>224
多分医学のなかでも、こういうやり方をつかっているのは私達の分野(整形外科)だけなのかもしれません。
改善率をアウトカムにした先行研究は基本的に、もともと調子悪いところの改善率を対象にしているので、inclusion criteriaで治療前70点以下などになっていて100点を含まないものがほとんどなんです。

補正パラ-メーターを使用して、改善率をノンパラの検定でやってみます。

よく考えずに、プロトコルに改善率をアウトカムに入れてしまい、いざ解析を始めてから困ってしまったんですが、
この研究では、改善率をアウトカムすること自体が、適していないような気がしてきました。
226132人目の素数さん:2015/01/01(木) 17:09:40.26 ID:++9ydPEY
>>225
まぁというか、ちゃんと統計学者に聞いたほうがいいぞ
ここじゃ細かい話はできないし、特にパブにするなら、ちゃんとやったほうがいいと思うけど
227132人目の素数さん:2015/01/01(木) 19:10:27.65 ID:h45GTyQ/
研究者のための統計的方法 POD版
R.A. フィッシャー(原著) 防衛大学教授・武蔵工業大学教授遠藤 健児(訳) 一橋大学教授鍋谷 清治(訳)
https://www.morikita.co.jp/books/book/2641

これって、どのレベルの人が対象ですか?
228132人目の素数さん:2015/01/03(土) 21:27:24.85 ID:FB3syuDN
時間あるなら原著でもOKレベルの人
229132人目の素数さん:2015/01/04(日) 21:17:49.51 ID:81Vyorrh
【趣味】 確率・統計をマスターし、色々分析して遊びたい。 いい勉強法を教えて!
http://fox.2ch.net/test/read.cgi/poverty/1420352343/
230132人目の素数さん:2015/01/06(火) 03:15:58.36 ID:MgO4Zjal
統計学全然わかんねえんだが実験結果の統計結果を出せって言われた・・・
助けてくれ
231132人目の素数さん:2015/01/06(火) 09:41:28.45 ID:LTSPAERy
平均と分散、最大値と最小値、中央値と四分位
比較があるなら各種検定でOK
232132人目の素数さん:2015/01/06(火) 12:20:05.65 ID:6GgrnzU3
水の入ったコップをガラスにぶちまけると、ガラスに水滴模様ができますよね。

それを何千回繰り返して、同じ水滴模様が出来る確率を割り出すのは

ほぼ不可能ですか?
233132人目の素数さん:2015/01/06(火) 12:36:50.79 ID:WQ4/0aPu
実際に何億回かやってみて調べたらいい
234132人目の素数さん:2015/01/07(水) 13:08:36.69 ID:ps+aCHty
統計数理研究所について語るスレ
http://wc2014.2ch.net/test/read.cgi/math/1405864800/
235132人目の素数さん:2015/01/12(月) 15:10:21.81 ID:W7R9hi0X
>232
冗談で言ってるのはわかるけど、
・ぶちまける先のガラスの大きさと
・同じ模様の定義
くらい書かかないと、ほんとのウソにしか見えないじゃん。
前提がそろってないから、ほぼでなく、完全に不可能。
236132人目の素数さん:2015/01/18(日) 14:12:56.62 ID:JQZIoFpc
N(0,1)^2〜Γ(x.y)となるx,yを求めよという問題で、

N(0,1)^2の分布関数が、
Φ(x)をXの分布関数とした時、
F:N(0.1)^2 = Φ(√x)-Φ(-√x)となるところまではわかるのですが、

そこから両辺微分して
=1/(√2πx)*e^(-1/2*x)

となるようなのですがその過程がわかりません。

(密度関数 1/(√2π)*e^(-X^2/2)を
区間 -√x〜√x で積分したものを微分する気がするのですが、、、)

よろしくお願いいたします
237132人目の素数さん:2015/01/19(月) 06:06:47.21 ID:erqMKexI
標準正規分布に従う確率変数の二乗はカイ自乗分布に従う。
238132人目の素数さん:2015/01/19(月) 08:07:08.43 ID:bsIfojga
表記方法がひどい
239132人目の素数さん:2015/01/19(月) 16:13:05.02 ID:eer0kKel
解析の勉強しろ
240132人目の素数さん:2015/01/23(金) 00:07:09.15 ID:9WufqE3P
大学生の名前から、ベイズ統計で親の年収と学歴を推定できるの?
640 :自治スレでLR変更等議論中@転載は禁止:2015/01/18(日) 17:38:49.90 ID:3uP4//2C0
>>630
ベイズ統計で簡単にカテゴライズ可能です。
ベイズ統計を利用してスパムメールを高精度で同定できている実績から明らかですが、
意味のないメールを高精度で同定できるのと同様に、
意味のない親から生まれた意味のない子供を高精度で同定することが悲しいけど可能です。
【社会】男の子は「蓮」、女の子は「陽菜」…「正一」「千代」の大正時代から見ると浮かび
上がる“世相” [転載禁止]c2ch.net
http://daily.2ch.net/test/read.cgi/newsplus/1421537966/625-640
241132人目の素数さん:2015/01/26(月) 16:54:07.57 ID:2TZ7aDu9
そんなのprimary outcomeにさがなかったから改善率とか出して誤魔化そう的な発想が見え見えじゃん
解析する価値すらないことに何を悩んでるのかね?
バカバカしいこと考えてないでもっときちんとしたデザインとかを考える方がずっと有用な時間の使い方な気がする
242132人目の素数さん:2015/01/28(水) 22:47:46.15 ID:EncWzv5z
キイロショウジョウバエの野生型+の雄と、常染色体上の劣性突然変異遺伝子である黒檀色eホモ接合体の雌を交配したところ、F2では、各表現型について下に示す数の個体が得られたとする
243132人目の素数さん:2015/01/28(水) 22:50:07.76 ID:EncWzv5z
この結果は、+:e=3:1、♀:♂=1:1と合致してるが、メンデルの遺伝の法則から考えられる分離比といえるかどうか、カイ二乗法を用いて検定し、その結果について考察せよ
244132人目の素数さん:2015/01/28(水) 22:51:53.00 ID:EncWzv5z
有意水準5%、カイ二乗分布の累積確率は自由度1、2、3でそれぞれ3.841、5.991、7.815である
245132人目の素数さん:2015/01/28(水) 23:03:15.42 ID:EncWzv5z
+♀70、+♂50、e♀10、e♂30
よろしくお願いいたします
246132人目の素数さん:2015/01/29(木) 00:45:03.84 ID:FiuFnc5x
お願いしますじゃねえよw
247132人目の素数さん:2015/01/29(木) 11:14:13.36 ID:uonxqDkL
すいません、自分なりに解いてはみたのですがそれが正しいのかわからないので質問しました。期待分離比をメンデルの独立の法則の9:3:3:1で考えて検定した結果独立の法則の分離比とは異なるという結果になりました
248132人目の素数さん:2015/01/29(木) 11:18:52.49 ID:uonxqDkL
ただ、一つ引っ掛かったことがあって、問題には自由度が3つ提示されているのですが上でやったような場合だと自由度は3しか使いません。自由度1、2は無視しても良いのでしょうか?または、優劣の法則の分離比などの検定も行うということでしょうか?
249132人目の素数さん:2015/01/29(木) 17:54:30.94 ID:QAozLVEM
松岡修造がいる場所の気温が高いことについて
有意な相関関係はありますでしょうか?w
250132人目の素数さん:2015/01/30(金) 00:04:57.28 ID:pBTFcrp4
9:3:3:1w
251132人目の素数さん:2015/01/30(金) 11:51:01.46 ID:9E7Lex3F
>>250
そもそも期待分離比が間違っているのでしょうか?
252132人目の素数さん:2015/01/30(金) 11:53:05.74 ID:SNBtNooL
修造がいる場所の気温が高くなったデータと、
修造がいなくなった場所の気温が低くなったデータと、
両方あつめて分析しないとだめだぞ。
253132人目の素数さん:2015/02/02(月) 08:07:03.38 ID:WYHa2M92
>>245
クロス集計表を使って適合度検定かな
性別と+eの2次元の表で
理論値と観測値の適合度を計算する
254132人目の素数さん:2015/02/03(火) 15:45:00.16 ID:Ly2n71PL
統計上、秋田県産少女の体格は全国有数?
【教育】5〜17歳の体格、秋田は全国トップ級...肥満・虫歯の割合も高め - 学校保健統計調査 [15/02/01]c2ch.net
http://daily.2ch.net/test/read.cgi/newsplus/1422773221/
255132人目の素数さん:2015/02/05(木) 04:18:39.83 ID:cIaVTD9D
256132人目の素数さん:2015/02/07(土) 17:35:26.78 ID:yWY668R4
>>244
有意水準の定例値5%の出所が、この専門誌1月号に記述されていますね。
検定と推定・再入門 第1回 検定の考え方―有意水準 5%説はどこからか 
『標準化と品質管理』 Vol.68  2015年1月号 
http://www.webstore.jsa.or.jp/lib/lib.asp?fn=magazine/mg1_1501.htm
257ぽてちん:2015/03/08(日) 01:32:39.13 ID:3ZOvz2UX
質問です。株やってます。高卒です。
100円の株価が9割位の確率で10分以内に103円になります。9.5割位の確率で15分以内に108円になります。1割位の確率で15分以内に90円になります。
ただし、これらは平均しての結果であり、場合によってはもっと極端な値をつけることもあります。その場合、70円とか、マイナスの場合のほうが幅が大きいです。

さて、これらを踏まえ、利益確定・ロスカットの値段、時刻を決めたいと思います。
自分なりに統計データは取っており、利益確定・ロスカットの値段は決めていますが、感覚的なものなのでアテになりません。
トレードにおける感覚は全くアテにならないということも分かってきました。
つきましては、どのようなデータを取り、どのような判断で利益確定・ロスカット値段、時刻などを決めればよいでしょうか。

スレチであれば申し訳ありません。また、スレチである場合、どの板で質問すれば良いでしょうか。
何卒、高卒無職に知恵をお授けください。よろしくお願いします。
258ぽてちん:2015/03/08(日) 01:35:01.60 ID:3ZOvz2UX
ちなみに上記の結果をもとに感覚をもとにしたトレードを繰り返した結果、資金は微増程度で、全く儲かっておりません。
259ぽてちん:2015/03/08(日) 01:36:40.16 ID:3ZOvz2UX
儲かっていない理由は損失がデカくなる傾向にあるためです。
勝率はまあまあ高いのですが、たまにやるロスカットがデカいのです。
260ぽてちん:2015/03/08(日) 01:47:04.21 ID:3ZOvz2UX
あと、9.5割位の確率で108円と言うのは、いったん大きく下げてから急騰している場合も含みます。
この場合にブン投げ(泣きわめきながらロスカットすること)する場合も少なくありません。
2時間くらい我慢していたら結局+10%以上儲かっていた、なんてことも少なくないです。
261ぽてちん:2015/03/08(日) 02:14:29.48 ID:3ZOvz2UX
連投、失礼いたします。
感覚的なものが当てにならないと言うのは、最近のノーベル経済学賞の結果だけ読んだら、人間の本能として状況によってリスク選好の度合いが変化してしまうとのことでした。
損失が出ているとハイリスクを取り、利益が出ているとリスクを取らない、という行動パターンが本能として固定的であるため、結果が悪くなってしまうということです。
これは教育や訓練の程度によらない、本能的なものらしいです。
結論として、統計データをもとに機械的にトレードするほうが効率が良いらしいのです。
262ぽてちん:2015/03/08(日) 04:44:09.48 ID:3ZOvz2UX
つまり、かなり高確率で値上がりするが、下がるときには大きく下げてしまう。
しかも、値上がっていてもどこで反転、下落するかわからない。
そういう場合に、価格及び時間の両面で売るタイミングを決めておきたいわけです。

損切り値を少しでも上に上げると、すぐにそこに引っかかってしまい、勝率が下がる。
下にすると引っかかりづらくはなり、勝率も上がるが損が大きくなる。
もっと下にすると勝率はさらに上がるが損が大きくなる。

そこで、試行回数を増やした場合にトータルの利益が最大となるような最適値を割り出したいのです。
263132人目の素数さん:2015/03/08(日) 11:39:20.43 ID:gsVCqW4q
264ぽてちん:2015/03/08(日) 14:18:05.24 ID:3ZOvz2UX
>>263
レスポンスありがとうございます。
投資板、株式板では数学を背景にした回答はまず期待できません。そういうスレも一部にありますが、商材屋さんのステマとかが多いんです。
また、自分は初心者でもないんです。
265132人目の素数さん:2015/03/08(日) 15:01:20.97 ID:ZzmWmOvl
>>257
いくら払える?
266ぽてちん:2015/03/08(日) 15:15:17.05 ID:3ZOvz2UX
>>265
申し訳ありませんが、儲かってないので払えません。
でも経験上知り得たことをお教えすることはできますよ。
この板の知恵ある方々にはそんなもの必要ないでしょうが…。
267132人目の素数さん:2015/03/08(日) 17:02:54.28 ID:ZzmWmOvl
>>266
さようなら
268132人目の素数さん:2015/03/08(日) 17:54:03.90 ID:9KOGAmGB
頭が悪いのにギャンブルやる奴は屑だということがよくわかる
269132人目の素数さん:2015/03/08(日) 18:08:52.56 ID:7BNOjHFB
rのdecompについて調べようと思ったら画像がやばかった
270132人目の素数さん:2015/03/08(日) 21:58:21.81 ID:wvtLZrJH
>>269
キノコおいしそうだお
271ぽてちん
デコンプみたいなの使えば良いのですか?
使い方がわからないけど…