統計検定HPの2級の過去問の問11[1]の解答が2番になってるけど3番の間違いではないか? これどなたか教えてください!
2だよしつこいなw 納得しなさい
/200!?
なんで2なの???
もうこの話題はやめないか。馬鹿らしいから。
説明できないの?
放置しとけよwwwww 構うほうもバカww
いやいや説明できるなら説明すればする終わる話題だろ 説明できないで逃げようとするからいつまでも追いかけられるんだよ
その前に問題をアップしろよ。
ある組立工場では,作業内事故の低減に努めている。この工場の 2 つの部署でそ れぞれ起こった 1 日あたりの事故数 y について 200 日間記録した。この期間内で の,部署 A の事故数の平均 y ̄A は 11.8 件,標準偏差 sA は 2.4 件であり,部署 B の事故数の平均 y ̄B は 8.1 件,標準偏差 sB は 2.0 件であった。労務担当者は,これ ら 2 つの部署間で事故数に違いがあるかどうか検討することにした。ただし,事故 数は部署ごと,日ごとに独立であり,母分散が等しいと仮定して有意水準 5% で評 価するものとする。 〔1〕まず,2 つの部署の事故数の合成した分散 s^2 を,2 つの部署の標準偏差 sA,sB から求める。その s^2 の式として正しいものはどれか。次の 1 〜 5 のうちから 適切なものを一つ選べ。
>>11 s^2=[(200-1)sA^2+(200-1)sB^2]/(200+200-2)=[sA^2+sB^2]/2
うむ。よろしい。
線形結合して共分散が0で s^2=sA^2+sB^2 じゃ無いの?
>>14 合成と合計がごっちゃになっている、ようするにt検定をやろうとしていることを留意しよう
>>14 は分散の合計で、(A,B二部署からなる)工場で起こる事故数の分散だ
求めたいのは1部署で起こる事故数の分散の推定値
ただ[1]だけだと
>>14 になるようにも読めるので、選択肢に
>>14 が無いんだと思う
試験勉強してる人なら2群の平均の差のt検定の式で即座に
>>12 が思い浮かぶはず
>>15 母分散が等しいと仮定しているから
母分散の点推定値として分散の平均を使うってこと?
そうか、統計検定2級程度も受かるか怪しい奴らが このスレにたくさんいるってことだな。
その発言は逆に君の馬鹿さを露わにするぞ ここに書き込むために有形無形を問わず何か関門でもあったか?
>>19 そうか、馬鹿はそういう発想をして自分を慰めるんだな。
等分散仮定下での合併分散の式がなんで↓になるのかなんて、正直考えたこともなかった { (m-1)Va + (n-1)Vb } / (m+n-2) 誰か賢い人教えてor良い参考資料紹介してくだせー
>>21 >>19 を統計検定2級程度も受かるか怪しい奴と決めつけることで自分を慰めている、と受け取れる
>>23 そうか、馬鹿はそういう受け取り方をするんだな。
26 :
22 :2014/09/12(金) 23:57:43.48
各群からの推定母平均(μa, μb), プールデータからの推定母平均(μe)
>>22 式から、
Σ{(ai -μa)^2} + Σ{(bi - μb)^2} = Σ{(ai -μe)^2} + Σ{(bi - μe)^2}
が導かれるけど、計算したら左から右になるんで?
それともμa = μb = μe を仮定?
統計検定の過去問の質問をした者だが 俺のおかげでスレが盛り上がってよかったね
>>25 そうか、ごめんな、馬鹿よばわりして。
正直者なんで本音がでちゃった。
ちなみにこのスレの半分は俺が書き込んでるのでよろしくw
結論としては 統計検定2級すら受からない馬鹿が このスレに大勢いるということですか?
>>29 相変らず性格悪いですね。偏差値70超えてますよ。
>>26 標本集合A+標本集合Bを標本集合C
と考えたら
(ai-μa)^2+(bi-μb)^2=(ci-μc)^2
じゃね?
sA^2がna度数、sB^2がnb度数観測された
と考えたら
(na*sA^2+nb*sB^2)/(na+nb)
>>31 上の方は一般には成り立たないかも
例えばAとBが左右に離れていた場合
Cの値は大きな値になりそう
統計学がブームとかすごいステマ臭がするんだけど こんなのやって一体何の役に立つんだ?
ギャンブルしなくなる。
35 :
132人目の素数さん :2014/09/14(日) 02:41:31.43
正規分布でない(ピークが無いフラットな)標本で、 「母集団と個体の関係、個体間の相対関係」に絞り適当に把握したい場合 (他グループとの比較やパーセンタイルは除外)、 学力の偏差値計算を用いた場合の問題点を教えてください。
>>26 t分布を使って母平均の差を検定するから
帰無仮説として母平均の差=0を置く
そうした帰無仮説の元で計算した値と
標本から計算した値を比較する
そしてt分布で有意水準以下の確率だったら帰無仮説を棄却する
>>36 補足
だからμa=μb=μeは帰無仮説を数式で表したもの
好きな確率分布を教えてください
Aさん、Bさん、Cさんの3人のテストの得点が 平均 ua, ub, uc 標準偏差 σa, σb, σc の正規分布となる場合、Aさんが3人の中で一番点数が高い確率は?
>>39 NB>NC ∩ NA>NB の確率と
NC>NB ∩ NA>NC の確率との和
共分散が判らないから計算できなくね?
>>36-37 なるほど、すっきりしました
どうもありがとうございます
42 :
132人目の素数さん :2014/09/20(土) 21:04:18.18
統計検定2級って言ったらスゲーじゃん!誰でもホイホイ撮れるもんじゃねぇやん
2級の合格率見たら47.87 %だった。 おれの持ってる資格は合格率数%のものばかりなんでたぶんすごくないと思う。
過去問見る限り2級はヘボい 1級と2級の差は相当ある、英検とかと一緒だな 2級落ちてるやつは強制受験か棚ボタ狙いだろ ちゃんと勉強したのに2級落ちるやつは残念ながら相当頭弱い
受かってない奴がドヤ顔でwww
おれもここで初めて存在を知ったし、受験地も東京と大阪だけだし、 受験者数も1000人程度と少ないし、一体誰が受けているんだろう?
始まってそんな経ってないんじゃないか
>>46 相当、統計に自信がある強者ばかりが受験している最高峰の試験だよ。俺はかなり出来る方だけど、まだ3級挑戦中
RSS/JSSのほうもあるね 高いけど
>>48 その割には半端なく合格率高いし、問題が簡単ですねw
実地で統計使ったことある人なら2級まではカスみたいなもんだろ 座学オンリーの奴には難しいのかもしれん
子どもの勉強と違って「わからないことがあったら質問できる人」が 存在するかどうかがとても大きい。
大学受験合格率 A判定 80% B判定 65% 10000人のA判定の人間が試験を受けたら2000人は落ちる計算 嘘つけよ 実際そんなに落ちてねーだろ ちゃんと数えて統計採れよ 80%は事実上の98%くらいだろ それでも200人は落ちるって考えられんけどな そこまでの御墨付きをもらって何をどうやったら 落ちるんだよ 不調でも受かるだろ
??
しっ見ちゃいけません
統計検定の受検対策にはアクチュアリーの過去問がいいね
SPSSとJSTATってそこまで検定結果に差が出たりします? ANOVAとF検定、Tukeyによる多重比較くらいしかしませんが…
ドアホ 同じことやらせたら同じ結果がでるに決まってるだろ 各ソフトで同じことやってるのか違うことやってるのか解らない脳なしはSPSSでがちゃがちゃぽんやってろ ま、p値算出以外ならExcelでいけるような検定なら好きなソフト使えばいいよ
ソフトの信頼性がどうなのか聞きたいんじゃない? 聞き方がアホなのには変わりないけど
だったら複数ソフトで同じデータの検定すれば良くね? データ量が多くなければ手計算もやって正しいかを確かめれば良い。
>>58 基本的なのだったらpeachもExcelで計算できる
T検定とかanovaとか
単回帰分析で惜しくもp<0.05にならなかった因子が、 重回帰分析で他の因子との組み合わせによりp<0.05になることはありえますか?
とりあえず
>>62 は回帰分析についてまるで解っていないことが解った
勉強しろ、率直にいって凄く間抜けな質問してるぞ?
ありえるに決まってる
例えば「体重」の「身長」による単回帰分析と「身長」と「ウエストサイズ」による重回帰分析を考える
「体重」よりも「ウエストサイズ(つまり体型)による影響を取り除いた体重」の方が「身長」ときれいに相関するだろうから、
重回帰分析の方が「身長」のp値は下がる
>>63 3回読んで納得しました。
ありがとうございました。
つーかある因子のp値から逆算して他因子を考慮するか考えるなんて、クソにもほどがある
>>1 スレ趣旨テンプレを省略するなよ。
以下のお約束を守った上で統計学について何でもどうぞ。
1)学校の宿題の丸投げはやめましょう。
2)質問者は質問の前に相当程度調べるなり、考えるなりしましょう。
3)荒らしは基本的にスルーでお願いします。
>>66 スレ趣旨テンプレは同意するが、関連スレは居るか?特に死んでるスレ
73 :
132人目の素数さん :2014/10/04(土) 04:57:32.32
質問の仕方でアンケートの結果が変わるって言うけど その質問の仕方の違いによるアンケート結果の違いの統計ってないの?
そんぐらい自分で探せよ・・・ ありがちなテーマだし先行研究なんぞ山ほどあるでしょ
レジの違算に関してですが、違算に作為が無ければ長い目で見れば結局は±0で落ち着くと言うことで大丈夫ですか? お釣りが少ない場合は言いに来るは排除で。 知り合いの相談で聞けば聞くほど可笑しいなと思ったので。 そもそもマイナスの違算ばっかりなのに客からお釣りが少ないと言われた事が一度も無いらしい。 など総合的に考えて作為を疑っているので意見をお願いします。
昔のコンビニバイトの経験からの話なんだが、レジミスは長期的に見て±0には絶対にならない なんでかというと、レジは大抵弾くような動作を繰り替えして金を取るんだが(基本的に1弾きで1枚)、 人間の感覚的にいって、1弾きで2枚取ったことを見逃す率よりも、0枚を見逃す率のほうが明らかに少ない この動作を山ほど繰り返すため、釣り銭ミスは少なく渡すよりも多く渡す方が絶対に発生しやすい さらに、少ない場合のみその場クレームが発生する可能性があるのでこの傾向に拍車がかかる なのでレジ違算は長期的にみると基本マイナス方向に偏るため、それだけでは盗難の有無の推測は難しい しかしまぁ個人的意見だけど、店長が怪しいと感じたのなら十中八九店員が盗んでるよ ダスキンへの支払い等、レジ金を使った客以外とのやり取りの計上ミスはないというのが当然の前提だけどね
>>75 釣銭の間違い金額を確率変数として一定期間でのその分布の母平均値の点推定値が0
と言う帰無仮説を立ててT検定すれば?
仮説より事実の方が正しいと判断するのが普通だと思うけど
なぜその事実になるのかは詳しく調査しないと分からないだろうけど回帰分析とかでわかるかも
誰かの時に有意に外れているとか
78 :
132人目の素数さん :2014/10/05(日) 10:39:51.56
ANOVAか?
>>77 測定できるのは現金の実際額とレジの記録との差額だからこれを目的変数にするのかも
>>75 ですが違算のデータが無いのでアレですが参考になりました。
GJ = 1.4 HP + TMP + .72 AGR + .43 (TMP) (AGR) HP = HR^+ + LDGBR + LBI - HPM TMP = 3.6 EJG + 4.7 √PT + KR - TMPavg AGR = 1.5√T^2 + CP + 1.3HBP + 2.2TOSEB 薬物使用の証拠を示す方程式・・・ 使われてる統計手法はアレです
今更だけど、
>>75 は単位時間1レジを1標本として、
レジ違算〜会計回数+勤務従業員+会計回数:勤務従業員、で推定できそうだな
万人共通の偶発ミスなら会計回数が、ミスしやすいアホがいるなら交互作用が、
盗まれているなら勤務従業員が反応するはず
84 :
132人目の素数さん :2014/10/17(金) 19:34:46.15
クラスタリング(?)の方法について教えてください。 標本サイズ100のデータが50種類あるとします。そして、この50種類のデータは10グループ、 各グループ5種類に分類されており、グループ内の相関はあるが、グループ間の相関はないと仮定します。 ここで、各データがどのグループに所属するかが未知であるときに、50種類のデータを正しくグルーピング するアルゴリズムはあるでしょうか?もしあった場合、何種類くらいまで実際に計算できるでしょうか?
例えば「植物の成長期した長さや花の大きさと日照時間の相関関係」を調べたいときはどのような検定方法を使えばよいでしょうか たとえば日照時間をなし、二時間、四時間、六時間…と多条件を立てた場合です
すみませんこれだと相関分析ができてしまいますね では「花の長さや大きさに影響を与えるのは葉緑体の数の増減ではないか」と考えたとします 日照時間によって葉緑体の数が変わり、結果として成長に影響を与えたということです 日照時間の違いとそれによる葉緑体数の変化、その結果生じる植物の長さと花の大きさの違いの相関を見るにはどうしたらよいでしょうか
背景がわけわかめ 日照時間長い>葉緑体密度があがる>光合成効率が増える>たくさん成長する、ってこと? どっちかというと、日照時間長いとたくさん成長して葉緑体数が増える、んじゃない?? というか葉緑体数は推定値があるの?
>>88 すみません、例を挙げたまでなので意味が分かりませんね…
日照時間が長いほど成長が良いという事実が得られたとして、では成長の要因はなんだ?となったときに、葉緑体数と成長に相関関係があるのか検定するにはどうしたらよいでしょうか
>>89 >>83 みたいな交互作用を考慮した重回帰分析とか
葉緑体のレベル毎に成長を測定して分散分析とか
なのかな?
単純な相関関係なら相関係数とか回帰分析のR^2でいいような気もする
ただ相関関係が有っても因果関係の向きや直接なのか、外や間に何かあるのかは判らないのでは?
相関関係と因果関係は別物だぞ? 手持ちのコマが日照時間と最終状態(長さ、花サイズ)しかないんだったら、因果関係の検証なんぞムリ つか何が聞きたいの?例えが酷すぎる、実験系に問題あり、で終わり
92 :
132人目の素数さん :2014/10/23(木) 12:43:37.09
知恵袋の質問ですまんが、これわかる人いる? 2chだと画像の貼り方がわからん。 結構困ってるので誰か助けてくれ...
絶対、分からんわな
やっぱりそうか
96 :
132人目の素数さん :2014/10/23(木) 13:57:39.61
97 :
132人目の素数さん :2014/10/23(木) 14:08:28.71
2chに知恵袋のリンク貼って大丈夫かビクビクしてる
おめでとう、やっぱりだめだよ
>>96 まったく意味不明の所を見ると
これ以前に前提となる情報があるんだろう
100 :
132人目の素数さん :2014/10/23(木) 17:03:38.64
>>99 前提となる条件って言ってもモーメントの定義式くらいしか…
質問の意味はわかりますか…?
101 :
132人目の素数さん :2014/10/23(木) 17:05:57.35
>>99 前提となる条件って言ってもモーメントの定義式くらいしか…
質問の意味はわかりますか…?
物理板で聞いた方がよくね?
本当に正しいのこれ
統計はまったく知らない人なんですけど、教えてください 番組A 視聴率 11.8% 番組B 視聴率 10.0% 俺「番組Aに比べて番組Bは視聴率が落ちた」 友人「そうとはいえない。標本数600で調べた視聴率だから、標本誤差というのが2%超えるくらい出る。 だから意味のある差があるとはいえない」 俺「番組Bだけ誤差が発生したなんて考えられない。番組Aもその誤差が発生したとすれば結果としてでてる数字は 確かな物になるし何も変わらないじゃん」 友人「お前は馬鹿だ。さっぱりわかっていない。」 と、こんなやり取りだったんですが、俺どこかまちがってますか? 両方に誤差があるなら、結果としては同じことだと思うんですけど。 何がまちがってますか? 初心者なんで、わかりやすく説ほしいです。お願いします
105 :
132人目の素数さん :2014/10/23(木) 23:25:44.94
物理より数学に近いと思って...
>>103 多分正しいとは思うんだけど、自分で考えて計算すると最初の2項目までしかでてこない...
Σijのijに1,1を入れるとμ_2ー(μ_1)^2になってこれは標準誤差の考え方と同じで分散の定義そのもの
がでてくるんだけど、やっぱり3項目以降がなんであるのかわからん。
普通モーメントってどの次数も独立だよな...?
106 :
132人目の素数さん :2014/10/23(木) 23:32:20.58
>>104 標本数が少ないとゆらぎが大きくなる。だからその揺らぎ2%だったとして、ABの差がその揺らぎ以上
の開きがないと本当にAの視聴率のほうがいいとは言えない。例えばABと名前のついた二つのサイコロ
があったとして、5回サイコロをふった時の出た目の平均がA:3.5、B:2.9だったとする。そこから「Bのサイコロより
Aのサイコロの方が大きい目の出やすいサイコロだ」という結論を出してしまうのは間違ってるのは明らかだよね?
>>104 誤差があるので、データ通りにA>Bの大小関係があるとはいえない
例えば、目測で木の高さを測るとしよう
2本の木を同時に視界に入れて測るのではなく、1本目を単独で測った後、別の場所にある2本目の木を測る
1本目は12メートル、2本目は11メートルとなったが、目測には誤差があると考えられるので、
確実に1本目>2本目である、とは言えない
108 :
132人目の素数さん :2014/10/23(木) 23:54:37.45
やっぱりわかるひといませんか(;;)
109 :
132人目の素数さん :2014/10/23(木) 23:58:38.75
というか、モーメントって統計学のジャンルであってるよね??
合ってるよ
>>104 Aが高い誤差の値、Bが低い誤差の値
かもしれないからAの視聴率がBより高いとは言えない
全世帯調べる事が出来ないからサンプルを600とって調べるけど600の選び方によって視聴率の調査値は変わる
別のサンプルではB>Aの値になるかも
>>96 分散共分散行列って2次モーメントの行列じゃね?
n次モーメントの分散ってなってるから
物理のモーメントって回転とかのヤツでは?
113 :
132人目の素数さん :2014/10/24(金) 04:16:18.82
>>112 そうそう、対角要素がそれぞれの次数のモーメントの分散(二次のモーメント)になってる。紛らわしいが。それで、普通に計算するとたとえば3次のモーメントの分散だとE[(x^3-μ_3)^2]でしょ?
これを計算するとμ_6-(μ_3)^2になって二項目までしか出てこないんだわ。
参考までによく出てくる算術平均の分散(一次のモーメントの分散)はE[(x-μ_1)^2]で、これを計算するとよく知られた式
μ_2-(μ_1)^2が出てくる。みなれた形で書くならE[x^2]-E[x]^2。
114 :
132人目の素数さん :2014/10/24(金) 04:16:56.01
>>112 そうそう、対角要素がそれぞれの次数のモーメントの分散(二次のモーメント)になってる。紛らわしいが。それで、普通に計算するとたとえば3次のモーメントの分散だとE[(x^3-μ_3)^2]でしょ?
これを計算するとμ_6-(μ_3)^2になって二項目までしか出てこないんだわ。
参考までによく出てくる算術平均の分散(一次のモーメントの分散)はE[(x-μ_1)^2]で、これを計算するとよく知られた式
μ_2-(μ_1)^2が出てくる。みなれた形で書くならE[x^2]-E[x]^2。
115 :
132人目の素数さん :2014/10/24(金) 04:17:35.49
間違って連投してしまったごめんなさい
というかi,j=1,1のときどうすんだこれ
>>104 どんなに誤差があろうと0.1%でも視聴率が高いほうが、
実際の視聴率も高い可能性が高い。
118 :
132人目の素数さん :2014/10/24(金) 10:56:20.04
>>116 i,jに1,1と入れると
>>114 の最後で言った式がでてくるよ。μ_0=0だからこの場合は
3項目以降は消える。3項目以降がでしゃばってくるのは高次の時
>>118 Sigma_{1,1}=μ_2??μ_1^2
にならないか?
今μ_nはn時の中心モーメントを表しているので、 ああ、そういうことね
124 :
132人目の素数さん :2014/10/24(金) 20:50:57.20
測定誤差は正規分布するから。
プロスペクト理論ではパチンコ依存を説明できない
>>127 A, Bを比較するんじゃねーの?
あと測定誤差が正規分布するとしてそのパラメータは同じなのか?
Aの視聴率>Bの視聴率 という結論を出せるかどうか
Aの視聴率>Bの視聴率となる確率が、Aの視聴率<Bの視聴率となる確率より高い、という結論を出せるかどうか
この二つを混同している人がいるのかもしれません
>>104 の「友人」が前者を問題にしているのは明らかですが
>>132 誤差は視聴率の値と標本数によるから
一般的には調査値がA>Bだから
真の視聴率も同様とは言えなくね?
どんな組合せでも言える?
>>133 ごめん、その若者言葉みたいなのやめて
文意が曖昧になってしまうから
そして、何故任意の組合せの可能性を持ち出したの?
>>134 上の具体的な値も計算してみないと判らないのでは?
任意の値でA>Bなら計算しなくても良いけどな
「任意の値」と「任意のデータ」は大違い
視聴率に限定すれば 見た or 見てない の2値? あと時間も関係するか 毎分とか毎時間とか
>>130 その友人は屁理屈しか言ってないですよね。
体重計でも温度計でも測定誤差はありますが、
測定誤差±0.2度の温度計が22.1度から22.2度に上がったら、
上がってはいない、誤差の範囲だ、意味がないと言うつもりなのでしょうか。
>>138 マジレスすると
その測定誤差±0.2度というのは、温度計自分自身との誤差ではなく、(理論的に定まっていると考えられる)真の気温との誤差のこと
…流石に釣りで冗談言っただけだよね?
>>139 大きな釣り針だなぁ。
基準電圧ひとつとっても揺れてるのに、計測回路はアナログ要素だらけで
真の気温とやらが一定でも計測するたびに結果も揺れるよ。
>>138 答えはYesらしいので、その人とは友達止めるべきです。
温度計がふらふらするところを見た事ないなー
ここまで無知で調べる気すらないとさすがにもう相手にしてられないな。 ググレカス。
145 :
12 :2014/10/26(日) 18:10:40.29
146 :
132人目の素数さん :2014/10/26(日) 23:36:55.54
相関のあるAのデータとBのデータがあり Bが0の時のAの推定値を求めるのに 散布図を作り線形近似曲線から切片を出そうとした場合 ・AのデータをXに、BのデータをYにした時のX切片 ・BのデータをXに、AのデータをYにした時のY切片 この2パターンがAの推定値となるのですがこの2つの値は異なる値となります。 相関係数が高ければ高いほどこの2つの値の差は小さくなり相関係数=1で差=0になるため この2つの値の差は誤差のようなものと考えていいものなのでしょうか? それとも「Bが0の時のAの推定値」を求めるにはXとYは必ず固定されなければならないのでしょうか?
解が異なるのは回帰直線を求める際の 最小二乗法をyで取るか、xで取るかの違いと同じ
>>146 相関があると分かったら何をしたいのか?
ただ相関があると知りたいだけなのか?
気になっただけだよな? その手の解析の切片の数値なんゼロかゼロ以外か程度にしか気にするもんじゃないと思う
>>138 それは、完全に同じ条件で温度測定できてないと成りたたないですね。
測定誤差±0.2度の温度計が22.1度から22.2度に上がったとしても、
たとえば日光が温度計に直接当たって気温よりも温度計の温度が上がった、
温度計を持つ手の体温が伝わった、などの要因が発生していれば、
それは気温の上昇を示す変化ではないと思います。
いわば温度を計測したときの条件が変わっているわけですから。
視聴率もそれと同じで、標本となる世帯がつねに入れ替わっているし、
番組Aの時には残業で帰れなくて視聴できなかったが、番組Bは残業がない日
だったので家でゆっくり見られた、というふうに視聴の条件が常に変化しています。
このように番組Aのときと番組Bのときの標本の条件は同じではないので、
別の機械で計ってるようなもの。
同じモデルの温度計を2つ用意して、片方が22.1度、もう片方が22.2度だった
という例えのほうが近いのでは?
そういうの含めて正規分布するのですよ。 みな全く異なる環境で育ってるのに身長が正規分布するようにね。
米国・SAT(大学進学適性試験)で中韓の学生の成績が正規分布から大きく外れていたそうなw
パチンコ台みたいな釘が多段に打ってある板を斜めにして 上の中央からパチンコ玉を落とすと 最初の釘によって左右にほぼ同確率で分かれる 次の段でも同様に左右にほぼ同確率で分かれる その分布がガウス分布
>>153 間違っちゃいないんだが・・・
二項分布に中心極限定理を用いて正規分布を説明するのはなんか違わないか?
こちらで聞いていいのか分からないのですが・・・ 二つのデータ群があってその二つの関係性(AがBにどう影響を与えているか)を分析したいとき 分散分析と正準相関分析のどちらが適しているのでしょうか? 正準相関分析は二つの相関を調べるので影響を与えているかを考えるときは分散分析の方が適しているのでしょうか? つまらない質問だとは思いますがどうかご教授お願いします。
どんな解析やろうが因果関係なんてわからない 2群比較だけで因果関係があるといえるほど強い関係性があるのなら、どんな解析でも明白な結果がでる 2データ群の因果関係が言いたいのに手持ちがそれしかないのは実験計画の段階でミスってる
偏相関係数?
>>156 >>155 が研究デザインを明示しない状況でそんなことは断言できないのでは。
観察研究か実験研究かも分からないし。
例えば、AとBとが昨日と今日の気温データだったら、
自己相関としての因果関係はある程度存在すると思うぞ。
160 :
nontan67 :2014/11/08(土) 13:07:19.51
ある雑誌に投稿したらreviewerから “no real comparison between the different derived parameters for sensitivity orspecificity (ROC curve or random effects analysis) or Moment analysis.”のようなコメントを頂きました。 研究内容は、生体のある状態を知るために色々なパラメターを時間に沿って 測定したものです。生体のある状態は、動物実験では測定が出来るものですが、 生体では測定できません。 コメントにある、ROCは判るのですが、 random effect analysis, Moment analysisは判りません。 どなたか教えて頂ければ幸です
161 :
132人目の素数さん :2014/11/08(土) 13:45:05.83
いやだね
162 :
132人目の素数さん :2014/11/08(土) 14:06:48.54
>>117 分散はでかくてもいいけど不偏性の条件が必要だよー!
,.-─ ─-、─-、 , イ)ィ -─ ──- 、ミヽ ノ /,.-‐'"´ `ヾj ii / Λ ,イ// ^ヽj(二フ'"´ ̄`ヾ、ノイ{ ノ/,/ミ三ニヲ´ ゙、ノi! {V /ミ三二,イ , -─ Yソ レ'/三二彡イ .:ィこラ ;:こラ j{ V;;;::. ;ヲヾ!V ー '′ i ー ' ソ Vニミ( 入 、 r j ,′ ヾミ、`ゝ ` ー--‐'ゞニ<‐-イ ヽ ヽ -''ニニ‐ / | `、 ⌒ ,/ | > ---- r‐'´ ヽ_ | ヽ _ _ 」 ググレカス [ guglecus ] (生没年不明)
誰だ、美術室から持ち出した奴は?
統計検定の受検表は届きましたか?
はい 今さら受けるのめんどくなってきた
会場は大学
この資格取ると何か良いことあるの?
良いことを求めて受けるわけじゃないから いいことがあるかどうかは知らん。
ホームページによれば来年の6月試験から準1級試験を開始するらしい。
ちょっと解いてくれ 非負実数値をとる確率変数X,Yが互いに独立であるとする。それぞれの分布関数をFX(x),FY(x) (x≧0)とするとき、X-Yの分布関数P(X-Y≦x) (-∞≦x≦∞)を求めよ 東大の友達に聞いてもわからんとよ
それでよし
2要因混合計画の交互作用ってなんで被験者内要因として扱われるの? S×A×BじゃなくてS×Bの自由度使うのが良く分からない 誰か詳しい人教えちくり
>>175 一人あたりの条件Aと条件Bの組み合わせ とは
理解力なくてすまぬ
自分の書き方が悪かった、すまん
>>175 のリンク先の人名が載ってる表を見て欲しいんだけど、
その二では佐伯さん等について6通りの組み合わせすべてのデータが得られているのに対し、
その三(混合計画)では村山さん等について3通りしかデータが得られていない
つまりS(個人差)×A×Bは該当するデータが無いので解析できない、ということ
>>177 いや答えてくれるだけ感謝や
その一も一人における全通り分は得られてないけど?
>>178 うん、そう
だから個人に個人差の扱いがその一〜三で変わってくる
その一では一人一データだからS、その二ではSxAxB、その三ではSxB、という風になっている
>>179 何回もありがとう
なんとなく分かってきた
検定の準備できてねえ・・・
つい気になり覗いてしまう白痴君であったwww
この板に書き込むのが初めてなので質問の仕方が合っているか分かりませんが質問させて頂きます 全国(or1世帯あたり)でのゲーム機保有台数の載っているサイトは無いでしょうか? 一応総務省の統計データやググって出てくるPDFなどを読みましたが有りませんでした どなたか知っている方が居られれば教えていただきたいです
数学を中学レベルくらいの基礎から統計学に必要なものだけに絞って勉強するとしたらどうすればいい 統計学はこれからくる学問だと思う
ごく普通に、大学のカリキュラム通りに、微積分→確率・統計
尤度比をλとしたとき-2logλは近似的にカイ二乗分布に従う これどうしてこうなるのか誰か詳しく教えてくれ 手持ちの本見ても定理の一言で済ませてやがるちくしょう
確率論
>>186 大学は文系なんだが公認会計士で統計学選択しようと思っている
データサイエンスに興味がある
統計学、あるいは統計学の基礎となる範囲の確率論で、確率積分を使う機会はありますか?
>>191 プログラミングはもちろん必要だ
でもそれはまた別のカテゴリーになる
データを分析するのに統計的思考が必要になってくる
>>192 統計検定を下の級から順番に受けていったら?
数学検定も。
194 :
190 :2014/12/11(木) 18:30:21.52
検定とかはどうなんだ あくまで最短距離をあゆみたい
数学向いてないよ
『漫画でわかる統計学』でも読んどけ タイトルから想像されるような酷い内容ではないから
それはみた 鳥居先生の本ってどうなの?評判いいみたいだが
統計用語と実際の計算を教えて下さい。 掃除の危険度を計算するとします。 転んでケガをする危険度(確率)が0.1だとします。 塩素系の洗剤の危険度が0.0001だとします。 酸素系の洗剤の危険度も0.0001だとます。 塩素系と酸素系が合わさると危険度が0.7になるとします。 この2つの要素が合わさると寄与率が高まる事を統計用語で何と言いますか? タバコだけ酒だけではリスクが低いが合わさると高まるみたいな時にどんな用語を使いますか? 実際の計算式はどうなりますか?
交互作用が存在する
危険度=転倒+塩素系+酸素系+a×転倒×塩素系+b×転倒×酸素系+c×塩素系×酸素系+d×転倒×塩素系×酸素系
>>199 の情報だけでは各交互作用のパラメータa,b,c,dの具体的な数値は求められない
単純化して考えた時の話ね きちんと考える場合には誤差構造に二項分布を仮定するなどもうちょい複雑になる
階差系列とは何ですか ググっても用語解説が出てこないんですが
名前のまんまだろwww
あぼーんされてて見えない・・・
>>202 {a_n}の階差系列は{a_(n+1) - a_n}
206 :
132人目の素数さん :2014/12/30(火) 20:47:03.52 ID:/QNwFcA5
教えて下さい 私達の分野(医療)で改善率という指標があるのですが、ある評価基準について、満点を100点として、治療前の点数が治療後に100点にどれぐらい近づいたかということで表されます。 例えば、治療前60点が90点になったら, (90-60)/(100-60)=0.75 という具合です。治療後100点になれば1、治療後に治療前より点数が悪化すればマイナスとなります。この手法の問題は治療前の点数が100点だった場合には計算できないことにあります。 私の質問は、治療前の点数が100点だった患者を含んでいた場合の統計処理方法についてです。 (治療前100点でなぜ治療を受けるのかという点ですが、主の治療目的と別の、副次的な項目についての治療効果を調査したいためです。) 以下の2つの方法を考えたのですが、2.についての統計手法が分からずに困っています。 1. 100点だった患者を除いて、各患者の治療前後の改善率を計算、その平均について各治療法間で比較する。 2. 100点だった患者を含めて、治療前の点数の平均と、治療後の点数の平均を算出し、平均値の改善率について各治療法間で比較する。 1.については、治療法ごとの平均値の検定で対応できますが、2.については、治療法ごとの改善率を計算することは出来ますが、その差について有意かどうかの検定方法がわかりませんでした。 よろしくおねがいします。
207 :
132人目の素数さん :2014/12/30(火) 23:52:15.53 ID:T/05DdMn
治療前の点数が100点だったということは、検査値に異常はないのに 患者さんにとっては具合の悪い自覚や他覚があるってことでしょ。 検査値に出てこないものを数値化しようとする時点で無理があるんじゃね
208 :
イスラム金融系最高指導者遅獄先生−主対性卓上理論より実戦 :2014/12/31(水) 00:02:13.31 ID:0KCnEDKk
異常な性欲とか。
209 :
132人目の素数さん :2014/12/31(水) 00:20:19.24 ID:n7EcaxHl
正直まじあるかも。どっからどう見ても体に出てるだろ、けど検査値 異常なしって鈍感なおれが見てもたまにある。ただ検査値にあがってこないだけで。 めっちゃ悩む
210 :
132人目の素数さん :2014/12/31(水) 06:54:00.37 ID:alDLCv0+
ありがとう。あくまで例えですが、もう少し具体的に説明します。 歯の治療をしたときに、肩こりが良くなるか、良くなるなら歯の治療の方法によって違うか、みたいなことを調査したい時。 治療前に肩こりが全くない人(100点)、とてつもなくひどい人(0点)とすると、 歯科治療A(患者1、患者2、患者3、患者4、患者5)として、 治療前、 100、80、60、40、20 治療後、 100、75、85、75、80 歯科治療B(患者6、患者7、患者8、患者9、患者10)として、 100、100、90、80、70 治療後 100、90、90、95、90 みたいな状況です。 治療前100点の患者1、患者6、患者7を除いて個々の患者の改善率を平均すると、治療A 0.43、治療B 0.47、 すべての患者の治療前の平均、治療後の平均を用いて改善率を計算すると、治療A 0.58、治療B 0.42 となります。 治療前100点の人が100点のままなのも意味があることだし、80点とかに悪化するようなケースを無視して優劣をきめるのもどうかと思ったわけです。
>>210 治療法Bの副作用とかで悪化した度合いを数値化してやればいいだけでは?
(90-100)/100=-0.1とか
元々が100だったら100で割る
>>211 元の改善率は改善する方向の余裕のうちどのくらいの割合で改善したかを表すものだった
ところが治療前が100だと改善方向の余地は無い
そこで悪化方向の余地のうちどのくらいの割合で悪化したかを表して、符号を改善方向に合わせると言う考え方
213 :
132人目の素数さん :2014/12/31(水) 09:58:25.27 ID:n7EcaxHl
カンだけど、いくつかの治療法があっても上手くいかない場合 たとえば今まで痛くなかったのに痛くなったとか、かえって悪く されたんじゃないかとか、実際あってはならないことへの線引の 基準って気がする。歯医者は底辺でそんなに凄いことにはなっては いかないけど
214 :
132人目の素数さん :2014/12/31(水) 10:53:13.69 ID:n7EcaxHl
>>210 氏、気をつけなよ
紙の上ならいいけど時として生きるか死ぬかって患者さん家族とトラブったら
まじ人生詰んじゃうって聞く。ヤバそうだなっと思ったら大きな病院に送るとかw
216 :
206, 210 :2014/12/31(水) 11:51:51.51 ID:alDLCv0+
>>211 , 212
ありがとう。参考になります。
ただ、そうすると、100点が99点の場合は-1/100ですが、
99点が98点になったときに、-1とするか、-1/99とするのか
さらに、99点が100点になったとき1とするのか、1/99とするのか、
という新たな問題がでてきてしまいます。
もともと、この評価方法自体が、60点から100点への改善と80点から100点への改善が同じ価値になってしまうなど、突っ込みどころが多い方法なのです。
かといって、単純に差で比較するのも、20点が60点になることと、60点が100点になることが同じ価値になってしまうのもどうかと思います(この場合は後車の方が圧倒的に満足度は高い)。
もっと良い方法があるとよいのですが。
>>213 , 214
たしかに、一人の患者さんを相手にするときは、こんな紙の上の計算は役にたたないんですが、自分の治療法や他人の治療法が本当に意味があるのの物差しとして、統計などの紙の上の勉強が必要になるんです。
(y2 - y1)/(100.001 - y1)とでもすれば充分な精度に思えるが駄目なんか?
218 :
132人目の素数さん :2014/12/31(水) 16:29:38.35 ID:GWYkp0m4
肩こり治療に対して、有意かどうかは単に2群のt検定をすれば良いのでは。
t検定は正規の仮定があるから使えないのでは あくまで改善率にこだわるなら2つの改善率の比較したほうがいいと思うけど ノンパラの検定になりそうでめんどくさそう
220 :
206, 210 :2014/12/31(水) 18:43:22.81 ID:alDLCv0+
>>215 官能検査やβ値始めて知りました。完全には理解できていませんが、面白いですね。
導入できないか考えてみます。
>>217 それだと、100点が100点になったときの改善率0となってしまうのがちょっとよくないんです。
>>218 , 219
両郡の治療前の点数がそろっていれば、単純に治療後の点数に対して、t検定なりノンパラの検定なりで比較しればいいんですが、
今回のケースでは治療前の点数がそろっていないことをどうするかということが問題になっています。
自分の分野ではこの改善率という方法をつかうのですが、いろいろ問題があって困っています。
>>220 いや改善率の二群ね
2つの改善率を比較してるんでしょ?
それか回帰にして100の場合をダミーにするか
変数とデータが十分にあれば意味があるかな
>>216 治療前が100の時だけ例外計算する
元々の改善率の計算も治療前が100だと計算出来ないわけだし
あと改善率と言うからには100→100の改善率は0で良いと思うけど
治療前が100の時は近似的に99として改善率を計算するのでも良くない?
どれくらいの精度が必要か知らないけど
>>222 それは一番やっちゃいけない
悪化する可能性もあるんだし、pハックとやってること変わらん
>>206 医学(疫学)の人間だけど、改善率って初めて聞いた。
治療前100点の患者を除くと、
治療後に悪化する(つまり100点を下回る)ケースの情報が欠落する。
やっちゃダメだ。
こんなところで質問するよりも、
改善率をアウトカムにした先行研究と同じ方法をとるのが無難だよ。
自分で勝手に定義しても良いアウトカムなら、
>>217 のように、無限大になる指標を補正するときによく使われる手を使う。
補正パラメータを0.001として、
(治療後 - 治療前)/(100 - 治療前 + 0.001)とかね。
結果的に
>>217 と何にも変わらないが。
225 :
206, 210 :2015/01/01(木) 17:02:38.24 ID:T4gJkiRG
あけましておめでとうございます。
皆さんありがとうございます。だいぶ理解できました。
>>224 多分医学のなかでも、こういうやり方をつかっているのは私達の分野(整形外科)だけなのかもしれません。
改善率をアウトカムにした先行研究は基本的に、もともと調子悪いところの改善率を対象にしているので、inclusion criteriaで治療前70点以下などになっていて100点を含まないものがほとんどなんです。
補正パラ-メーターを使用して、改善率をノンパラの検定でやってみます。
よく考えずに、プロトコルに改善率をアウトカムに入れてしまい、いざ解析を始めてから困ってしまったんですが、
この研究では、改善率をアウトカムすること自体が、適していないような気がしてきました。
>>225 まぁというか、ちゃんと統計学者に聞いたほうがいいぞ
ここじゃ細かい話はできないし、特にパブにするなら、ちゃんとやったほうがいいと思うけど
227 :
132人目の素数さん :2015/01/01(木) 19:10:27.65 ID:h45GTyQ/
時間あるなら原著でもOKレベルの人
229 :
132人目の素数さん :2015/01/04(日) 21:17:49.51 ID:81Vyorrh
230 :
132人目の素数さん :2015/01/06(火) 03:15:58.36 ID:MgO4Zjal
統計学全然わかんねえんだが実験結果の統計結果を出せって言われた・・・ 助けてくれ
平均と分散、最大値と最小値、中央値と四分位 比較があるなら各種検定でOK
水の入ったコップをガラスにぶちまけると、ガラスに水滴模様ができますよね。 それを何千回繰り返して、同じ水滴模様が出来る確率を割り出すのは ほぼ不可能ですか?
実際に何億回かやってみて調べたらいい
235 :
132人目の素数さん :2015/01/12(月) 15:10:21.81 ID:W7R9hi0X
>232 冗談で言ってるのはわかるけど、 ・ぶちまける先のガラスの大きさと ・同じ模様の定義 くらい書かかないと、ほんとのウソにしか見えないじゃん。 前提がそろってないから、ほぼでなく、完全に不可能。
236 :
132人目の素数さん :2015/01/18(日) 14:12:56.62 ID:JQZIoFpc
N(0,1)^2〜Γ(x.y)となるx,yを求めよという問題で、 N(0,1)^2の分布関数が、 Φ(x)をXの分布関数とした時、 F:N(0.1)^2 = Φ(√x)-Φ(-√x)となるところまではわかるのですが、 そこから両辺微分して =1/(√2πx)*e^(-1/2*x) となるようなのですがその過程がわかりません。 (密度関数 1/(√2π)*e^(-X^2/2)を 区間 -√x〜√x で積分したものを微分する気がするのですが、、、) よろしくお願いいたします
標準正規分布に従う確率変数の二乗はカイ自乗分布に従う。
表記方法がひどい
解析の勉強しろ
240 :
132人目の素数さん :2015/01/23(金) 00:07:09.15 ID:9WufqE3P
大学生の名前から、ベイズ統計で親の年収と学歴を推定できるの?
640 :自治スレでLR変更等議論中@転載は禁止:2015/01/18(日) 17:38:49.90 ID:3uP4//2C0
>>630 ベイズ統計で簡単にカテゴライズ可能です。
ベイズ統計を利用してスパムメールを高精度で同定できている実績から明らかですが、
意味のないメールを高精度で同定できるのと同様に、
意味のない親から生まれた意味のない子供を高精度で同定することが悲しいけど可能です。
【社会】男の子は「蓮」、女の子は「陽菜」…「正一」「千代」の大正時代から見ると浮かび
上がる“世相” [転載禁止]c2ch.net
http://daily.2ch.net/test/read.cgi/newsplus/1421537966/625-640
241 :
132人目の素数さん :2015/01/26(月) 16:54:07.57 ID:2TZ7aDu9
そんなのprimary outcomeにさがなかったから改善率とか出して誤魔化そう的な発想が見え見えじゃん 解析する価値すらないことに何を悩んでるのかね? バカバカしいこと考えてないでもっときちんとしたデザインとかを考える方がずっと有用な時間の使い方な気がする
キイロショウジョウバエの野生型+の雄と、常染色体上の劣性突然変異遺伝子である黒檀色eホモ接合体の雌を交配したところ、F2では、各表現型について下に示す数の個体が得られたとする
この結果は、+:e=3:1、♀:♂=1:1と合致してるが、メンデルの遺伝の法則から考えられる分離比といえるかどうか、カイ二乗法を用いて検定し、その結果について考察せよ
有意水準5%、カイ二乗分布の累積確率は自由度1、2、3でそれぞれ3.841、5.991、7.815である
+♀70、+♂50、e♀10、e♂30 よろしくお願いいたします
お願いしますじゃねえよw
すいません、自分なりに解いてはみたのですがそれが正しいのかわからないので質問しました。期待分離比をメンデルの独立の法則の9:3:3:1で考えて検定した結果独立の法則の分離比とは異なるという結果になりました
ただ、一つ引っ掛かったことがあって、問題には自由度が3つ提示されているのですが上でやったような場合だと自由度は3しか使いません。自由度1、2は無視しても良いのでしょうか?または、優劣の法則の分離比などの検定も行うということでしょうか?
松岡修造がいる場所の気温が高いことについて 有意な相関関係はありますでしょうか?w
9:3:3:1w
>>250 そもそも期待分離比が間違っているのでしょうか?
修造がいる場所の気温が高くなったデータと、 修造がいなくなった場所の気温が低くなったデータと、 両方あつめて分析しないとだめだぞ。
253 :
132人目の素数さん :2015/02/02(月) 08:07:03.38 ID:WYHa2M92
>>245 クロス集計表を使って適合度検定かな
性別と+eの2次元の表で
理論値と観測値の適合度を計算する
257 :
ぽてちん :2015/03/08(日) 01:32:39.13 ID:3ZOvz2UX
質問です。株やってます。高卒です。 100円の株価が9割位の確率で10分以内に103円になります。9.5割位の確率で15分以内に108円になります。1割位の確率で15分以内に90円になります。 ただし、これらは平均しての結果であり、場合によってはもっと極端な値をつけることもあります。その場合、70円とか、マイナスの場合のほうが幅が大きいです。 さて、これらを踏まえ、利益確定・ロスカットの値段、時刻を決めたいと思います。 自分なりに統計データは取っており、利益確定・ロスカットの値段は決めていますが、感覚的なものなのでアテになりません。 トレードにおける感覚は全くアテにならないということも分かってきました。 つきましては、どのようなデータを取り、どのような判断で利益確定・ロスカット値段、時刻などを決めればよいでしょうか。 スレチであれば申し訳ありません。また、スレチである場合、どの板で質問すれば良いでしょうか。 何卒、高卒無職に知恵をお授けください。よろしくお願いします。
258 :
ぽてちん :2015/03/08(日) 01:35:01.60 ID:3ZOvz2UX
ちなみに上記の結果をもとに感覚をもとにしたトレードを繰り返した結果、資金は微増程度で、全く儲かっておりません。
259 :
ぽてちん :2015/03/08(日) 01:36:40.16 ID:3ZOvz2UX
儲かっていない理由は損失がデカくなる傾向にあるためです。 勝率はまあまあ高いのですが、たまにやるロスカットがデカいのです。
260 :
ぽてちん :2015/03/08(日) 01:47:04.21 ID:3ZOvz2UX
あと、9.5割位の確率で108円と言うのは、いったん大きく下げてから急騰している場合も含みます。 この場合にブン投げ(泣きわめきながらロスカットすること)する場合も少なくありません。 2時間くらい我慢していたら結局+10%以上儲かっていた、なんてことも少なくないです。
261 :
ぽてちん :2015/03/08(日) 02:14:29.48 ID:3ZOvz2UX
連投、失礼いたします。 感覚的なものが当てにならないと言うのは、最近のノーベル経済学賞の結果だけ読んだら、人間の本能として状況によってリスク選好の度合いが変化してしまうとのことでした。 損失が出ているとハイリスクを取り、利益が出ているとリスクを取らない、という行動パターンが本能として固定的であるため、結果が悪くなってしまうということです。 これは教育や訓練の程度によらない、本能的なものらしいです。 結論として、統計データをもとに機械的にトレードするほうが効率が良いらしいのです。
262 :
ぽてちん :2015/03/08(日) 04:44:09.48 ID:3ZOvz2UX
つまり、かなり高確率で値上がりするが、下がるときには大きく下げてしまう。 しかも、値上がっていてもどこで反転、下落するかわからない。 そういう場合に、価格及び時間の両面で売るタイミングを決めておきたいわけです。 損切り値を少しでも上に上げると、すぐにそこに引っかかってしまい、勝率が下がる。 下にすると引っかかりづらくはなり、勝率も上がるが損が大きくなる。 もっと下にすると勝率はさらに上がるが損が大きくなる。 そこで、試行回数を増やした場合にトータルの利益が最大となるような最適値を割り出したいのです。
264 :
ぽてちん :2015/03/08(日) 14:18:05.24 ID:3ZOvz2UX
>>263 レスポンスありがとうございます。
投資板、株式板では数学を背景にした回答はまず期待できません。そういうスレも一部にありますが、商材屋さんのステマとかが多いんです。
また、自分は初心者でもないんです。
266 :
ぽてちん :2015/03/08(日) 15:15:17.05 ID:3ZOvz2UX
>>265 申し訳ありませんが、儲かってないので払えません。
でも経験上知り得たことをお教えすることはできますよ。
この板の知恵ある方々にはそんなもの必要ないでしょうが…。
頭が悪いのにギャンブルやる奴は屑だということがよくわかる
rのdecompについて調べようと思ったら画像がやばかった
271 :
ぽてちん :
2015/03/08(日) 23:19:46.25 ID:UaZSU1Z8 デコンプみたいなの使えば良いのですか? 使い方がわからないけど…