統計学なんでもスレッド7

このエントリーをはてなブックマークに追加
525132人目の素数さん
他スレで回答が得られなかったのでここで改めて質問いたします。
--------------------------------------------------------
平均100,分散2で製造されている部品から9個を抜き取ったところ

102, 101, 104, 98, 102, 96, 106, 97, 103

だった。この部品の標本平均を用いて有意水準5%で検定を行う。

(1)帰無仮説H0を述べよ。
(2)検定を行え。
(3)結論を述べよ。
--------------------------------------------------------
そもそもどんな帰無仮説を立てたらいいのかすら分かりません…
526132人目の素数さん:2008/02/11(月) 19:43:16
>>525
問題文にいきなり平均100 と書いてあるので奇妙ですね
こういう問題が初等的教科書に載っていたらパターンとしては

H0: 平均=100

として検定する話だと思うけど
仮にそうだとすると
分散2まで指定されて母分布の指定が無いから
標本平均が正規分布に従うとして H0 を検定するということでよいのでは?
527132人目の素数さん:2008/02/11(月) 19:44:28
そう思って元のスレで聞いてみたら、分散も同時に検定したいんだと。
528132人目の素数さん:2008/02/11(月) 19:47:06
>>527
でしたら教科書の章立てどおりに
分散はカイ平方分布
平均はt分布
で検定するということでどうでしょうか?
529525:2008/02/11(月) 19:48:16
>>526
出典は教科書じゃないんですよね。
ある統計学の授業で教師の手で作った問題みたいなので…

はっきりとした問題の意図がつかめないんですよ。
530525:2008/02/11(月) 19:49:48
>>528
そういえばt分布を使えとか言ってたような気がします…
ただそのt分布というのがさっぱり分からなくて…
531132人目の素数さん:2008/02/11(月) 20:01:13

>>530
たとえばwikipediaで t分布 を引くと載っていますよ
普通の初等的教科書でも載っているし(大学に入ったらt分布が載っている程度の教科書にしましょう)

(t分布の練習問題だとすると問題文冒頭に分散2と断ってある理由が不明ですが
それは出題した先生に対する疑問)
532132人目の素数さん:2008/02/11(月) 20:17:51
>>531
うーん、だとすると分散にカイ平方分布も使うんだと思います。

とにかくまず何をやっていいか混乱してしまって…

ちなみに持ってる教科書にもt分布は一応載ってます。
533525:2008/02/11(月) 20:25:03
とりあえずできたところまで…

(1)帰無仮説H0:この9個の部品が100,分散2で製造されている。
(2)データから不変分散を求める。
 9つの部品の平均値は101
 よって不変分散V^2は45/4

ここまでおかしな所ありますか?
534132人目の素数さん:2008/02/11(月) 20:48:01
>>533
t分布で平均を検定するのに分散の仮定はいらない
カイ平方分布による分散の検定とは別にやったほうがよいでしょう

それに一段ずつ手取り足取りやってほしいならお金を払って家庭教師を付けるべきかと思います
535132人目の素数さん:2008/02/11(月) 21:55:41
分散が既知なので母平均は標準正規分布を用いたZ検定でいいんじゃない。母平均も分かってるから検定する必要性があるとは思えないが。母分散の検定ならχ二乗検定でよか。これもなぜか分かってるが…。
536132人目の素数さん:2008/02/11(月) 22:24:44
537132人目の素数さん:2008/02/12(火) 00:30:07
>>533
仮説を立てろと言われて日本語で書いている時点で…。
538132人目の素数さん:2008/02/12(火) 00:53:28
>>533
初歩的な教科書嫁よ
どんな教科書でも例題くらい書いてあるだろ
いくら何でも無知すぎる
539132人目の素数さん:2008/02/14(木) 01:19:50
ナンバーズ4の予想屋なんかがいるので実際の結果の確率はどうなっているのか調べてみた。
過去50回のストレートだけ調べてみると一様の場合に想定される確率1/10000に対して結果の確率はその0.98倍だった。
推定で1倍を下回ったので検定は必要なかった…。
540132人目の素数さん:2008/02/14(木) 17:28:45
重回帰分析の項目選択では、決定係数が大きくなるかで判断していますが、
1、回帰検定のp値
2、(あるサンプルの真値がわかっている時、真値と予測値の)相関係数
で項目選択するのは間違いでしょうか?
541132人目の素数さん:2008/02/14(木) 23:02:49
すごく初歩的な質問ですみません。
相関係数0.417443って相関はないと見なしますか?
542132人目の素数さん:2008/02/14(木) 23:16:49
>>541
専門分野にもよるのでは?
自然科学のことは分からないけど、
社会科学だったら「ある」と見なす分野の方が多いだろうね。
543132人目の素数さん:2008/02/14(木) 23:23:30
>>542
自然科学か社会科学かという分け方はこの場合まずいかな

原因を究めたかどうかを問題にする場合(例:精密な自然法則)は不十分
関連の所在を見いだしたい場合(例:経済や医学などの対策や政策の効果)には関連あり
というところか
544132人目の素数さん:2008/02/14(木) 23:36:18
>>543
なるほどね。
医学分野でも0.4くらいで関連あるとみなすこともあるのは初耳だったので、
個人的には面白かったです、ありがとう。
545132人目の素数さん:2008/02/15(金) 00:03:20
541です。
心理学的統計なんですけど…
分野によって、違うんですね!
546132人目の素数さん:2008/02/15(金) 00:14:29
相関係数ってのはどれくらい相関があるかを表す値なんだから
それを「ある」と「ない」の二値に丸めるときには当然作為が入る.

どういう根拠でこの値を丸めるかは,当然考えておかないといけない.
547132人目の素数さん:2008/02/15(金) 01:24:38
>>540
1は修正決定係数(もしくはFPE)とほぼ同じ結果を与えるのでは?
2は特別な場合なのでそういうような考えもありかと思うが、
そういうことが想定できる場合が本当にあるのかな。
(真値って誤差が全くないということ?普通にあるデータとその真値との違いは何?)
548132人目の素数さん:2008/02/15(金) 08:17:50
>>547
2については、真値ではありませんでした。すいません。
目的変数です。
『目的変数』と『重回帰分析で予測された目的変数』の相関係数が大きくなる項目選択をする。
549132人目の素数さん:2008/02/15(金) 09:57:15
>>548
単純に相関係数だとすべての変数を取り込むだけじゃないの?
550132人目の素数さん:2008/02/15(金) 21:18:49
>>548
それが「決定係数」という指標ね。

決定係数 = 重相関係数 R の自乗
重相関係数 R = max 相関係数(Y, b1X1 + b2X2 + … + bpXp)
※max は実数係数 b1, …, bp の全範囲

回帰変数の選択は目的によって違うし、機械的に決める方法も無い。
自由度修正決定係数、t値(P値)などは、「ダメな結果」を振い落すには有効。
しかし残った候補の中で「どれがベストか」、を決められる指標は無いということ。

OCR(光学文字読み取り)とか自動翻訳とかが難しいのと同種の問題だよね
551132人目の素数さん:2008/02/16(土) 14:25:50
>>535
機械部品製造業の会社員です。母平均のZ検定でよいと思います。この問題と同様
例題が、品質管理にあります。
この9個の数値は部品の長さなり高さといった計量値で、その製造設備では従来
平均100,分散2で製造>>525されていたが、何らかの意図により加工条件を変更し、
恐らく平均値は変化有、分散は変化無と想定して、母集団平均値の変化量が
有意か否か検定せよというものです。
ある統計学の授業で教師の手で作った問題>>529という>>525氏が、機械系の
工学部生なら合点がいきますね。