統計学なんでもスレッド7

このエントリーをはてなブックマークに追加
25132人目の素数さん
簡易な本に掲載されているやり方ではなく統計のプロがやる手順を知りたいのです。
目的は『予測すること』。目的変数は1個、説明変数は複数個です。
自分で調べてわかっている範囲を手順を記載します。間違っている、もしくは足りない箇所があれば教えてください。
【関係確認→変数変換】まず目的変数と説明変数の散布図を確認し、関係を把握する。
線形ならOK、非線形(単調増加)なら変数変換する、非線形(二次式以上)なら?
つぎに、分布の正規性をヒストグラムで確認し、違うならBox-Cox変換する。
これでデータ準備完了?
【手法の選択】
@もし変数変換しても改善しないならノンパラメトリック分析を選択する。
A変数変換で改善したならパラメトリック分析を実施。この場合(線形?)重回帰分析?を選択。
(OLS回帰とGLS回帰の選択方法がどんなときにどちらを選択するか教えてください)
次に多重共線性を調べ変数除去する。(逐次法、増減法)
準備が整ったので解析を実施。

不備な点をご指摘お願いします。
26132人目の素数さん:2007/11/15(木) 19:39:04
実装関連の信頼性解析について調べ始めているところです。
早速ですが,メディアンランク法の
F(t)=(Σri-0.3)/(n+0.4)
の0.3,0.4とは何でしょうか。
27132人目の素数さん:2007/11/16(金) 16:46:45
そもそも回帰分析の一般的方法が
1レスで収まるくらいなら苦労しないよ。
まあ、何点かコメント。

散布図を確認するのはいい心掛けだけど、そこでは、
まず異常値があるかどうかをチェックすべきだろうな。
あった場合にその扱いをどうするかは場合による。

それから、サンプルは本当に独立性を満たしているか?
満たしていなければ、いろんな方法でモデルを工夫
しなければいけない。

回帰分析では最終的な誤差の分布が問題なのであって、
元の変数の分布はモデルの正当性とは関係がない。
なので、最初に変数変換をすればOKというわけではなく
実際に回帰してみて、モデルの診断を行うという試行錯誤を
せざるをえない。

その他、いろいろな問題が生じうるが、
当然ながら全部は書ききれない。