統計学Part15

このエントリーをはてなブックマークに追加
535132人目の素数さん
数学がちょっと好きな文系1年です。(統計2級うかったけど1級落ちました(T_T))
質問があります。

標本比率から母比率を検定する方法についてです。
n: 標本サイズ p: 母比率 r: 標本比率
大標本のとき、比率の分布がN(np, np(1-p))に近似できると本や学校で習いました。
そこまではいいんですが、検定するときにpをrで代用してp〜N(nr, nr(1-r))に近似するという方法をやりました。
p≒rの話だと思うのですが、母比率の分布は厳密には少し0.5の方に歪んでますよね?(最尤値はrかな?)なんていう分布か教えてください。

それとレヴィ分布についても教えて下さい。
立ち読みした本に、正規分布を酔っ払いがホテルで自分の部屋から行き着く部屋とすると、
レヴィ分布は酔っぱらいが横に長い壁に向かって銃を撃ったときに銃弾があたる場所の分布だと書いてありました。
これってθ〜Nのときの1/tanθの分布って意味ですか?
536132人目の素数さん:2014/01/26(日) 05:52:34.57
勉強した人は高い平均の分布、してない人は低い平均の分布で、結果は2つ山。
これを2人でなく1000人で考えると、多峰性の分布や一様分布になるが、さすがに0点や
100点は少ないので両端とれて台形の分布になるのでは。上のレスであるように。
537535:2014/01/26(日) 06:01:44.34
N(np, np(1-p))は数の分布だった
N(p, p(1-p)/n)です
538132人目の素数さん:2014/01/26(日) 06:13:18.36
なんかわかりにくいので式にすると単に
X|μ ~ normal(mean =μ,sd =5)ぐらいで
μ~uniform(10,80)
の分布を考えると台形になるんじゃ。μ〜normal(mean=50,sd=10)はどうなんかな。
Xがセンター試験の得点分布で、μが受験者の実力分布としたばあいね
539132人目の素数さん:2014/01/26(日) 17:36:42.97
>>535
歪んでんの?へぇー

なぜ1/tanθだと思うの?
540132人目の素数さん:2014/01/26(日) 20:18:38.68
r=0のとき明らかにpの平均値・中央値は0より大。r=1のときも1より小。
ただしpの最頻値がrであると思ったから。
それ以外は想像。

まずレヴィ分布について知らないから、よっぱらいの銃が壁にあたったところってあるから
http://i.imgur.com/WPXzcFS.jpg
だとおもった。
θがランダムで、y=tanθとy=1の交点の分布を考えた。
541132人目の素数さん:2014/01/27(月) 19:05:08.02
F分布のことかな?

それ、正規分布になると思うよ?
レヴィ分布は右に裾を引く分布だね。金融工学とかで使ってるよ。
542535:2014/01/27(月) 21:21:13.51
F分布ですか。母比率についてF分布にしたがう統計量あってびっくりです。
正規分布の比の分布はコーシー分布、正規分布の二乗和の分布はカイ二乗分布みたいな、狭義レヴィ分布の説明ってありますか?
543132人目の素数さん:2014/01/27(月) 21:42:55.63
パラメタ不明のn個の正規分布{N(μ_i, σ_i^2) | i ∈ [1,n]}から
それぞれm個ずつ独立に値をサンプリングして、
そのmn個の値をもとに平均の和(Σμ_i)の信頼区間を作りたいのですが、良い方法はありますか?

n個の分布に従う変数の和の分布を考えれば、標本数=mのt検定ができることは分かるのですが、
そこまで情報を捨てないで済むものを探しています

n=2の場合は片方を符号反転してWelchのt検定でよさそうなんですが、
一般の場合にも似たような手法が使えるのでしょうか

また、分散が一部共通の2n個の正規分布{N(μ_i_j, σ_i^2) | i ∈ [1,n], j ∈ [1,2]}の標本から
(Σ(μ_i_1 - μ_i_2))の信頼区間を作りたい場合に良い方法はありますか
544132人目の素数さん:2014/01/28(火) 05:01:20.79
標本数?
545132人目の素数さん:2014/01/28(火) 05:48:14.24
すいませんsample sizeのつもりでした
546132人目の素数さん:2014/01/28(火) 09:09:10.97
sample size mのt検定はないでしょ。
547132人目の素数さん:2014/01/28(火) 11:13:27.30
>>543
正規分布の再生性 じゃダメ?
それに平均の和(Σμ_i)の表記はΣX_iとかにすべきじゃ。もし
パラメータの信頼区間を求めたいなら別だけど。
548132人目の素数さん:2014/01/28(火) 12:39:05.56
>>542
レヴィ分布は確率過程や確率解析の本を見たら乗ってると思う。
統計より確率論の話。
549132人目の素数さん:2014/01/28(火) 15:41:50.93
こんなとこで聞かないで図書館行って調べろよ
何でもかんでも人に聞く癖を直せ
大学生なら最終的には教授に聞け
550132人目の素数さん:2014/01/28(火) 21:27:49.76
>>547
再生性を使うより良い方法があるかと思って質問したのですが、無理そうでしたか
ありがとうございます

>それに平均の和(Σμ_i)の表記はΣX_iとかにすべきじゃ。もし
>パラメータの信頼区間を求めたいなら別だけど。
パラメータの推定が目的なので、パラメータの信頼区間を求めたいです
551535:2014/01/28(火) 23:20:40.64
>>548 PRMLとかですか?
どうりで入門書でも数理統計の本で見なかったと思いました。
552132人目の素数さん:2014/01/28(火) 23:22:14.09
prmlは確率過程じゃなかった