統計学なんでもスレッド

943 ：１３２人目の素数さん：03/09/26 08:37

>>934 exp の中に入れて x が入ってるのは、
(r-1)log x - x^r * 1/s^r
なので、x^r がネックで内積の形にできないと思う。

>>935 e^x のかわりにexp x と書き、λは入力が面倒なので bに変え
ます。上側累積確率を q とすると、どれについても
q = exp (-x/b).
x = x_1 ≦ x_2 ≦ ... ≦ x_n になる上側累積確率は、積分が
たくさんでてくるけど、上ので置換すると簡単になって、1/(n!)q^n.
したがって、最小値が x なる上側累積確率は n! * 1/(n!)q^n = q^n.
これを改めて Q とおくと、
Q = (exp (-x/b))^n = exp (-nx/b) = exp (-x/(b/n))
ってことから判断してください。

944 ：１３２人目の素数さん：03/09/26 23:16

ある正規母集団から大きさ10の標本を抽出して標本平均59、
標本分散31.5を得た。このとき、母平均ｍは64であるといえるか。
有意水準5％で検定せよ。

これを解いてください

945 ：１３２人目の素数さん：03/09/27 00:14

丸投げは止めましょう。電卓片手に計算して、表を引いてください。

小標本で母分散が分からない場合の平均値の検定にはステューデントの t 分布
を使います。なお、下では平均の上線の代りに~ を使います。

標本数 n = 10, 標本平均 X~ = 59, 標本分散 S^2 = 31.5 (だから、S = √31.5)
母平均の推定値 m = 64 のとき、t 統計量 t = (X~ - m) / (S/√n)
は自由度 (n - 1) の t 分布に従います。この値と t分布表の値を比べます。
自由度 (n-1) の両側 5%の t の値を t_0 とすると、
- t_0 < t < t_0 であれば、棄却されません。

なお、t分布の表は教科書の最後の方に載っているはずです。

946 ：１３２人目の素数さん：03/09/27 23:15

日本人の血液型A,B,AB,Oの比率は4:2:1:3であることが知られている。
ある学校の生徒200人の血液型を調べたところ
Ａ：７０人、Ｂ：４２人、ＡＢ：２４人、Ｏ：６４人という結果になった。
この資料は母集団分布に適合しているといえるか。
危険率５％で検定せよ。
この問題を解いてください。

947 ：１３２人目の素数さん：03/09/28 01:20

丸投げは止めましょう。電卓片手に計算して、表を引いてください。

カテゴリーデータの観測度数が期待度数に適合するかどうかは、
カイ二乗検定の中の適合度検定を用います。

まず、それぞれの期待度数を計算します。例えばAについては、
E_1 = 200 * (4/(4+2+1+3)) です。他の血液型についても同様
に計算してください。これらの期待度数と観測度数 O_1 = 70,
O_2 = 42, O_3 = 24, O_4 = 64 を公式に代入します。

χ^2 = Σ[i=1;4](O_i - E_i)^2/E_i
= (O_1 - E_1)^2/E_1 + (O_2 - E_2)^2/E_2 + (O_3 - E_3)^2/E_3 + (O_4 - E_4)^2/E_4.
この統計量は自由度 df = (カテゴリーの数) - 1 = 4 - 1 のカイ
二乗分布に従います。この値が、カイ二乗分布の表の値を比べて
小さければ棄却されません。

初歩の段階では「こういう場合はこの検定」とパターンで覚えるため
に、教科書の例題を何度も解いてみてください。

…あぁ、もうだめ。脈拍が110越えた、関節炎で指がきしむ…。けど、
苦しくて眠れない。

948 ：１３２人目の素数さん：03/09/28 23:10

離散型確率変数X,Yの分布が
P(X=xi)=pi,P(Y=yi)=qi(i=1,2)
であるとき、以下を示してください。
(1) E(X+Y)=E(X)+E(Y)
(2) XとYが独立な確率変数であるとき
　　V(X+Y)=V(X)+X(Y)

949 ：948：03/09/28 23:12

>>948
訂正
(2) V(X+Y)=V(X)+V(Y)

950 ：１３２人目の素数さん：03/09/28 23:57

>>948
基礎の基礎の公式なんだから、こんな所にすぐに丸投げしないで自分で
調べてね

951 ：１３２人目の素数さん：03/09/29 04:29

多変量解析について根本的なこと聞きたいんですが
主成分分析，判別分析，重回帰分析って
それぞれ具体的にはどういうときに使うんですか

現実問題で使う時にどういうときに
どれを使えばいいのかわかりません

952 ：948：03/09/29 23:14

>>948
(2)の途中で、E(XY)=E(X)E(Y)を示すところが出てくると思います。
そこだけお願いします。

953 ：しょうがねえなあ：03/09/30 00:19

>>952
V(X+Y)=V(X)+V(Y)+2cov(X,Y)だが
cov(X,Y)=E{(X-E(X))(Y-E(Y))}=E(XY)-E(X)E(Y)であり
X,Yが独立のときE(XY)=∫XY*h(X,Y)dXdY=∫XY*f(X)g(Y)dXdY
=∫X*f(X)dX∫Y*g(Y)dY=E(X)E(Y)となるためcov(X,Y)=0となり
題意が証明された

954 ：１３２人目の素数さん：03/09/30 17:30

953さん、あげあしを取る気はありませんが、948さんは離散型を聞いてるみたいですよ？
まあ、ほとんど∫が∑に変わるだけだと思いますが。

955 ：948：03/09/30 23:19

離散型で、お願いします。

956 ：953しょうがねえなあ：03/10/01 19:01

>>955
X,Yが独立のときE(XY)=ΣXY*h(X,Y)=ΣXY*f(X)g(Y)
=ΣX*f(X)ΣY*g(Y)=E(X)E(Y)となるためcov(X,Y)=0となり
題意が証明された

957 ：１３２人目の素数さん：03/10/01 23:10

>>951
「現実問題」って言われてもジャンルによって違うでしょうし、なんとも漠然としすぎて答え
ようがありません。

ちなみに私の場合、主成分分析はポジショニング・マップを作るときに使ったりします。

重回帰分析は“全体”に対する“構成要素”の影響の度合いを測るために使っています。
多重共線性の問題があるので、間に直交回転の因子分析を挟むこともあります。

ところで、「共分散構造分析って何に使うの？」って上司に訊かれたのですが、
なんて答えれば良いでしょうか？

958 ：１３２人目の素数さん：03/10/09 09:21

推定量の有効性について質問いたします。
クラメール・ラオの不等式を用いて集中楕円体(y-ν)'Ψ(y-ν)=q+2を
正規分布において1変量で解け。
というというのはどういう方向で進めばいいのでしょうか？

959 ：上位駅弁落ちこぼれ一歩手前から：03/10/10 23:02

標本の期待値と標準偏差
母平均m、母標準偏差σの母集団から大きさｎの無作為標本X1.X2.X3,,,,Xnを抽出するとき、
標本平均　X=(X1+X2+X3,,,,+Xn)/n　の期待値と標準偏差を求める。
X1.X2.X3,,,,Xnの各々は大きさ1の標本とみなされるから
E[X1]＝E[X2]＝,,,,E[Xn]＝m
σ[X1]＝σ[X2]＝,,,,σ[Xn]＝σ
したがって
E[X]＝(E[X1]+E[X2],,,,+E[Xn])/n　←これはまあ理解できる　平均＝npじゃないの？と思うが　
＝m　　

復元抽出の場合　X1.X2.X3,,,,Xn　は独立であるから

V[X]＝(V[X1]+V[X2],,,,+V[Xn])/n^2　←？？分散＝npqじゃないの？　
＝σ^2／ｎ
σ[X]＝σ／√ｎ

標本平均の標準偏差が母集団偏差にくらべて小さくなることは
直感的に理解できるのですがこの式のつながりがよくわかりません。
どうかお願いします。
前期統計の授業ろくに出ないで落としました。
受験時は偏差値67～130だったんですが

960 ：上位駅弁落ちこぼれ一歩手前から：03/10/10 23:03

とりあえず
分散の分母にどうしてn^2が来るのか意味不明

961 ：ドキュソ：03/10/10 23:21

これって数Cなんだけどね
文系馬鹿のおれにはよく理解できんのですわ

962 ：test ◆tsGpSwX8mo ：03/10/10 23:27

963 ：１３２人目の素数さん：03/10/11 00:06

130て……。
まぁ、130まで行ってなくてもそゆふうに言うことはできるけどね。

964 ：１３２人目の素数さん：03/10/11 00:46

>>959
平均がnp、分散がnpqなのは二項分布。この問では、分布の形は仮定してない。
母平均m、母標準偏差σ、X1,X2,...,Xnが独立という３つの条件からE[X]とV[X]を
求めよという問題。
a1,a2,...,anを定数としたとき、
E[a1X1+a2X2+...+anXn]=a1E[X1]+a2E[X2]+...+anE[Xn]　　・・・①
V[a1X1+a2X2+...+anXn]=a1^2*V[X1]+a2^2*V[X2]+...+an^2*V[Xn]　　・・・②
なんていう公式はどんな教科書にも載ってると思うんだが。
a1=a2=...=an=1/n、E[X1]=E[X2]=...=E[Xn]=m、V[X1]=V[X2]=...=V[Xn]=σ^2
を①、②に代入すればいい。

965 ：１３２人目の素数さん：03/10/11 00:53

>>959
何がわからないかがわからない。

Ｖ（Ｘ＋Ｙ）＝Ｖ（Ｘ）＋Ｖ（Ｙ）　（ＸとＹは独立）
Ｖ（ａＸ）＝ａ＾２Ｖ（Ｘ）

これ知ってれば明らかだと思うのだが

966 ：ドキュソ：03/10/11 01:03

そうですねでも
E（ａＸ）＝ａE（Ｘ）
V（ａＸ）＝ａ^2V（Ｘ）
の証明はどこにものってません

967 ：ドキュソ：03/10/11 01:07

自明ですね　失礼しました
大学の教科書と数Cの教科書で記述が違うので
混乱しました　

968 ：１３２人目の素数さん：03/10/11 01:15

>>967
自明というほどではないけど証明は簡単かと。
証明が教科書に載ってないわけはないと思うが。

969 ：| ・肉・)ﾉｨｮｩ：03/10/11 11:43

すみません。
重回帰分析のダミー変数というのはいくつ設けても大丈夫なのでしょうか？

例えば、季節ダミーを設けると「春」「夏」「秋」「冬」とあって
それぞれを
1000
0100
0001
0010

と表して計算しますよね。この場合は季節ダミーは４種類なのですがいくつまでしか計算できないということはあるのでしょうか？
また統計ソフトでダミーも計算できるのでしょうか？

レベル低い質問ですみません

970 ：１３２人目の素数さん：03/10/11 19:02

>>969
そのまえに、そのダミー変数の作り方おかしくないか？

971 ：１３２人目の素数さん：03/10/11 21:23

ヤフー・共同通信・民主党のプロパガンダ疑惑
http://news2.2ch.net/test/read.cgi/newsplus/1065869158/

448 ：隣の名無しさん：03/10/11 21:00 ID:j0L0UsvD
散レスで申し訳ないのですが、>>248さんご提供の資料でちょっと単純な回帰分析してみました。

民主党投票数＝α　+　β×自民党投票数

結果、
Ｒ＾２が0.999を超えましたｗ。状況証拠だけで言えば明らかな作為が見られます。

498 名前：隣の名無しさん投稿日：03/10/11 21:07 ID:Wu5y+MhF
>>448
相関を出したもっと笑えた

自由民主党公明党民主党日本共産党
自由民主党 1
公明党 0.999624978 1
民主党 0.9998203190.999398175 1
日本共産党 0.998534081 0.99899655 0.998344414 1

　　　　　　　　自由民主党　　　公明党　　　　民主党　日本共産党
自由民主党　　　　　　　　1
公明党　　　0.999624978 　　　　　　　　1
民主党　　　0.999820319　0.999398175 　　　　　　　1
日本共産党 0.998534081　0.99899655 　0.998344414 　　　　　　　1

相関0.999以上って....

↑これってどのぐらい不自然なことなんですか？教えてくださいm(__)m

972 ：| ・肉・)ﾉｨｮｩ：03/10/11 23:13

＞＞９７０
え！？どうおかしいか指摘してください
お願いいたします｡･ﾟ･(ﾉД`)･ﾟ･｡うえええん

973 ：１３２人目の素数さん：03/10/15 13:55

T.Ａ.先生が検定すると必ず有意差が出てくるので、
T検定と呼んでいます。

974 ：１３２人目の素数さん：03/10/16 03:14

どこのT.A先生か教えて欲しいw

975 ：ダミー変数：03/10/19 21:35

>>972
亀レスごめん

とりあえず、ぐぐったらこんなとこしかなかったが、
ttp://sun.econ.seikei.ac.jp/~kawaji/class03/dat3/dat11.html

>分類変数　季節（春夏秋冬）　→　ダミー変数 (z1,z2,z3) = (1,0,0) , (0,1,0) , (0,0,1) , (0,0,0)
>ダミー変数は、分類数－１個だけ必要となり、どれかが１またはすべて０の組み合わせとなる。

ってことなので、あなたの書き方に従えば
　春　100
　夏　010
　秋　000
　冬　001
としなくちゃならない。

あなたのやり方のままだと、相関係数がどうなるか、やってごらん。

976 ：ダミー変数：03/10/19 21:38

>>972
あと、変数の数だけれども、一般的には重回帰の説明変数は10個ぐらいが限界と
聞いたことがある。ダミー変数でも同じでしょうね。

977 ：１３２人目の素数さん：03/10/21 20:28

他スレで答えてもらえなかったのでこちらで質問します。
解ける方おねがいします。

平均μの指数分布に従う母集団からの大きさｎの標本の標本平均をＹとするとき

Ｔ＝（２ｎ／μ）・Ｙ

が自由度２ｎのカイ二乗分布に従うのってどうしてでしょうか？

978 ：１３２人目の素数さん：03/10/22 12:44

使う側としては色々手法を発表せんといて欲しい。
方法選択の方法を勉強させんといて欲しい、時間を奪われてかなわんで。
とにかく生物医学系の統計手法はやたらと作られすぎである。
student's tはもはや古い手法であるとかな。
次々と手法を出してくるのは統計研究者が利用側から無視されんようにと、
必要も無いのにわざと｢研究｣しているように思えて成らぬ。
ためにする｢研究｣としか思えぬ。どうせ真理発見の方法にあらずして、
各自の主張の人為的根拠にするだけやからな。とくに医療系には
新しい統計分析手法とやらをする導入するクセがあるようやが
雑誌への採択確率を高めて分野内の競争で抜け出る不純動機ためかな。
採択確率への影響には、流布しておらん手法やと審査員には理解できんから
freepassする可能性もあるのではと思ってします。なんとなれば
医学生物系の統計処理には間違いが｢非常に｣多いという｢研究｣が存在する。
これが意味することは、審査員は対象論文の統計処理のsectionをpassして
読んでおるということやな。それもあって、生物医学系の統計処理では
新しい手法を今後は作るなというのが私の主張でアール。そして
統計研究者は大学を辞めて保険会社に転職したらよいのでアール。

979 ：１３２人目の素数さん：03/10/27 01:17

>>978

作る側から言わせて貰えば
>とくに医療系には新しい統計分析手法とやらをする導入するクセがある
とか
>採択確率への影響には、流布しておらん手法やと審査員には理解できん
とかさ、

要するに
前者は、医学生物系の研究者はオリジナルな研究するよりも
とりあえずジャーナル載せときたい、と考える人間が非常に多い。
後者は、医学生物系ではレフェリーすらアホ。
ってことを言いたいんだよね?

自分の研究分野を（結果的に）貶めてどうするよ。

980 ：１３２人目の素数さん：03/10/27 01:49

あるスレで最近話題の視聴率の話になって、>>892にある
ttp://www.videor.co.jp/rating/wh/07.htm
を参照して誤差は±いくつと言ってる人がいたので、この
ページの説明は各変量(サンプルから求めた視聴率)間の相
関を考えてないから間違いだと言ったらアホ扱いされたん
ですが、この場合は各変量は独立として考えても良いもん
なんでしょうか。

981 ：１３２人目の素数さん：03/10/27 16:56

結局テレビの視聴率による基準なんて半分神秘主義だべ

982 ：１３２人目の素数さん：03/10/28 15:00

９８２。

983 ：１３２人目の素数さん：03/10/29 15:00

９８３。

984 ：１３２人目の素数さん：03/10/29 23:35

だれか
積率および積率母関数について
さるでもわかるように教えてくれませんか？
よくわからないんですけど

985 ：１３２人目の素数さん：03/10/30 01:44

>>977 とりあえず、T = (2n/μ)Y = (2n/μ)(1/n)ΣX = Σ(2X/μ).
さて、2X/μ = x とおくと、X = (μx)/2 だから、
∫[0;X](1/μ)exp(-X/μ)dX = ∫[0;x](1/2)exp(-x/2)dx.
ここで、(1/2)exp(-x/2) = (1/(2^(2/2)Γ(2/2)))x^{2/2-1}exp(-x/2)
なので、2X/μは自由度2のχ^2分布に従う。これは、正規分布変数の2乗 2個
の和の分布ということ。最初にもどると、これをn個まとめるので、正規分布
変数の2乗 2n個の和の分布をする。いいかえると、Tは自由度2n のχ^2 分布
に従う。

986 ：１３２人目の素数さん：03/10/30 01:46

>>984 原点周りのr次積率(moment)というのは、確率変数をXとするとき、
X^r の平均にすぎない。r = 1 のときはそのまま普通の平均。r = 1, 2 が分
かれば分散が計算でき、r = 1, 2, 3 で歪度、r = 1, 2, 3, 4 で尖度が計算
できるので便利な存在。

積率母関数(moment generating function)というのは、M'(0) が1次積率、
M"(0) が2次積率、M"'(0)が3次積率、M""(0)が4次積率、… となるように巧妙
にテイラー展開を利用する、積率を産んでくれるお母さんのような関数。

と胡麻化すことにしている。

987 ：ああ：03/10/30 02:43

　ビデオリサーチが関東で依頼しているサンプル世帯は600軒。
毎月25世帯ずつ入れ替えるから2年で全世帯が変る。
対象世帯は統計理論によって無作為抽出。
引き受けてくれた家庭には最高8台までのPM（ピープルメータ）が設置され、4歳以上の家族全員にテレビの見はじめと終わりに個人別ボタンを押してもらう。
それによって世帯視聴率と個人視聴率が記録され、自動的にコンピューターセンターに送られる。
そのサンプル世帯を興信所を使って調べたうえで買収依頼したというのだから手が込んでいる。
まさに無作為抽出した家庭にはどういう人物がいるかも不明であって、露見すれば番組そのものが打ち切りになり、自分も解雇されることは明々白々である。
それなのになぜ、というのがいちばんの問題である。

988 ：１３２人目の素数さん：03/10/31 01:57

>>984

こういうコト書くのはなんだけど、>986の続き風なことを書くと、
しばしば子を産めないお母さんもいるわけで、
そういう時は、特性関数つかって人工授精させる、と。

989 ：984：03/10/31 15:47

>>986 >>988
ありがとうございます
なんとなくわかりました。
要するに計算に便利だから積率を導くのですね

990 ：１３２人目の素数さん：03/10/31 16:21

990

991 ：ひみつの検閲さん：2025/03/07(金) 11:21:19 ID:MarkedRes

このレスは権利侵害の申し立てや違法もしくはその疑いにて不可視または削除されました。
削除日時：2016-07-08 19:58:21
https://mimizun.com/delete.html

992 ：１３２人目の素数さん：03/11/01 16:30

９９２。