統計学なんでもスレッド3

1 ：１３２人目の素数さん：04/10/11 19:37:36

前
統計学なんでもスレッド2
http://science3.2ch.net/test/read.cgi/math/1068288283/

2 ：１３２人目の素数さん：04/10/11 19:47:45

2げとずさー

3 ：あぼーん：あぼーん

あぼーん

4 ：あぼーん：あぼーん

あぼーん

5 ：１３２人目の素数さん：04/10/11 20:25:27

２群の差の検定で、片方の優越性を確かめる時に両側検定をするのって気持ち悪くないですか？

6 ：１３２人目の素数さん：04/10/11 21:37:11

>>3、>>4
ガッ

消えろ！！

7 ：１３２人目の素数さん：04/10/11 21:53:52

荒らしを統計的に分析できるかな？
例えば、ポワソン回帰。時間、もしくはレスの数がオフセット。
発生要因は何にしようか？

一般的な荒らされ方(帰無仮説)に比べてこのすれの荒らされ方はどうなのかとかを分析できるのだろうか？

8 ：LettersOfLiberty ◆rCz1Zr6hLw ：04/10/11 22:57:33

条件付期待値の導入についてだが、どうも私の書いた方法は一般的には通用しないらしい。(前スレ参照。)

9 ：LettersOfLiberty ◆rCz1Zr6hLw ：04/10/11 23:00:31

いかんな、さっきまでとんでもないことを大真面目に遣っていたのか。

10 ：１３２人目の素数さん：04/10/11 23:02:33

>>9
条件がσ-fieldとか確率変数とかの場合と勘違いしてたんだろ？

11 ：１３２人目の素数さん：04/10/11 23:53:36

標準偏差と標準誤差の違いって何なのでしょう（どちらもｎ-1で割るとして）？

標準偏差は
1　母集団が正規分布すると分かっている（何回も測定して）
もしくは
2　ｎが大きい
という性質で、この逆が標準誤差でしょうか？

12 ：１３２人目の素数さん：04/10/12 01:19:42

>>11
標本統計量の標準偏差を標準誤差と言ってるだけだよ。

13 ：前スレ966(959)：04/10/12 04:04:43

> 前スレ　964

ご丁寧なレスをどうもありがとうございました。
お礼が遅くなり、申し訳ありません。
カイ二乗に関して、とんだ勘違いをしておりました。
ボンフェローニの調整って、確か、読んだ本に載っていました。
もう一度きちんと勉強しなおします。

あの、最後に基本的な質問があるのですが、
今、やろうと思っている言語学（具体的には社会言語学）の調査は、
言語使用状況（具体的には対話相手のタイプ）が３つあって、
このどこか２者間に有意差がでれば、それで十分で、
全体をまとめて「有意差有り」という結論を出す予定は
ありません。　（社会言語学の調査は、
教科書によると、post fact design型というそうで、
言語の使用状況の要因の相関関係がわかればいいので、
結構大雑把でOKだと思うのです。）
この辺りが、実験計画の厳しい医学などの分野と
違うところだと思うのですが、
この場合は、カイ二乗3回でもいいのでしょうか。。

14 ：前スレ966(959)：04/10/12 04:09:56

>前スレ970

レスをどうもありがとうございました。
多重比較のHolmの方法って、多重比較の本に載っていました。
もういちど、きちんと勉強します。

15 ：LettersOfLiberty ◆rCz1Zr6hLw ：04/10/12 11:38:45

部分σ集合族に関する条件付期待値は、
ラドンニコディム微分を使って定義されるようだが、
ラドンニコディム微分でできる関数はどうやって特定するのだろう？

16 ：964：04/10/12 12:06:10

前スレ966さんが言っているのは次の2番目のものでしょうか？

1.複数の帰無仮説の内、その中の一つでも有意ならば有意とする。
2.複数の帰無仮説一つ一つが別の検定項目であり、それぞれ有意ならば有意とする。

2番目だったらカイ2乗検定を3回でも問題ありません。
もしくは、相関関係を知りたければ検定以外の方法を使ったほうがいいかもしれません。
「CramerのV統計量」というものがあります。相関関係を見るために相関係数というものがありますが、｢CramerのV統計量｣は分割表での相関関係を表すものです。
カイ2乗検定は実質的に比率の差があるかどうかを確かめる方法ですが、差がほとんど無くてもデータが多くなれば差があるといってしまいます。
だから、カイ2乗検定の有意確率が小さいからといって"強い"相関関係があるとはいえないんです。

ところで、分野によっては検定方法が甘くてもクレームが付くことが少ないようですね。

17 ：前スレ966：04/10/13 22:14:59

>964

お礼が遅くなってしまいました。
いつもご丁寧なレスをどうもありがとうございます。
カイ二乗検定３回でもOKとのことで、安心致しました。
CramerのV統計量というのは、初めて聞きましたが、
相関係数がより正確にわかるとのことなので、
本などで調べて、勉強しようと思います.

＞ところで、分野によっては検定方法が甘くてもクレームが付くことが少ないようですね。
そうなんです。言語学の分野は、最近皆が統計を使い始めた感じなので、
参考書も少なく、経営学や医学分野の参考書を読んでも
具体例が違うので、なかなか理解が深まらずに困っていたところです。
でも、今後は、統計の使い方もどんどん厳しくなっていくと
思うので、頑張って勉強します。
本当にいろいろとご親切に、どうもありがとうございました。

18 ：１３２人目の素数さん：04/10/13 22:47:06

おまえら
　　　　　「モンテカルロ方」
が何なのか?
漏れにもわかるよーに説明しなければいけませんよ。！

19 ：１３２人目の素数さん：04/10/13 22:56:26

>>11
　詳しくはわからないのですが、先生に聞いた話ですと、
　統計学では、標準誤差を２つの意味で使っているそうです。

>>12さんのご指摘のように、単に標本の標準偏差を標準誤差と
　呼ぶこともあるそうです。

　ところが、推定標準偏差も標準誤差と呼びます。
　統計家の口から、標準誤差という単語が出たときには、
　普通はこちらの意味だそうです。

　例えば、次のURLなどが参考になると思います。
　ttp://www.nuis.ac.jp/~mat/fpr/fpr1997/0281.html

20 ：１３２人目の素数さん：04/10/14 01:43:11

スパムフィルタとしても利用されてるベイズの定理ですが
これの最新の改良版のような概念はありますか？

21 ：１３２人目の素数さん：04/10/14 07:34:58

復刊にご協力下さい。

竹内啓,柳井晴夫多変量解析の基礎　東洋経済新報社
http://www.fukkan.com/vote.php3?no=22328

統計学を専門とする人ではなくとも、
多変量解析を使うときに手元に是非置いておきたい名著。
多変量解析の基礎理論がわかりやすくかつ体系的に厳密に展開されていきます。
多変量解析に関するこれだけの名著は未だに出ていないと思います。

よろしくお願いします。

22 ：１３２人目の素数さん：04/10/14 13:36:35

ランダムウォークの関数

f(t) = f(t-1) + 正規分布乱数

を作って、これをいくつか纏めて平均します(一週間分まとめて週単位で調べたかった)
g(u) = f(u*5+0) + f(u*5+1) + f(u*5+2) + f(u*5+3) + f(u*5+4)

そしてこの差分を作って(週単位の差分の性質を調べたかった)
h(v) = g(v) - g(v-1)

h(v) の自己共分散γ(i)を作ったのですが、
僕は γ(0) 以外は 0 になると推測したのですが、実際にコンピュータで乱数を発生して
作ると、γ(1) にも正の値が出てしまいました、これは乱数がいい加減なのか、
それとも論理的にそうなるのか分る方おられますでしょうか？

23 ：１３２人目の素数さん：04/10/14 13:41:51

冗長性分析について詳しいサイトないですか？

24 ：１３２人目の素数さん：04/10/14 15:37:44

>22

それは非ゼロになります。

一週間を５日として、vを週を表すインデックスとすると、
h(v)=g(v)-g(v-1)
＝今週の月曜日の値ー先週の月曜日の値
　＋今週の火曜日の値ー先週の火曜日の値
　＋．．．＋今週の金曜日の値ー先週の金曜日の値
ですね。

（今週の月曜日の値ー先週の月曜日の値）は、先週の火曜日から今週
の月曜日の間にf(t)に起きた変化を表します。
（今週の金曜日の値ー先週の金曜日の値）は、今週の月曜日から今週
の金曜日の間にf(t)に起きた変化を表します。

従って、h(v)は今週にf(t)に起きた変化と先週にf(t)に起きた変化の
両方を含んでいて、h(v-1)は先週にf(t)に起きた変化と先々週にf(t)
に起きた変化の両方を含んでいます。よって、h(v)とh(v-1)の相関は
非ゼロになります。

式で確かめたかったら、f(t)=f(t-1)+x(t)とおいてh(v)を計算する
と、h(v)とh(v-1)が共通する項を含む事がわかるでしょう。

仕事にもどります。後のフォローは他の方よろしくお願いします。

25 ：１３２人目の素数さん：04/10/14 15:44:21

>>22
自己レスです、これ相関ありますね。

26 ：１３２人目の素数さん：04/10/14 15:45:49

>>24
あ、どもですリロード忘れてました、有難うございます。

27 ：１３２人目の素数さん：04/10/14 17:26:32

体の拡大がイマイチ分らない。簡単（記号じゃなくて）な解説キボンぬ。

28 ：LettersOfLiberty ◆rCz1Zr6hLw ：04/10/14 17:29:10

Re:>27 それを何故此処で訊くのか？

29 ：１３２人目の素数さん：04/10/15 00:54:23

素人の書き込みをお許しください。

学校の授業で消費者のアンケートを取る必要があり、
街頭アンケートを行う予定でいるのですが、どれくらいの
回答数があれば信用度があると言えるのかが分から
なくて困っています。

アンケートの内容は、一般的に流通している商品（車とかカメラ）
について、イメージする企業またはブランドは何か?といった
内容です。

よくトリビアの泉とかでは２０００人を無作為にアンケートすれば
統計学的に信用できるデータである、というようなことを言ってい
ますが・・・。

ちなみにアンケートをする際には性別と年代も一緒に答えてもらう
予定です。

スレ違い等であれば無視していただいて構いませんが、ご教授い
ただければ幸いです。

よろしくお願いします。

30 ：１３２人目の素数さん：04/10/15 02:05:08

>>29

例えば、こんな↓本とかをご参考にしてはいかがでしょう？
ttp://www.hws-kyokai.or.jp/132book-sousetu.html#yokuwakaru

31 ：11：04/10/15 23:22:55

>12　>19　ありがとうございます。標準偏差も標準誤差も意味は一緒と思ってても
そんなに致命的でないと考えて生きていきます

32 ：１３２人目の素数さん：04/10/16 01:47:18

統計のはなし
　　　↑
　　てわかりよい？

他にも良い目の奴教えておくれでないかい？

33 ：29：04/10/16 08:43:41

>>30

くだらない質問に答えていただきありがとうございました！

それらを参考にしながら頑張ってみます！

34 ：あぼーん：あぼーん

あぼーん

35 ：１３２人目の素数さん：04/10/16 09:51:46

|　　　　無茶苦茶喰った。臭い物ならなんでもよかった。今は反芻している。
`──────────y────
　　　　　　＿＿＿　AA
　　　 *～/▼　■⊂ ﾟ　ﾟ P
　　　　 |　●　●.（＿Д）
　　　　　 U U￣￣U U

36 ：LettersOfLiberty ◆rCz1Zr6hLw ：04/10/16 14:19:54

Re:>34 捏造すんな。

37 ：１３２人目の素数さん：04/10/21 05:07:22

965

38 ：１３２人目の素数さん：04/10/21 19:40:44

B市の市長の見解では、B市の所得水準は県全体の平均水準より高い
ということである。この見解を検討するためにB市の市民の中から
２００人のサンプルを無作為抽出し調査したところ、その標本平均
X（上に線がつく）は４３５万円であった。県全体の一人当たりの
平均所得は４３３万円であるとする。市長の見解は統計的に妥当と
いえるか、有意水準５％で検定せよ。なお過去の調査から母集団は
正規分布で近似でき、B市全体の所得の標準偏差は２０万円である
ことがわかっているものとする。

とき方が分かりません。計算方法がわかればいいんですが・・・
お願いします。

39 ：１３２人目の素数さん：04/10/21 19:43:19

偏差値の概念
ある母集団の標準を偏差値５０、７５を上位0.6%とし、２５を下位0.6%とする。
この観点からいくと、上限は７５で下限は２５となる。
ただし例外もあり、上位0.6％の平均が８０点だとして、
一人だけ１００点だったとすると、その者の偏差値は９０近くなったりもする。
0.6％のグループの中で抜きん出た者がいない場合、７５が上限である。

http://www.o-shinken.co.jp/benkyo/hensati/hensachi.htm

まさか偏差値の概念が分からないやつ、こんなにいるとは思わなかったね。

上位0.6％が７５程度になるのは必然であって、
上位１％を８０以上にする事はないんだぞ？
偏差値の仕組み分かってる？

40 ：１３２人目の素数さん：04/10/21 19:56:26

いろいろなレベルの知識の人が集まるのは当然でしょう。
余計なことは言わずに、
優しく丁寧に教えてあげればいいんですよ。

41 ：１３２人目の素数さん：04/10/22 04:36:07

>>38
B市の平均所得をμとして、
H0:μ=433 を H1:μ＞433 に対して有意水準5%で検定する。
　検定統計量Zは
　　　Z= (435-433) / (20/sqrt(200)) =sqrt(2)≒1.414
となる。
　標準正規分布の5%点は Z(0.05)≒1.64 なので、1.414＜1.64
よりH0は受容される。

42 ：１３２人目の素数さん：04/10/22 16:41:46

グラフ表示のプログラムを作ろうと思っているのですが、
Ｙ軸の目盛りの計算方法が分からず悩んでいます。
エクセルで適当な数値を入力してグラフを表示して、
目盛りの間隔と、目盛りの最大値をどのように変化
していくのか調べてみました。

最小値, 最大値, 差分, 目盛間隔, 目盛Max, 目盛の数
0.01, 0.02, 0.01, 0.005, 0.025, 5
0.01, 0.05, 0.04, 0.01, 0.06, 6
0.01, 0.1, 0.09, 0.02, 0.12, 6
0.01, 0.2, 0.19, 0.05, 0.25, 5
0.01, 0.48, 0.47, 0.1, 0.6, 6
0.01, 0.96, 0.95, 0.2, 1.2, 6
0.01, 1.91, 1.9, 0.5, 2.5, 5
0.01, 4.8, 4.79, 1, 6, 6
0.01, 9.53, 9.52, 2, 12, 6
0.01, 19.1, 19.9, 5, 25, 5
0.01, 48, 47.99, 10, 60, 6
0.01, 95.3, 95.29, 20, 120, 6
0.01, 190.5, 190.49, 50, 250, 5
0.01, 476.2, 476.19, 100, 600, 6
0.01, 952.4, 952.39, 200, 1200, 6
0.01, 1905, 1904.99, 500, 2500, 5
0.01, 4762, 4761.99, 1000, 6000, 6

このサンプルから、目盛りの最大値、目盛りの間隔を求める式が
分かる方、ご教授お願いします。

43 ：１３２人目の素数さん：04/10/24 06:04:09

サンプルと同じにするには難しいから、自分でもっと
適当なものを作るべし。
Excelは目盛り数値のななめ、縦表示も行っているから、
全く同じにするには、結構難しいぜ？

適当に決めていいのならば、例えば以下のようにする。
メモリの最大値はデータの最大値を１０％上乗せしたものとかさ。
これをＹ最大としよう。
データによっって上に間隔をあけるのでもいいし、下に間隔を
あけるのでも好きにしていい。
ま、Ｙ軸上に間隔をとったとしよう。

すると、間隔は、例えばＹ軸の場合、Ｙ最大ー最小値を
割って、でーたの上位桁から順に見ていった間隔が１より大きい
ところと、その１つしたのけたの範囲をもとめておく。
それぞれＫとＬとおこう。
そして、Ｙ軸の場合、フォントの高さ＊Ａ（Ａは１．５とか２とか
適当にセットする。）。その値と先程のＫとＬの値を比較して、
小さい方を選ぶ。

すると、Ｙ軸の目盛りはフォントもちゃんと表示できて、
間隔も変な値ではない値が選択できる。

Ｘ軸はフォントの幅 * 最大桁数を基準のひとつとして
同様にやる。

これには規則はないから、好きにやってよいが、
プログラムで座標計算を一度もやったことがないと
小一時間かかるかもしれない。
でも、簡単でしょ？

44 ：１３２人目の素数さん：04/10/24 12:16:33

単発質問スレ立てて削除依頼も出さないような香具師は放置でいいのに

45 ：１３２人目の素数さん：04/10/24 15:10:06

統計学者になれば株で大もうけできますか？

46 ：１３２人目の素数さん：04/10/24 17:36:24

>>45
できる。できるよ。

47 ：StatView愛用：04/10/25 22:54:21

repeated-measures ANOVAで直行対比間の分散が均一ということが
満たされていない場合，２次効果の自由度の補正が必要となりますが，StatView5.0では
は球面性の検定から自由度の修正まで行ってくれるのでしょうか？

48 ：１３２人目の素数さん：04/10/25 23:01:05

投機のほうは人間力が必要だから数学だの金融工学だの
机上の計算だけできてもだめ。

49 ：あぼーん：あぼーん

あぼーん

50 ：１３２人目の素数さん：04/10/26 01:23:16

>>47
47さんに３つ聞きたいことがあります。
1．直交対比間とは何？
2．球面性の検定って、どんな検定？　帰無仮説は？
3．自由度の修正って、例えばサタースウェイトとか？

51 ：１３２人目の素数さん：04/10/26 02:05:19

統計は最初のとこでつまづいてしまって、、
すんません。教えて、、いくら本読んでも、インターネット
調べてもわからん。。俺がバカなのは分かった。

なんで「分散」ってのは、偏差を二乗すんの？
絶対値ではだめなの？
偏差の絶対値を使うデータの散らばりの指標ってないし、、

52 ：１３２人目の素数さん：04/10/26 02:40:55

>>51
たぶん微分したりするのに便利だとかユークリッドノルムに似ているとか
いろいろ理由はあるんだと思う。

絶対値を使う奴は平均偏差というのがちゃんとあるけどあまり使われない。
絶対値って使いにくいんだよね。場合わけとか。特に微分がアウト。

53 ：LettersOfLiberty ◆rCz1Zr6hLw ：04/10/26 12:11:10

Re:>49 早く消えろ。

54 ：１３２人目の素数さん：04/10/26 12:51:25

>>52
計算機の発達でその点は解消していると思うよ

55 ：47：04/10/27 23:21:09

>>51
すみません、私も良く分からないです。

56 ：１３２人目の素数さん：04/10/28 00:03:26

>>51
微分に限らず、数学的に扱いやすいかどうか、って問題なんだけどね。
簡単に思いつくものでも、XとYが独立ならV(X+Y)=V(X)+V(Y)とか、共分散との整合性とかね。とても理論的な構築がしやすい。

絶対偏差や、下半絶対偏差とか色々概念自体はあるんだけど、どの分野でも理論構築が容易なものが普通は数学的標準となるわな、やっぱり。

57 ：１３２人目の素数さん：04/10/28 23:58:58

たぶん統計学の問題だと思うけど
誰か詳しく教えてくんさいな。
　町内の空き地の有効利用に関する試案Aに対して無作為に
９人の住民を選び、賛成反対を尋ねた。すると賛成２人、
反対７人になった。賛成者と反対者の人数には実質的な差
があるかどうか。
　帰無仮説をたてて、それ以降はよく分からなかったデス。
ちなみに心理学の授業で出されますた。

58 ：１３２人目の素数さん：04/10/29 07:43:17

>>57
賛成確率を１/２として二項分布の正規近似を行えばよい。

59 ：１３２人目の素数さん：04/10/30 02:13:55

>>57
http://r.nakama.ne.jp/Rweb-jp/
へ行って，binom.test(2,9)を入力して実行。

出力を読めば，何となくわかるような・・・

60 ：１３２人目の素数さん：04/10/30 13:14:52

統計ソフトStatViewを使っています．サポートが無いので
使うなと上司に言われているのですが，計算自体の問題点が無いのなら
使いつづけてもいいかと思っているんですが，まずい点があるかどうか
ご存知の方教えてください．

61 ：１３２人目の素数さん：04/10/30 15:00:39

そういうことをここで聞かないといけないという点がまずい。

62 ：１３２人目の素数さん：04/10/31 09:50:39

すみません
統計数学のいい教科書を探しています
よろしくお願いします

63 ：１３２人目の素数さん：04/10/31 14:41:02

>>60
統計ソフトはSPSSが良いね。
値段も16万くらいしかしないし、プログラミングスキルも殆ど必要ないから
使いやすい。
ただし、ノンパラ多重比較ができないのが難点。

64 ：１３２人目の素数さん：04/10/31 16:29:32

>>63
ビジネスsoft板ではspssは玩具で結論がでていますが？

65 ：１３２人目の素数さん：04/10/31 16:41:21

統計ソフトはRで充分だろ？

66 ：１３２人目の素数さん：04/10/31 16:45:05

お金があればSAS

67 ：１３２人目の素数さん：04/10/31 17:09:02

Exelで十分だと思われ。
まぁ、マクロを作る能力がなければ別問題だが・・・

68 ：１３２人目の素数さん：04/10/31 17:11:30

無知を露呈する67

69 ：１３２人目の素数さん：04/10/31 18:13:09

Fortranで十分だと思われ。

70 ：60：04/10/31 18:18:45

ありがとうございます。
今のところ、RやSASの勉強に踏み切れないんで、
StatViewがExcelのいくつかの関数のように
統計学上問題のある手法を含んでいるか
聞きたかったんですが・・・・

R勉強してみるかなあ

71 ：１３２人目の素数さん：04/10/31 20:41:32

実務家ならＲはきついよ。

72 ：DonkeyKing：04/10/31 21:44:22

もう1人逝った
　　　　　　　　　　　　　|二二二二二二二二二二二二二
　　　　　　　　　　　　　| |　　　　　　　　　|　　　　　　　| |
　　　　　　　　　　　　　| |　　　　　　　Λ|Λ　　　　　　| |
　　　　　　　　　　　　　| |　　　　　　　（ / ⌒ヽ　　　　　
　　　　　　　　　　　　　| |　　　　　　　　| |　　 |　← 人間のクズ kingのなれの果て
　　　　　　　　　　　　　| |　　　　　　　　∪ 亅|　　　　　　
　　　　　　　　　　　　.//|　　　　　　　　| | 　 |　　　　　| |
　　　　　　　　　　　　// .|　　　　　　　　　∪∪　　　　| |
　　　　　　　　　　　//　.|　　　　　　　　　　：　　　　　 | |
　　　　　　　　　　　//　 .|　　　　　　　　　　：　　　　　 | |
　　＿＿＿＿＿__//＿__.|＿＿＿＿＿＿＿＿＿＿＿| |＿＿＿＿＿＿＿＿＿
　＼　　　　　　　　　 .￣~~|￣￣￣￣￣￣￣￣'~|￣　　　　　　　　　　　／　　
　　　| |＼　　　　　　　＿___|＿＿＿＿＿＿＿＿__|＿＿　　　　　　　　| |
　　　| |　＼　　　　　　　|　　　　　　　　　　　　　　　|　　　　　　　／　| |

（省略されました・・全てを読むにはここを押してください）

73 ：１３２人目の素数さん：04/11/01 00:24:10

基本的なことだろうとは思うのですが、よく分からなくなってしまったので質問させていただきます。

検定の結果p=0.01となると、5%等ふつうの有意水準の設定では有為な差があると判断されます。
しかし、あくまでp=0.01なので、このような事例が100例ある場合には、その中の一例くらいは本当は偶然の結果だということにならないのでしょうか？

お馬鹿な質問で申し訳ありませんが、よろしくお願いします。

74 ：１３２人目の素数さん：04/11/01 00:41:45

>>73
なる。
しかし完璧な事例など無いのだから、どこかで線引きしないといけないじゃん？

75 ：１３２人目の素数さん：04/11/01 00:43:01

ノンパラ型の2群間比較(プラセボを用いた2重盲検比較試験)についての質問です。

パラ型なら、投与後と投与前の変化量(差)をとり、2群間の差について
対応の無いt検定を行なえば問題ないですが

例えば、投与前と投与後に疾患の程度を5段階のカテゴリカルデータで判定
(5:大いに問題あり　4.問題あり　…1.問題なし)して、
実薬がプラセボに対して有効であったかを検定したいのですが、
このようなケースでもパラ型のように変化量(差)をとって
ウィルコクソンの順位和検定をしてもいいんでしょうか？

①順位尺度データなので差をとることは絶対にNG！
(※例えば、5⇒3の変化と3⇒1への変化は必ずしも同じとはいえない)
なので、符号検定までにとどめておくべき。
②※が問題にならないともいえないが、ノンパラ検定は頑健性があり
順位尺度データの差をとって検定を行なっても差し支えない。
また、この方式の方が｢程度の改善レベル｣まで勘案した検定結果になる。

自分の考えでは②を支持したいと思いますが詳しい人のご指導お願いしまつ。

76 ：１３２人目の素数さん：04/11/01 01:30:23

>>75
> ウィルコクソンの順位和検定をしてもいいんでしょうか？
よくない。スピアマンかあるいはケンドルを適用しなさい。

77 ：１３２人目の素数さん：04/11/01 02:52:04

私は数学素人なんですが、
最近、ブラックジャックのカード・カウンティングに
興味をもっていて、カード・カウンティングによって
得られるトゥルー・カウント値（＝ＴＣ）と、そのＴＣのときの
ブラックジャックのゲームの期待値との間の
関係を調べたいのですが、「マルコフ連鎖モンテカルロ法（＝ＭＣＭＣ）」というのは
使えますか？もし使えるのならその基本的な考え方を教えてくれませんか？
ＭＣＭＣが使えない、あるいは使うべきでないならどんな方法を使うべきでしょうか？

78 ：１３２人目の素数さん：04/11/01 20:37:07

ひとつ質問させてください。

今、二群間の平均値の差をｔ検定で比較していたのですが、
有意差なしでした。この場合、
「type2error（第二種過誤率）ももとめて、
本当に差がないのか検討しなければならない」
と参考書に書いてありました。
しかし、excel、statviewの画面にそれっぽい値は出ず・・・。
第二種過誤率を計算してくれるソフトまたは簡単な式などないでしょうか？

よろしくお願いします。

79 ：１３２人目の素数さん：04/11/02 20:46:54

>>76
75氏ではないが、何故に差の検定で順位相関係数の話が出てくるの？

80 ：１３２人目の素数さん：04/11/02 22:52:02

数学板「分からない問題はここに書いてね１９１」スレから誘導されて来ました。

function generatorから出した信号をAD-DA変換装置を通して量子化しました。
８ビットでの量子化と、４ビットでの量子化を行いました。
入力信号の振幅を0.025ずつ大きくしていったときの量子化値と、実際の振幅との誤差を出していきました。
ここで、８ビットでの量子化誤差と４ビットでの量子化誤差を見比べて８ビットでの量子化の方が精度が良い
ことを述べるのには、求めた誤差の値をどう見れば良いのでしょうか？

私は、８ビットの場合の誤差の標準偏差と４ビットの場合のそれとを比較し、
８ビットのものの標準偏差の方が０に近いから、値のばらつきが少なく精度が良い
としました。この議論は正しいのでしょうか？よろしくお願いします。

81 ：１３２人目の素数さん：04/11/02 23:40:06

>>80
仮に4bitより8bitの方が0.01だけ精度が良かったとしても、
その差に意味があるのかわからない（たまたま差が出ただけかもしれない）ので、
検定した方がいいと思う。
この場合って繰り返しのない二元配置分散分析法でいいのかな？

あとは図示するのも大事。
検定ばっかりやってると足元すくわれる。

82 ：80：04/11/04 15:56:49

>>81
レスありがとうございます。
やはり検定ですか。

83 ：１３２人目の素数さん：04/11/04 16:20:32

統計学のargminとか、argmaxというのはどうゆう意味があるのでしょうか？勉強していたら、記号がちょっと分からなくて行き詰まってしまって。もし良かったら教えて下さい。宜しくお願いします。

84 ：１３２人目の素数さん：04/11/04 20:05:26

>>83
私自身はそういう記号は使ったことはありませんので説明が下手ですが、
　例えば、argmin( (a,b) , F(a,b) ) は関数Fの値を最小にする
　引数（argument)の組である(a,b)のことです。
　最小の(a,b)という訳ではありません。

　また、例えば、y=f(x)において、argmax Σ_(i={ f(x)=y })^(n) si
などと書かれていたら、sの総和を最も小さくするyのsetの
　ことです。

85 ：84：04/11/05 16:12:20

>>84
とても分かりやすく、理解出来たきがします。ありがとうございます！

86 ：g：04/11/05 16:56:42

白色雑音の定義って、どんなのがありますか？
一番きれいなのを教えてください！

87 ：１３２人目の素数さん：04/11/05 18:26:49

>>86
chaos

88 ：mu：04/11/06 00:43:44

すべての確率変数の背後には、
確率分布一定の(複数の)要因があると考えてもよろしいのでしょうか？

89 ：１３２人目の素数さん：04/11/06 01:32:29

>>88
確率変数の概念自体あとづけです。
分布も経験則と整合性を保つという前提の下で作出されたものです。

90 ：１３２人目の素数さん：04/11/06 13:18:59

>>88
　えーとですね、質問の意味がよくわからないのです。
　「要因がある」というのが、実証分析上での確率変数（説明変数など）
　のことなのかなと思います。

　確率理論は専門ではないのですが、実証的な統計学でいうと、
　例えば、「ｘを確率変数とする」という記述があるとしたら、
　それは、「なんらかの確率によって変動する変数」という
　ことになりますから、「なんらかの分布」が背後にあるという
　ことになると思います。
　>>88さんの場合には、「要因」という単語を使われていますので、
　例えば、説明変数としての確率変数が、ちゃんと説明変数として
　妥当な式（例えば回帰式など）を考えているのかどうかという問題にもなると思います。

　変な説明で申し訳ないです。

91 ：mu：04/11/06 14:15:58

>>89 >>90
お返事ありがとう。

たとえば、サイコロ２つ振ってその合計を出す確立変数 X を考えると、
その確率変数の背後には、サイコロが等確立 1/6 で
一様に目を出すという確立変数があるわけですよね。
この確立分布一定の２つの確率変数の和として X が表現されます。

このことが他の確率的な現象にも適用できるとは言い切れないのだろうか、
というのが質問の内容です。

たとえば、１年に渡る交通事故の発生を表す確立変数 Y を考えた場合、
その背後に確率分布一定の確率変数が複数あって、
その和として Y を記述できないのだろうか、ということです。

92 ：１３２人目の素数さん：04/11/06 16:54:24

あのね、その例だとベルヌーイ分布を仮定して満足すると思うけど
それを他の事例にも適用してフィットするかどうかはよく考えないといけないだろうね。
適当な本をみれば
正規分布 χ^2分布 t分布Ｆ分布ポアソン分布幾何分布超幾何分布指数分布ワイブル分布
Γ分布 β分布コーシー分布対数正規分布パレート分布等々
があって、それぞれの特性をうまく利用して個々の確率現象を捉えないといけないと思うよ。

93 ：mu：04/11/06 16:59:42

>>92
いつも丁寧な回答ありがとうございます。
適切な確立モデルを選択すべきというのは分かるのですが、
私がお聞きしたかったのは、もっと物理的あるいは哲学的な問いでして、
宇宙に存在するすべての確立的な現象の背後に、
何か統一的な、あるいはアトミックなランダム現象が存在するのではないか、
というような予感から発せられた問いなんです。
もしアトミックなランダム現象が存在するとすれば、
それは数学的にどのようなものであることが予想されるか、ということです。
曖昧な問いかけですいませんが。。。

94 ：１３２人目の素数さん：04/11/06 17:13:15

じゃあ、黒色雑音って?
白体輻射って?

95 ：１３２人目の素数さん：04/11/07 02:40:56

>>91
サイコロの各目が1/6の確率で出るというのは

1.ラプラス説　サイコロのどの面も一様だから同じ確率になるべきだ
2.頻度説　　　たくさん振ったら1/6に近づくだろ？

に基づいてるとのこと。
確率は何かということについて上の二つとベイズ統計の立場とかあって
哲学的な論争もあるらしいけど決着はつかないとか。

ではどうしているかというと、数学ではコルモゴロフの公理系と呼ばれる
数学で興味のある部分だけ取り出して、これを満たせば何でも確率といって
論争からは逃亡してしまっている。どの説を採ろうともこれを満たすわけで
建前としては公理系を用いて、本音では実際の問題を考えるときに
その場その場で都合のいい説を持ってくればいいわけ。

>>93　の話になると科学哲学の話で数学じゃないかもしれない。
まあここで話しちゃいけないとはいわないけど、期待した答えが
返ってくるかどうかはわからない。

96 ：１３２人目の素数さん：04/11/07 13:20:38

>>93
　えー、なかなか回答が難しい質問ですね。(^^;
　>>95さんのおっしゃるとおりなんですが、私も昔、そのような
　普遍的なものを考えたことがあります。
　私はもちろん、理論物理や素粒子理論なんてわからないのですが、
　>>93さんのお考えになっていることは、おそらくエルゴート仮説に
　近いものかなと思いました。
　もとはLiouville（リューヴィル）の正準方程式に関する保存定理ですが、
　運動方程式（一階微分方程式）の時間的性質が位相空間上に測度として
　保存されると言うことです。これがLiouvilleの定理です。
　そして、それから派生したのがエルゴート仮説であり、統計力学で
　生まれた用語らしいです。
　これもLiouvilleの定理に似ていて時間平均は集合の平均が位相平均
　に等しいというものです。
　これを時間軸から空間軸に延長してやると、時空間にわたる、大数の
　法則のような感じになって、時間も空間も結局同じことが言える、
　（＝同じ性質を持つ）ということらしいです。

　またまた下手な説明で申し訳ありませんが、調べてみて下さい。
　もしかすると２１世紀に残された宇宙論の大問題、暗黒空間を
　解明できるかもですよ！

97 ：１３２人目の素数さん：04/11/07 22:00:10

経済モデルなどを実証分析するとき、データを対数変換する意味って
何なんですか？初心者ですいません。

98 ：１３２人目の素数さん：04/11/08 18:53:31

ひょっとしたら全然スレ違いかも知れないんですけど助けてください･･･
授業でＳＡＳ（のやり方自体）をやっているのですが、データを作って読み込んでも
２０行作ったうちの１０オブザベーションしか読み込まれません。
おかしいなと思いつつ上半分下半分にデータをわけて２つ読み込むと
今度は５オブザベーションしか･･･
エラーはまったく出てません。
変数は５しかないので容量の問題とも思えないのですが
どうしたらいいでしょう。どなたか教えてください

99 ：１３２人目の素数さん：04/11/08 19:41:14

昔から気になっている事がある。

TV等でやっているベストテンを決める類のもについてだが、
例えば「一番感動した歌のベストテン」番組の企画があったとする。
不特定多数にアンケートをとると、若い連中は、
高々聴いてきた曲数が限られており、どうしても最近の曲に集中する。
また、古い曲は忘れられる率も高い。
しかもTVだと視聴率も気になるから、若者に迎合した結果を当然歓迎する。

それだはイカンと思う訳である。
回答者の年齢による重みとか、古い曲に対する重みを付けないと不公平だと考える。

そこで、そういう重み付きアンケート集計の基礎理論というものがあるのか、
教えを乞う次第である。

100 ：１３２人目の素数さん：04/11/08 23:06:05

回帰分析の課題が出ているのですが、
どこかお勧めのデータがあるサイトはありませんか？
いろいろと探しているのですが、うまく見つけることが出来ません。
どなたか教えてください。

101 ：１３２人目の素数さん：04/11/09 14:35:05

忙しいので簡単にしか回答できませんが、

>>98
　ＳＡＳのサンプルプログラムが沢山あります。
　参考にしたらいかがでしょう？
　http://ftp.sas.com/techsup/download/stat/

>>99
　標本や調査方法に問題があるから重みをつける、という
　解釈をしたとすれば、統計学的には、標本設計の問題だと思うのですが・・・。

>>100
　えーとですね、宿題はなるべくご自分でがんばってみてください。
　インターネットがなかった時代にデータを集める苦労がどのような
　ものだったか想像つかないでしょうけど・・・。

102 ：98：04/11/10 13:39:07

101さんありがとうございます。
このサイトぐぐった時にあったかもしれないけど英語なんでスルーしてました。
プログラム自体は同じものなのでしらみつぶしに見てみます。

103 ：１３２人目の素数さん：04/11/11 14:40:59

>>98
データを読み込む部分のプログラムを見せてくれたら解決するかも。

104 ：１３２人目の素数さん：04/11/15 18:05:44

197

105 ：１３２人目の素数さん：04/11/17 11:54:30

「赤」と「青」の特徴を知りたいので、
それぞれを刺激語とした「赤から何を思い浮かべますか？」のような連想検査（アンケート）を実施しました。

その結果の反応語の出現数（観測度数というのですか？？）を、

　　　　　　　　赤　青
強い　　　　　　111 12
早い　　　　　　13 11
すごい　　　　　20　18
なめらか　　　　2 　50
りんご　　　　　22　34
あめ　　　　　　4 　1

のような感じで属性を行にした表を作りました。
ここで、どの項目が「赤」と「青」の特徴をあらわしているかを知りたいのですが、
どういった手法をとればよろしいか教えてください。お願いします

（カイ2乗値で考えればいいのかなと思ったりしましたが、確信が持てません。）

106 ：１３２人目の素数さん：04/11/17 20:24:42

すいません素人です。教えて下さい。

「不均等nのhonestly significant difference（テスト？）」
というのは英語で表記する場合、何と書けばよいでしょうか？
検索するとTukey-Kramer testというのがありましたが・・・。

107 ：１３２人目の素数さん：04/11/19 16:17:11

パチスロの機種の人気を調べるために年齢層別にデータを取っていくのですが、
その場合母集団、母数、母平均μ、母分散σ2乗、母標準偏差σなどは何になりますか？
教えてくださいm(_ _)m

108 ：１３２人目の素数さん：04/11/19 18:53:29

基本的に正規分布

109 ：１３２人目の素数さん：04/11/20 01:12:06

二項分布の累積確率と、その逆（EXCELのbinomdist，critbinomに相当するもの)
を作りたいのですが、アルゴリズムかCなどのソースがあったら教えてください。

110 ：１３２人目の素数さん：04/11/25 03:04:44

すいません素人です。お願いします。もしかしたらスレ違いかも…m(_ _)m
当初、線形計画か非線形計画かと考えていたら、場合分けをしなければならない状況になりました。
目的関数や制約条件の中に場合分けを含むような問題はどうしたらいいのでしょう？
あるいは、このような問題は何というのでしょうか？
漠然としすぎているかもしれませんが、何を書けばいいのかもわかりません。
すいませんがどなたか…、教えてください。お願いします。

111 ：１３２人目の素数さん：04/11/25 03:45:30

110ですが、訂正です。
目的関数が場合分けを含む問題です。

112 ：１３２人目の素数さん：04/11/26 10:55:34

すいません素人です。お願いします。
課題で多変量解析の手法を用いて実際に分析を行うっていう課題があります。
個人的には因子分析（主成分分析）を使って能力分けのようなものをやろうと思うのですが、
何かよいネタというか、分かりやすいデータみたいなものって何があるでしょうか。
主成分分析や因子分析を用いてプロ野球のデータのようなものをやろうと思ったのですがうまくいかず。
よい意見ありましたら教えていただけるとありがたいです。

スレ違いｽﾏｿ

113 ：１３２人目の素数さん：04/11/26 14:26:12

ほっ統計

114 ：１３２人目の素数さん：04/11/26 16:26:03

誰かbag of wordsを素人の俺にわかりやすく解説してくれませんか？
論文サーベイしているのですが、英語能力皆無の俺には英語の説明ではさっぱりわかりません。
お願いします

115 ：１３２人目の素数さん：04/11/26 16:58:30

>>114
あんまり自信ないけど、各文書についていろいろな単語の出現の有無もしくは
頻度だけを見て、その文書を単語のベクトルとして表す方法のことなんじゃな
いの？ベクトルとして表現した後で分類したりクラスタリングしたり。

単語がどういう構造の文の中で使われているかとか、単語同士の位置関係とか
構造的な要素をそぎ落してるので "bag" なのかと。

116 ：１３２人目の素数さん：04/11/27 01:18:53

>>74-75
> 検定の結果p=0.01となると、5%等ふつうの有意水準の設定では有為な差がある判断されます。
> しかし、あくまでp=0.01なので、このような事例が100例ある場合には、その中の一例くらいは本当は偶然の結果だということにならないのでしょうか？

激しく遅レスだが、気になったので答えます。”このような事例”ではなく帰無仮説のもとではそうなります。

117 ：１３２人目の素数さん：04/11/27 01:33:54

>>78
> 今、二群間の平均値の差をｔ検定で比較していたのですが、
> 有意差なしでした。この場合、
> 「type2error（第二種過誤率）ももとめて、
> 本当に差がないのか検討しなければならない」
> と参考書に書いてありました。
もし第2種の籠を求めるとしても、平均値の差を対立仮説の真の値と家庭しているんだよね？

118 ：１３２人目の素数さん：04/11/27 01:41:54

>>97
> 経済モデルなどを実証分析するとき、データを対数変換する意味って
> 何なんですか？初心者ですいません。

数学で扱いやすくするためです。正規分布っぽくするため。

119 ：１３２人目の素数さん：04/11/27 01:46:49

>>105
> 「赤」と「青」の特徴を知りたいので、
> それぞれを刺激語とした「赤から何を思い浮かべますか？」のような連想検査（アンケート）を実施しました。

赤である割合とその信頼区間を求めましょう！

120 ：１３２人目の素数さん：04/11/27 01:50:39

>>112
Fisherのあやめ　はいろんなところに出てくるよ。
↑で検索したらデータが出てくるかも。

121 ：１３２人目の素数さん：04/11/28 10:50:30

サンプルサイズと検出力の関係を詳しく教えてください
数式を見る限り大きく関わっているという事は漠然と判るのですが

122 ：１３２人目の素数さん：04/11/28 18:59:43

ベイズ推定で、誤差の含まれたデータが与えられた場合、
誤差の分布（正規分布）の分散と、
推定したい値の分布(正規分布）の分散どちらもわからない場合
どうしたらいいんでしょう？

エクセルデータで1000個のデータが与えられて、ｳｱｰわからん。

123 ：７８：04/12/01 17:53:40

>>117
質問が難しすぎてそうとかそうじゃないとか答えられない・・・．
すみませんｍ（_ _）ｍ

124 ：１３２人目の素数さん：04/12/04 00:30:17

色々な分布の関数とかその逆関数とかを数値計算したいのですが、
まとまった良い本あったら誰か紹介してくださいです。

125 ：１３２人目の素数さん：04/12/04 10:58:36

株価変動を分析したいのですが、ある特定の要因が株価に与える影響について
考えています。具体的には、日本のボーナスや、アメリカのクリスマス商戦など
ですが、その与える影響について分析する時に、ダミー変数を使うように
言われました。
ただ、いまいちその使い方が分かりません。ダミー変数の組み込み方は分かった
のですが、そこからどうすればかが分かりません。
教えてください。

126 ：１３２人目の素数さん：04/12/06 22:04:35

ベクトル空間法を用いて、言語解析を行っているのですが、
クラス分けというものが、どうしてもつかめません。
クラス分けを行って、それをセマンティックウェブのオントロジと組み合わせて
意味的に類似度をとるというものなので、クラス分けを避けて通れません。

統計、線形台数に関して本当に素人なので、誰か教えてください。
素人ですみません。教えて君ですみません。

127 ：１３２人目の素数さん：04/12/11 08:30:12

今、研究で数量化理論１類使ってるんだけど
カテゴリー評点って有為差検定かけたほうがいいのかな？
自分が調べた限りでは数量化理論に有為差検定かけてないと思うんだけど。。
だれか詳しい方アドバイスください。。。。卒業が(´Д⊂ｸﾞｽﾝ

128 ：１３２人目の素数さん：04/12/13 20:18:39

実験結果について有意差検定を行わなければならないのですが
まったく分かりません。
統計用のソフトに任せればそれまでなのですが
やっぱりなんかモヤモヤします。
まったく0から統計学（といってもこの程度）が分かる入門書のようなものは
ないでしょうか？
ちなみに生物系研究室です。

129 ：１３２人目の素数さん：04/12/19 12:00:21

>>128
奥田千恵子さんの本。

130 ：１３２人目の素数さん：04/12/19 12:18:01

専門が生物系と決まってるのなら
統計に無駄に時間をかける必要はないよ。
ソフトを使えれば十分。
ANOVAを本当に理解するには少なくとも１，２年は費やすから。

131 ：１３２人目の素数さん：04/12/19 17:57:02

ここには相応しくないぐらいの初学者申し訳ないんですが

テキストに、縦軸に度数(人数)、横軸に級限界値(身長)をとっている度数分布図があるのですが
同じくテキストに「度数分布をグラフに描くときは級感覚が均一になっているかどうかに注意する必要がある。
連続量の度数分布図では面積が度数を表すので、級感覚の不同な度数分布を描く時は
その感覚に応じて柱の高さを加減しなければならない」とあります。

ここで、度数というものはあくまで縦軸のものであり
面積で表されるものは、度数と該当する値をかけたものだと思うのですが

ご教授お願いいたします

132 ：１３２人目の素数さん：04/12/25 01:13:16

質問があります．『回帰分析で「曲面を表わす式」を推測する方法』
について知りたいのですが，詳しい本やその中で見るべき項目をお教えください．

調べた範囲では，該当すると確信出来る方法が分からず，
行き詰ってしまいました．よろしくお願いします．

133 ：１３２人目の素数さん：04/12/25 02:25:20

379

134 ：１３２人目の素数さん：04/12/25 12:53:34

>>131
「間隔」ではないの。
ヒストグラムは柱の高さではなく、面積で度数を表す約束。
棒グラフは度数を高さにするが、棒の横幅は階級幅に比例しなくてもいいので
ヒストグラムとは少し違う、ということじゃないか。
http://www.kz.tsukuba.ac.jp/~monji/tokei/tokei1.pdf
↑四枚目の絵のようなことを言っている。

135 ：ど素人：04/12/27 23:29:05

こんばんは。

大変お詳しそうな方々が多いので、質問をさせてもらっても、いいですか？

すいません、統計学習いたててなもので、もうすぐ試験を迎える学生です。
レンジを用いて標準偏差が求まるのが何故なのか、合点がいかないのです。

問　一般にＮ個の個体からなるランダム標本を考え、その標本のレンジをaと表すことにする。
　　Ｎ＝１０と１００の２つの場合に、このランダム標本の標準偏差を計算した結果の概算値として
　　妥当な組み合わせを選べ。

　１、ａ／１０とａ／１００
　２、ａ／３　とａ／５
　３、ａ　　　とａ／２
　４、ａ　　　と２ａ
　５、－ａ／２と－ａ

136 ：ど素人：04/12/27 23:30:19

すいませんでした。
質問はここに書いてね、というスレッドがありました。

そちらに書きます。

137 ：１３２人目の素数さん：04/12/28 01:19:08

なんどもすいません。
質問はここにかいてね板では、
完全にしかとされてたね・・・・。

誰か教えてあげてくんさい。

138 ：１３２人目の素数さん：04/12/28 01:35:34

レンジって何？
標本が０～ａの間に均等に分布してるってこと？

139 ：１３２人目の素数さん：04/12/28 09:52:59

いえ、その標本の（最大値－最小値）がaであると。

140 ：１３２人目の素数さん：04/12/28 16:35:45

レンジって、横軸の数値のこと？
あれなんていうの。

横軸って、平均をさすの？

141 ：１３２人目の素数さん：04/12/28 22:31:20

>>135
もちろんレンジだけから標準偏差は決まらない。
それは直感的な理解を試す問題だと思うので、
一般的な値として妥当だなーと思う選択肢を選べばいい。
ただし範囲は a/(N√2) < σ < a/2 とか絞られて、「３，４，５」は消えるかも

142 ：ありがとうございます。：04/12/28 22:56:28

実はこれは、公務員試験の過去問なんです。
自分は、来年の５月に受験します。

直感的な理解・・・・。
それは、どこの基礎的な内容を書いたものでしょう？
母平均の推定ではないですよね。

143 ：１３２人目の素数さん：04/12/28 23:43:23

>>135
順序統計量の確率の式を使って、正規分布N（０、１）の標本のレンジをZとおいてE（Z）を求めれば
よいのだが、とのこと。
標本数ｎごとにZが求められており１０の時約３、１００のとき約５とのこと。

144 ：143：04/12/28 23:47:21

＞標本のレンジをZとおいてE（Z）を求めれば
　よいのだが、とのこと。

E（Z）を求めればよいのだが、二重積分を外さなければならず計算は面倒とのこと。

145 ：１３２人目の素数さん：04/12/28 23:50:09

>>142
> 直感的な理解・・・・。
σ=ａ/10 N=10 でレンジ a を実現してたら
１０個のうち２つが５σの値を取ったという事だから、
なんか偏ってる気がしないかな。実際にそういうデータを作ったら、
一カ所に固まったデータたち＋異常値という形になるよ。だめ？

146 ：ありがとうございます。：04/12/29 00:03:02

う～～～～～～～～～～～～～～～む・・・・・・・・・・・。？☆○＠

すいません、皆さんからのアドバイスをもとに
考えて、また明日お返事します。
夕方頃になるかもです。

皆さんありがとうございます。

147 ：143：04/12/29 00:12:15

>>146
以上のことはホーエル「入門数理統計学」10章P271～272に書いてあるので立ち読みでもしたまえ

148 ：１３２人目の素数さん：04/12/29 04:25:18

>>143
あれれ、よくわかってないのですが、標本数nが増えたら標準偏差はsqrt(n)に反比
例して小さくなりますよね？

「１０の時約３、１００のとき約５」って言うことは、偏差が小さくなるとレ
ンジは反対に大きくなる、という理解でいいんでしょうか？

逆(偏差小のときレンジも小)のような気もするんですが。

149 ：１３２人目の素数さん：04/12/29 12:41:09

統計の基礎を忘れてしまったんですが、
a組2人、b組4人の中からくじで代表を決める場合、少なくとも一人はa組から
選ばれる確立ってどうやって求めるんでしたっけ？

(2/6)*(1/5)=1/15　ッて考えたんですけど、正解は　3/5　だそうです。

150 ：１３２人目の素数さん：04/12/29 13:46:52

>>149
くじで2人の代表を決める場合ですよね？
aからひとりも選ばれない場合を考えて、それを1から引けばいいので
1 - (4/6 * 3/5) = 3/5
ということでどうでしょう。

151 ：149：04/12/29 14:48:09

ありがとうございます。パッとわかっちゃうんでね。きっと。
（二人の代表を決める。てのが抜けてました。すんません。）

なるほど。といきたいところなのですが、
回答聞いてもわかりませ～～～ん!
a組から一人も選ばれない場合を、なんで１から引くんでしたっけ？　^^;?

149のようにやってしまうと、なんでいけないのかが分からないんです。
149で駄目な理由としては、同じ式でb組から二人選ばれるのと同じとなる。
って考えられるんですけど、
150サンの式でもb組のアル二人が選ばれない確率と同じになると思うんですが・・

なんか根本の根本がわかっていなくて申し訳ない。。。

152 ：１３２人目の素数さん：04/12/29 15:02:38

>>151
> a組から一人も選ばれない場合を、なんで１から引くんでしたっけ？　^^;?

すべての場合を考えると、代表に
1) a組がだけ含まれる場合、
2) aとbと両方が含まれる場合 (つまり、aひとりかつbひとり)
3) b組がだけ含まれる場合、
の3通りがあることがわかります。逆に3通りしかあり得ません。
よってこれらすべてを合わせれば、確率は1になります(それ以外の可能性はないので)。
(1) + (2) + (3) = 1
求めたいのはaが少なくともひとりは含まれる場合の確率なので、(1)と(2)の確率の和
すなわち 1 - (3)の確率ということになります。

ちなみに(1)の確率は 2/6 * 1/5 = 1/15 で簡単ですが(2)の計算がちょっとだ
けややこしいので、ストレートに(1)+(2)を考えずに、1-(3)を計算するわけです。

153 ：１３２人目の素数さん：04/12/29 15:36:21

age

154 ：149：04/12/29 15:38:47

お!　分かりやすいです。ありがとうございます。
そうか、１って１００%てことか。
そう考えれば、なんでもありえる確率１００%-b組だけ選ばれる確率で、デル!っと。

ちなみに
(2)を一所懸命考えたのですが、ハテーナはてーな？
　　さぱーりワカリマセンでした。。。。

155 ：１３２人目の素数さん：04/12/29 16:04:04

>>148
＞標本数nが増えたら標準偏差は…
n個の平均の標準偏差はsqrt(n)に反比例するけど、かんけいない。
143は、正規分布を仮定してN回試行したときの
レンジの期待値E(Z)を求めろといってる。Nが同じならσとE(Z)は比例する。
143ではσを固定してるから、Nが大きい方がレンジが広がる。
たくさん試行すれば大きな値が出るって事だよ。

156 ：ありがとうございます。：04/12/29 19:05:07

う！
追加的な書き込みが沢山増えてる。

読まなきゃ！

157 ：今読んでいる途中です。：04/12/29 19:10:08

半分まで読みました！！

158 ：143：04/12/29 22:37:51

>>148
標本数ｎのレンジをＲとおくと
レンジがＲである確率ｇ（Ｒ）=ｎ（ｎ－１）/2*∫[*∞～ー∞]ｆ（ｍ）ｆ（ｍ＋Ｒ）｛Ｆ（ｍ＋Ｒ）－Ｆ（ｍ）｝＾（ｎ-2）ｄｍとなる。
従ってレンジの平均Ｅ（Ｒ）=∫[∞～０]Ｒ＊ｇ（Ｒ）ｄＲとなる。
これのｆ（＊）、Ｆ（＊）に正規分布Ｎ（０、１）の密度関数、分布関数を代入してＥ（Ｒ）を求めればよいが、計算が面倒。
既に数値計算した結果によればｎが１０のとき３、１００のとき５とのこと。
この説明がわからないなら前述の本で勉強してくれ。
>>155
followサンクス。

159 ：ありがとうございます。：04/12/29 22:49:30

>>157
まだ読めてないです（笑）

レンジに関して、詳しい本が無いのです。
ご紹介頂いたホーエルが、新宿の紀伊国屋に行ったけど、売り切れで。

更にちょっと勉強します。

くそっ（＞＜）
レンジめ～

160 ：１３２人目の素数さん：04/12/29 23:16:26

教えてください。

三つのチョコと二つのアメを横一列に並べるとき、
二つのアメが隣同士になるのは何通りなんでしょうか？

解は、48通り

コレって　5ｃ2とかって書いて、
5*4+2*1って計算するヤツでしたっけ？
名前が分からないので、検索のしようがありませんです。。

161 ：１３２人目の素数さん：04/12/29 23:28:18

>>160
> 5*4+2*1って計算するヤツでしたっけ？
5P2(=5*4)が順列、5C2(=5*4/(2*1))が組み合わせです。

この問題はそれぞれのチョコととアメを別々のものと見る(チョコ1、チョコ2、
チョコ3)か同じ(チョコはどれも同じチョコで判別がつかない)と見るかで答え
が違ってきます。48通りということは、個々のチョコやアメは別々のものとみ
なすはずですね。

162 ：160：04/12/29 23:46:43

>161さん
助かります。

ホムペを探してみました。
でも、組合せの問題なのに、5C2(=5*4/(2*1))=10通り
で答えが出ないのもへんですね。。。？？
もう一ググリしてきます。

163 ：160：04/12/30 00:11:20

わかったので、整理します。
　161さんの指摘もあったので、男の子３人と女の子２人にします。
　（当然別人。実はホムペーで説明がこうなってた）

まず、女の子は隣り合ってるので、１人として考える。
　男の子３人＋女の子１人の全組合せ　＝　4!=4*3*2*1　=　24通り

コレに女の子2人の組合せ　＝　2! = 2*1　=　2通り

従って、女の子が隣り合う場合は、24*2=48通り

164 ：１３２人目の素数さん：04/12/30 00:19:52

>>163
> 　男の子３人＋女の子１人の全組合せ　＝　4!=4*3*2*1　=　24通り
> コレに女の子2人の組合せ　＝　2! = 2*1　=　2通り
正解。

ただし、こういう場合(選び出したものの「位置」が問題になる場合)は組み合
わせではなく順列といいます。

165 ：１３２人目の素数さん：04/12/30 00:38:39

へえ。そうなんですか。覚えておきます。
位置が問題となる組合せは順列。

てことは、4p1 *　2p1　= 48　でいいですか？

166 ：１３２人目の素数さん：04/12/30 00:45:17

ちがった。

こうだ。4p4 *　2p2　= 48　

167 ：１３２人目の素数さん：04/12/30 03:23:28

>>134
ありがとうございます。
大変参考になりました。

168 ：１３２人目の素数さん：04/12/30 05:14:11

ある速配便の会社は平均して6時間以内で小包を配達すると主張している。そこで配達時間を測ったところ、つぎのデータを得た。

7, 3, 4, 6, 10, 5, 6, 4, 3, 8 （単位：時間）

a. この主張は正しいか、有意水準5%で検定せよ。

b. 平均配達時間の99%信頼区間を作成せよ。

c. a., bの問題を解くためには母集団についてどのような仮定が必要か。

a,bは解けたのですがcがよく分かりません。

169 ：１３２人目の素数さん：04/12/30 06:59:36

冬まっさかりで、すっかり宿題スレになってるな・・・しかも統計関係ないし

>>168
a,bをどう解いたのかを詳しく

170 ：１３２人目の素数さん：04/12/31 04:00:47

残差平方和の自由度を求める方法としてテキストに
zの分散V[z]と期待値の間には
V[z]
=E[(z-μz)^2]
=E[z^2]-μz^2
の関係があって、
期待値μzが０ならば
V[z]=E[z^2]
となる。

と書いてあるんですが、
E[(z-μz)^2]
=E[z^2]-μz^2
ここの部分がなぜイコールになるかわかりません。
わかる方いましたらどうか教えて頂けないでしょうか。

171 ：１３２人目の素数さん：04/12/31 04:01:31

172 ：１３２人目の素数さん：04/12/31 04:20:42

続きです。
さらに、残差eiの期待値E[ei]が０であることから、
E[ei^2]=V[ei]=(1-1/n)σx^2となるって書いてあるんですが、
残差eiの期待値E[ei]が０じゃなきゃ駄目なのでしょうか？
０じゃなくてもE[ei^2]=V[ei]=(1-1/n)σx^2は成り立つのに
「０であることから」ってつける必要性がわかりません。
これについても教えて頂きたいです。

173 ：とろい：04/12/31 04:46:27

正則ってなんですか？
せいそく 0 【正則】

(1)正しい規則。
(2)規則どおりであること。正規。
⇔変則
「―の教育を受けなかつたために/明暗（漱石）」
(3)外国語を学ぶ際、外国人から発音と意味を同時に学ぶこと。
⇔変則
［ヘボン］
(4)〔数〕
(ア)複素関数が微分可能であること。
(イ)行列が逆行列をもつこと。
(ウ)曲線が到る所で接線をもち、かつそれが連続的に変化すること。
とのことらしいですが

モデル選択やモデルの検定において、統計学において信じられてきたのは

「データ→最尤推定量→経験損失→情報処理」

だったわけです（フィッシャーの夢）。
が、この方法は、最尤推定量が頼りになる場合（統計的正則モデル）
でなければ意味がありません。

というところの統計的正則という意味がわかりません
わかるかたがいらっしゃいましたらおしえてください

174 ：１３２人目の素数さん：04/12/31 06:55:00

>>171-172
E[(z-μz)^2]
= E[z^2-2μz*z+μz^2]
= E[z^2]-2E[μz*z]+μz^2
= E[z^2]-2E[μz]*E[z]+μz^2 　（zとμzは独立）
= E[z^2]-2μz*μz+μz^2
= E[z^2]-μz^2

上の式と同様に、一般に
V[ei]=E[ei^2]-(E[ei])^2　が成り立つからE[ei]が0でないと
E[ei^2]=V[ei]　とはならない。

175 ：１３２人目の素数さん：05/01/01 15:12:22

V(X1+X2) = V(X1) + V(X2) + 2Cov(X1,X2)

という公式がありますが、
分散は普遍分散で、今日分散は母分散ですよね？
なんか違和感を感じるのですが、この違和感を解決してくれる方はいませんか？

176 ：１３２人目の素数さん：05/01/01 17:10:46

>>175
あんた不偏分散って何なのか何も分かってないんじゃないの？

この式自体は、両辺が不偏分散であろうと普通分散であろうと成り立つと思うけど。
あと２ｃｈといえどもここは学問板なのだから不偏分散とか共分散とか用語は正確に書いてください。

177 ：１３２人目の素数さん：05/01/05 21:44:44

不偏分散と普通の分散の違いを詳しく教えてください。
本よんでもいまいちわからなくて。

178 ：１３２人目の素数さん：05/01/05 22:25:07

質問させてください。以下のようなデータがあります（ある行動の単位時間あたりの生起回数）。
A群　0 0 0 0 0 0
B群 0 0 0 0 0 0
C群　1.2 1.1 0.5 0 0 0

群間に生起回数に差があるかどうかを検定するにはどの方法が良いのでしょうか？
クラスカル・ウォリス検定？　マン・ホイットニーのＵ検定？
それともそもそもこのデータでは検定が無理ですか？

179 ：１３２人目の素数さん：05/01/05 22:54:32

>>177
母分散σ＾２を推定するのに標本数ｎのX1・・Xｎを取って標本分散を求めるんだけど、標本分散を求める
基準の標本平均ΣXｉ/ｎ自体がσ＾２/ｎの分散が生じてしまうため、標本分散を求めるのに普通にｎで割ると
標本分散の期待値がσ^2(n-1)/nとなってしまうのでn-1で割れば期待値がσ＾２に等しくなる（これを不偏推定量と言う）

どの統計学の本にも書いてある基礎事項なので、よく理解しておくこと。
ちなみにｔ検定で使う分散は不偏分散。

180 ：１３２人目の素数さん：05/01/08 21:07:29

>>178
3群ではU検定は使えないので，クラスカル・ウォリス検定をしてみると有意差はでません。多重比較をしても同様かと・・・

181 ：１３２人目の素数さん：05/01/08 21:18:51

互いに相関係数が0.5ぐらいある説明変数を用いての重回帰分析に意味があるのでしょうか？

182 ：１３２人目の素数さん：05/01/08 21:30:32

ポアゾン分布について、Ｐ=（Ｘ=k＋１）と、Ｐ（Ｘ=k）の関係式（k=1,2,3…）を導き、2項分布と同様なアルゴリズムを作りなさい。

どう書けば、単位がきますか？？
助けてください！！！

183 ：１３２人目の素数さん：05/01/08 23:06:27

何で中国の人口は一人っ子政策実施中なのに増え続けるんだろう。。。
だれか教えてください

184 ：１３２人目の素数さん：05/01/10 18:50:52

t検定について質問させてください。
対応のないt検定と対応のあるt検定、やり方がどう違うか教えてください。
まず等分散かどうかを調べ、等分散でなければWelchの方法でやっていたのですが、
このやり方だと対応のある場合は、どのようにやり方を変えたら良いのかわかりません。

>>183
色々と例外があるため。
農家の場合、一人目が女の子だった場合はもう一人生んでも良い。
自分と配偶者が共に一人っ子であれば、その夫婦は二人生んで良い。
政策自体が適用されない少数民族がある。
などなど。

185 ：184：05/01/10 18:54:06

自己解決できそうですが、やはりわからない点が一つ。
対応のあるt検定では、等分散かどうかを調べる必要がないのでしょうか？

186 ：１３２人目の素数さん：05/01/10 19:37:20

レイリー分布に添うってどういうことなんでしょうか？
ｘ＾２検定でなんですが・・・。
わかる方いたらお願いします

187 ：１３２人目の素数さん：05/01/11 02:39:26

>184
対応のあるt検定は、差 d_j=X_i-Y_i について母平均0の検定の一標本問題だから.

188 ：１３２人目の素数さん：05/01/11 03:01:29

>181
独立でなくても、最良線形不偏推定量（BLUE）なので、予測としては意味がある。
各説明変数の効果を考えたかったら共分散構造解析じゃないかな

189 ：１３２人目の素数さん：05/01/11 04:17:18

>178
生起回数よりも、生起するかどうか？でexactにやってみては？
全事象数は2^18
データよりも極端な事象数は6C6*6C6*(6C6+6C5+6C4+6C3)
ｐ値は0.0001602173で有意（p1=p2=p3でない）
多重比較するには、
ボンフェローニ使って有意水準を３等分して
A群C群のp値は0.01025391
B群C群のp値は0.01025391
A群B群のp値は1
有意水準5%ならA群C群、B群C群は有意
有意水準1%なら、もうちょい調べた方がいい
でどうでしょう？

190 ：１３２人目の素数さん：05/01/11 04:40:06

>186
こうらしいですよ。へーへーへー

自由度２のχ分布は
レイリー分布:f(x)=x/σ^2exp(-x^2/2σ2)
自由度３のχ分布は
マクスウェル分布:f(x)=2^(3/2)/σ^3x^2exp(-x^2/2σ2)
と命名されています．
χ2分布は主として統計分野で用いられていますが，χ分布，
とりわけ，レイリー分布は英国のレイリー卿が音響工学との関連でこの分布を発見したことに由来し，
マクスウェル分布は気体分子の速度分布と関係した物理学上の重要な分布関数になっています．
ttp://www.geocities.jp/ikuro_kotaro/koramu/hyoteki.htm

191 ：190：05/01/11 04:43:01

↑”χ2乗分布”の”2乗”抜けてます。汗

192 ：190：05/01/11 05:31:01

↑やっぱ無くていいみたいです。すみません。

193 ：１３２人目の素数さん：05/01/11 17:32:35

ttp://data.uploda.net/anonymous/etc2/dat1/upload25865.txt
のファイルの内容は、あるWebサイトの半月分のアクセス件数を、アクセスとアクセスの秒間隔でカウントしたものです。

0,1823
10,1017
20,596

例えば、上の3行は、あるアクセスとその次のアクセスの間隔が0秒～10秒未満だったものが1823件、
10秒以上20秒未満だった件数が1017件、20秒以上30秒未満だった件数が596件…ということを表します。
10秒間隔でまとめてカウントしています。
『このアクセス件数がポアソン分布にしたがっているか』を調べたいのですが、
有効なWebサイトやフリーツールはあるでしょうか？
それらしいものをいくつか見つけたのですが、

ttp://aoki2.si.gunma-u.ac.jp/JavaScript/poisson-fit.html
要素数が150を越えるとエラーが出る。

ttp://kamoz.zive.net/~kojocho/ray/download.html (の中のポアソン分布計算ソフト)
500個までの要素しかカウントできないし、500にしてもエラーが起きて計算できない。

というような感じです。
どなたかいい手をご存知の方がいらしたら教えていただきたいです。
よろしくお願いします。

194 ：１３２人目の素数さん：05/01/11 23:58:49

平均をλとすると，x番目の階級の期待値は n e^(λ)λ^x /x!
最両端の階級の期待値が小さければ隣に併合していくのですが，
この期待値の計算において，200だと200!が出てきます．
ここでオーバーフローを起こしてると思われます．
まぁ，そんなところは期待値が小さいでしょうし，自分で併合してあげてから，
ソフトにかければいいと思います．
また，階級を細かく区切りすぎてもまずいです．
各階級が５以上になるのが目安です．

併合しすぎると，”適合しないとは言えない”になり，
細かすぎると，”適合しない”になる．
うーん，検定の限界ですな．

195 ：統計ド素人：05/01/12 02:31:30

ちょっとお聞きしたいんですけど
出生率を統計学で表したいんですが、どの公式を使ったら一番しっくりくるんですかね？

196 ：１３２人目の素数さん：05/01/12 03:10:58

>ttp://aoki2.si.gunma-u.ac.jp/JavaScript/poisson-fit.html
>要素数が150を越えるとエラーが出る。

に通した結果、有意確率が0.00000になるのですが、
有意確率が0になった場合はポアソン分布じゃないってことですか？

こんな結果になります↓
カイ二乗値 = 468588.67303
自由度 = 12
有意確率 = 0.00000

197 ：１３２人目の素数さん：05/01/12 13:31:45

たぶん小さすぎて0になっているんでしょう．
有意確率とは，そのモデルに従っているとすると，
それより極端な結果が出る確率です．
つまり，
有意確率が0.001だと，それより極端な結果は1000回に1回しか起こらない
んじゃ，そのモデルに従ってないだろうってことになります

あと，ポアソン分布は稀現象の大量観察に適用されます．
指数分布，ワイブル分布，ガンマ分布，対数正規分布などに当てはめてみてはどうでしょうか？

198 ：１３２人目の素数さん：05/01/12 20:35:14

線型モデルにおいて、パラメータ推定に最小二乗法を使えば線型推定量はBLUEが保証され、
さらに誤差が正規分布に従えば、線型推定量に限らず全ての推定量においてBLUEが保証されますよね？

この時、線型推定量以外の推定量とは具体的にどんな物なのでしょうか？
アドバイスよろしくお願いします。

199 ：１３２人目の素数さん：05/01/13 00:42:55

BLUE（最良線形不偏推定量）って言ってる時点で
線形推定量以外の推定量って変だと思うのですが。。

200 ：１３２人目の素数さん：05/01/13 00:50:42

すいませんでした。

×さらに誤差が正規分布に従えば、線型推定量に限らず全ての推定量においてBLUEが保証されますよね？
○さらに誤差が正規分布に従えば、線型推定量に限らず全ての推定量において最良推定量であることが保証されますよね？

アドバイスよろしくお願いします。

201 ：１３２人目の素数さん：05/01/13 15:51:37

統計学の advanced なテキストが読めるサイトとかありませんか？
もしあれば、教えていただけると幸いです。

202 ：１３２人目の素数さん：05/01/13 17:16:42

線形モデル
Yi=α1+α2 X2i+α3 X3i+...+αk Xki+ui
において
最小2乗法によるパラメータの推定量a1^,a2^,...,ak^を用いたＹの推定量
a1^+a2^ X2+...+ak^Xk は最小分散線形不偏推定量になる．
また，uiが独立でＮ（0,σ^2）に従うとすると
パラメータの最尤推定量b1^,b2^,...,bk^,σ^2^は漸近一致かつ漸近分散最小．
また，線形モデルにおけるパラメータの最小２乗推定量と最尤推定量は一致する

という話の流れだと思うのですが，
線形推定量に限らず全ての推定量において最良推定量であるの意味がよくわからないです．

203 ：１３２人目の素数さん：05/01/13 21:16:20

モーメントの定義についてお聞きしたいのですが、
r.v.Xが正規分布や対数正規分布だとして、
E[X^{1/2}]　とか、　E[X^{-1}]
もモーメントと呼ぶのでしょうか？
また、これらの値は発散せず、存在するのでしょうか？

204 ：１３２人目の素数さん：05/01/13 21:28:44

>>203
そう呼べばそう呼ぶ。
一般にモーメントは発散しないことが保障されていないので、
発散したらしたでいいんでは。

205 ：１３２人目の素数さん：05/01/13 21:42:53

>>204
定義次第と言うことですね。

一般にモーメントは発散しないことが保証されていないということに関してですが、
例えば対数正規分布なら、
m=1,2,3,…
とモーメントの次数が自然数ならその存在が保証されていますが、
m=-2だったり1/2だったりするときには、実際に計算してみるしかないと言うことでしょうか？

206 ：１３２人目の素数さん：05/01/13 23:04:47

>>205
> 実際に計算してみるしかないと言うことでしょうか？
そうです。

207 ：１３２人目の素数さん：05/01/13 23:29:27

>>206
了解。マンドクセー('A`)

208 ：質問：05/01/14 20:08:53

時系列の教科書に次のようにかいてあります。

弱定常な時系列の観測値 {y_1,...y_N} があるとき、
この時系列の平均値 (弱定常なので定数) は、
次の式により推定される。
m^ = (1/N) ∑[n=1,N] y_n

これがなぜ推定になるのか、よく分かりません。
N→∞ のとき、m^→(実際の平均) となることが証明できるのでしょうか？
できるのであれば教えていただけませんか？

209 ：１３２人目の素数さん：05/01/14 22:07:43

>>208
単に推定量という場合、それは実際の統計量に収束しなくてもよい。
データ数が増えたときに実際の統計量に収束する推定量は一致推定量という。
一致推定量ではない推定量でも、よく使われることがある。

210 ：質問：05/01/17 16:40:23

beta-divergence について知りたいのですが、
どういった文献を読めばいいでしょうか？

211 ：１３２人目の素数さん：05/01/18 22:01:21

可変応答平滑法について詳しく説明している
書籍、サイトなどありましたら教えて下さい。

212 ：１３２人目の素数さん：05/01/19 00:40:38

>210
このサイトが参考になるのではないでしょうか。だいたいしか理解できてませんが。
ttp://www.ism.ac.jp/~eguchi/index_j.html
論文も置いてありました。
ttp://www.ism.ac.jp/~eguchi/pdf/RBSS.pdf

213 ：１３２人目の素数さん：05/01/19 11:35:24

>>212 ありがとうございます。読んでみます。

214 ：１３２人目の素数さん：05/01/19 11:36:36

情報幾何に出てくる概念らしいのですが、
carrier measure とは何でしょうか？
わかる方いらっしゃいますか？

215 ：１３２人目の素数さん：05/01/19 17:15:29

>>214

初等知識で解釈すれば、
carrier 関数値が０でない要素の集合。
measure 測度～体積

216 ：１３２人目の素数さん：05/01/19 23:01:47

>>208
エルゴード性をご存知ですか？

217 ：１３２人目の素数さん：05/01/20 01:16:07

208でも209でもありませんが、
エルゴード性って弱定常性から導出されるものなのでしょうか？
それとも、弱定常性にさらにエルゴード性を仮定するでしょうか？

218 ：１３２人目の素数さん：05/01/20 08:10:09

弱定常性は、時間に依存せずに平均が一定であることを保証している。
当然有界であるのだが。
しかし平均を推定する場合、標本平均は自然な推定量のように思える
が、実はそうではないので、標本平均が真のパラメータに収束する様
に仮定しているのが、エルゴード性です。
エルゴード性の仮定を宣言していなくても、特別な場合を除いて仮定
されていると言っていいのでは？

219 ：１３２人目の素数さん：05/01/20 09:22:56

second-order statistics ってなんのことでしょうか？
それと higher-order statistics は？

220 ：１３２人目の素数さん：05/01/20 15:38:11

highre-order statistics は、具体的にゲノム関連、
マイクロアレイデータの解析などを議論するような
統計ではないのかなあ？
それらの関連する論文の中にこの表現があったような
記憶が・・・

second-order statistics
わからない。
正規性をベースに議論しているのか？

221 ：１３２人目の素数さん：05/01/20 17:27:44

ポワゾン分布の確立密度関数で、eについてる－μの計算の
しかたがわかりません。教えてください。

222 ：１３２人目の素数さん：05/01/20 17:28:20

>>221
意味不明

223 ：１３２人目の素数さん：05/01/20 17:40:45

ｅ＝2.71828 μ＝0.4として
ｅに－0.4乗がくっついているんですが
それをどう計算すればいいのかがわかりません。

224 ：219：05/01/20 18:03:25

>>220
> 正規性をベースに議論しているのか？
たぶん、そうだと思います。
２次以上のモーメントについて研究する統計学ということかな。。。

225 ：１３２人目の素数さん：05/01/20 18:04:40

sub-gaussian data と super-gaussian data って何か分かりますか？

226 ：１３２人目の素数さん：05/01/20 18:11:13

>>223
マルチすんなボケ

227 ：１３２人目の素数さん：05/01/20 18:50:48

>>225
なんだか統計屋さんではなくて情報屋さんが定義したような言葉だな。

228 ：１３２人目の素数さん：05/01/20 23:10:29

>>215
> carrier 関数値が０でない要素の集合。
測度は分かりますが (ルベーグ積分に出てくるやつですよね)
carrier っていうのがイメージがつかめません。
関数値が０でない要素の集合が、どうして carrier (運ぶもの) なんでしょうか。
それは、解析学でいう台 (supp) と同じ意味ですか？

229 ：１３２人目の素数さん：05/01/21 03:03:24

同じ。

230 ：１３２人目の素数さん：05/01/22 00:32:30 ID:EvrlJI0k BE:53294786-

マンガでまなぶ統計学ってどうですか？

231 ：１３２人目の素数さん：05/01/22 01:32:29

nΣxy-ΣxΣy/√[nΣx^2-(Σx)^2][nΣy^2-(Σy)^2]
これって何の方程式でしょうか？？
テストにこれ出るよって言われたけど、
なにを求めるものか分からなくてとっても困ってます。
お願いします。

232 ：１３２人目の素数さん：05/01/22 11:49:13

ランダムウォークの平均値がなぜゼロでないのかわかりません。

証明ください。

233 ：１３２人目の素数さん：05/01/22 16:45:37

すみません。あまりにも馬鹿げたことなので、ここに書いて良いものなのか分かりませんが
一応、統計学のことなので質問させてください。
「正規分布とはいかなるものか。小学生にでも分かるように説明しなさい。」
という課題が出題されたのですが、私もそれほど理解できていないので上手く説明できません。。
どなたか上手く説明出来ないでしょうか？
変な質問ですが、教えていただけませんでしょうか、、？
答えには図でも式でも言葉で説明しても構わないそうです。

234 ：233：05/01/22 17:10:19

申し訳ございません。
×　答えには図でも式でも言葉で説明しても構わないそうです。
○　答えには図でも式でも言葉でも、なにを使って説明しても構わないそうです。
の間違いでした。

235 ：質問・・：05/01/24 12:59:24

X1とX2が独立していて、それぞれλ1λ2のパラメータをもつ指数分布に従うとき、
Z=X1/X2の分布とP[X1>X2]を計算せよとの問題が出たんですが、どうしてもわか
りません。。教えてもらえないでしょうか？

236 ：１３２人目の素数さん：05/01/24 16:12:09

>>235

習った事を理解出来ていなければ全く無理。
問題を数式で表現し直せるか？

237 ：１３２人目の素数さん：05/01/24 18:50:40

Ｘ、Ｙをそれぞれ独立なパラメータｘ、ｙのベルヌーイ分布に従う確率変数とする。Ｘ－Ｙの期待値と分散を求めよ。
教えてください

238 ：１３２人目の素数さん：05/01/24 19:23:29

おまえら質問をする前にどれだけ
自分で勉強をしているんだ？

239 ：１３２人目の素数さん：05/01/24 20:23:29

multivariate joint normality とはなにか分かるでしょうか？

240 ：１３２人目の素数さん：05/01/24 23:00:34

>239
多変量結合の正規性で良いかな。多種多数の確率変数から成る
多数の変数の結合分布は正規分布と見なせる、事かな。

241 ：１３２人目の素数さん：05/01/25 14:27:57

中心極限定理は、独立同一分布の和に対してしか成り立たないのではなかったですか？

242 ：１３２人目の素数さん：05/01/25 15:22:10

とある実験結果があまりにもばらつきすぎて困っています。
（対象が人間なので）

例えば、あるサンプルから求めた平均より、標準偏差が大きい場合は
あまりいいサンプルではないと言えるのでしょうか？

243 ：１３２人目の素数さん：05/01/25 15:58:19

ばらつきが大きい分布をもつ現象ならば、
ばらつきが大きいサンプルが得られたとしてもおかしくないよ。

244 ：１３２人目の素数さん：05/01/25 16:36:12

今研究で数量化3類をやっているんですが、カテゴリースコア、固有値、寄与率の意味がわかりません？
カテゴリースコアの散布図がにおいて位置が近ければ傾向が似ているというのはなんとなく分かるんですけど。

245 ：242：05/01/25 16:50:43

>>243さん
レスありがとうございます。
そーですよね。
あまり自信が持てなかったもので。。
卒論に載せていいものかどうかと。

246 ：１３２人目の素数さん：05/01/25 20:45:22

>>241
もっと条件を緩めても成り立つよ

247 ：１３２人目の素数さん：05/01/25 21:24:20

工場で生産される製品１個あたりの重さは、標準偏差がa=２gである。
製品２５個をランダムに取り出して重さを計ったところ、平均９，５g
であった。製品１個当たりの重さuを区間推定しよう。ただし製品の重さは
正規分布に従っているものとする。
１、標本平均Xの確率分布の１平均、２標準偏差を示せ
２、９５％信頼区間と９０％信頼区間を計算し、その区間の違いについて
　　考察せよ
この問題について教えてください　お願いします

248 ：１３２人目の素数さん：05/01/25 22:09:58

Xi (1≦i≦n)はN(μ0,σ^2)からの大きさnのランダム標本。μ0：既知、σ^2：未知。
s^2 = ∑(Xi-μ0)^2

のときに、Var(s^2)ってどう求めればいいんでしょうか？
= E[(s^2)^2] + (E[s^2])^2
まではわかるんですけど、E[(s^2)^2]をどうしたらいいやら・・。

249 ：１３２人目の素数さん：05/01/26 10:58:19

2要因の分散分析で等分散性が仮定されなかった場合、どうすればいいんでしょうか？

250 ：１３２人目の素数さん：05/01/26 11:28:23

>>246
どこまで緩められるのか教えていただけませんか？

251 ：１３２人目の素数さん：05/01/26 18:15:45

3次キュムラントと4次キュムラントを一言で言えますか？
3次4次キュムラントがどうなったらどういうことを表すんですか？
図書館の本に載ってないぽ。

252 ：１３２人目の素数さん：05/01/26 18:21:34

一次、二次のキュムラントから敷衍類推する。

253 ：１３２人目の素数さん：05/01/26 18:36:27

>>250
mixing condition でも言えるのでは？

254 ：１３２人目の素数さん：05/01/26 19:01:11

>>252
「敷衍類推」が読めない時点でもうダメぽ…orz

255 ：１３２人目の素数さん：05/01/26 20:14:41

統計で就職したいんですがどこに就職できますか？

256 ：１３２人目の素数さん：05/01/26 20:19:44

>>255
統計を調査してください

257 ：全く初心者：05/01/27 01:28:37

相関係数を求めて、２変数の相関関係を分析しています。
元の２変数とも量的変数であることが条件だということはわかります。
しかし、この２変数はそれぞればらつきがあり、正規性がないのですが、
相関係数⇒回帰曲線と求めていっても良いのでしょうか？
それとも正規分布になるように変数変換等が必要？？
是非ご回答お願いしますm(_ _"m)　

258 ：１３２人目の素数さん：05/01/27 08:33:36

>>257
データが正規分布に従っている必要はない。

259 ：１３２人目の素数さん：05/01/27 09:02:18

>>254
歪度 (skewness)、尖度 (kurtosis)

260 ：１３２人目の素数さん：05/01/27 12:07:21

明日統計学のテストでございます、テストはデータの数値が変えた問題が
出ます、どうかこの馬鹿（標準偏差も解らない程度の私に解き方を教えて
ください・・）

為替レート（ｘ）と株価（ｙ）の関係を示したデータである。
回帰モデルY＝α＋βXを適用した時、βの有意性を調べよ。
ｘ　１００　１１０　１２０　１３０　１４０
ｙ　２００　２２０　１９０　２６０　３３０

261 ：１３２人目の素数さん：05/01/28 00:20:10

今日テストだったらもう遅いだろうが、まあ、一応。

やりかた
１．単回帰直線をもとめます
２．決定係数R^2を求めます。
３．R^2が大きい方が当てはまりがいいと言えます。

β = 相関係数 * (（yの標準偏差) / (xの標準偏差))
R^2 = 1 - (残差平方和) / (総平方和)

相関係数、標準偏差、残差平方和、総平方和の出し方はググりましょう。

意味わからないと辛いだけだろうな。

262 ：１３２人目の素数さん：05/01/28 00:21:40

標準偏差が分からないならまず無理だと思う・・・

263 ：全く初心者：05/01/28 09:20:57

相関分析で相関係数を計算する場合、「元の２変数はどちらも正規分布の必要がある」
と言う方と、「必要なし」という方がいます。
どちらが正解なのでしょうか？；証明などありましたら、ぜひ御教授ください。

264 ：１３２人目の素数さん：05/01/28 19:50:02

>>263
必要なしだよ。

線形回帰というのは、１つの考え方では、
２つの変数間のモデルを Y=aX+e と仮定する手法だ (e は正規分布に従うノイズ)。
仮定するのだから、実際に X と Y にどういう関係があるのか
なんて知らなくても、手法は適用できる。

そのモデルを当てはめたことの適切さを測るのが
相関係数だと考えればいい。

265 ：１３２人目の素数さん：05/01/28 19:52:35

次の定理の証明を教えてください。
【定理】
P(t) を m 次多項式とする。
f(t)=exp(P(t)) が特性関数であるなら、m<=2 である。

266 ：１３２人目の素数さん：05/01/29 00:09:27

ド素人の書き込みで申し訳ありません、4622339と103764を使う場合の
相関係数の求め方を教えて下さい。お願いいたします。

267 ：１３２人目の素数さん：05/01/29 00:49:37

宿題課題丸投げのシーズン到来
数学板の風物詩ですな

268 ：１３２人目の素数さん：05/01/29 10:34:09

丸投げではないですが相関係数の求め方がわからないとどうしようもないんです。数字は適当に変えてもらって構わないので、求め方を教えてもらえると嬉しいです。

269 ：１３２人目の素数さん：05/01/29 11:52:11

>>265
f(t) の逆フーリエ変換が密度関数になるので、
実際に計算して P(t) が3次以上の時に、
積分が発散することを示せばよい。

270 ：１３２人目の素数さん：05/01/29 15:02:24

ポアソン分布のパラメータである「λ」が，1以下の場合ってありえますか？
例えば，0.87という結果が出てしまうとか。

271 ：１３２人目の素数さん：05/01/29 16:23:11

>>270
当然ある。ちなみにポアソン分布応用の歴史的例（ポーランドの統計家ボルト
キーヴィッツが1898年の論文でポアソン分布の適用例として示した有名な例）
では、1875年～1894年の間に馬に蹴られて死んだプロシアの兵士の軍団ごとの
人数分布の説明に用いられたが、この場合λ=0.7ととると観測値によく合っていた。

272 ：１３２人目の素数さん：05/01/29 18:47:05

分散が不明な場合の母平均の検定は、
なぜ正規検定ではなくｔ検定を使わなくてはいけないんですか？
教えてください。よろしくお願いします。

273 ：１３２人目の素数さん：05/01/29 20:19:59

>>272
統計学の教科書嫁

274 ：１３２人目の素数さん：05/01/29 23:02:41

○×問題です。

（１）相関分析において、母相関係数がゼロであるかの検定Ｈ：ｐ＝ｐ。（＝０）
は行うことができるが相関係数がゼロでない値であるかどうかの検定Ｈｐ＝ｐ。（≠０）はできない。

（２）最小二乗法による単回帰分析において定数項（切片）の推定値はｔ分布に従う。
　　　　　　　　　　　　－
（３）母回帰の推定はｘ＝ｘで最も推定精度が高くなる。

（４）回帰分析において、実測値と予測値の相関係数の二乗は寄与率と呼ばれる。

（５）重回帰分析の説明変数選択において、目的変数に対して意味のない説明変数を加えると
寄与率が減少する。

（６）主成分分析の出発行列には分散共分散行列と相関係数行列である。

留年がかかってます。
誰かよろしくおねがいします。

275 ：１３２人目の素数さん：05/01/30 02:13:07

季節だなあ…
丸投げするようなヤシは留年させたほうがいいと思ってしまう。

276 ：１３２人目の素数さん：05/01/30 02:17:16

>>272

(X-μ)/σ は正規分布にしたがうが（Xは標本平均、μは母平均、σは母分散）、
定数σを確率変数S（Sは標本分散）でおきかえた (X-μ)/S は正規分布でなくt分布に
したがうから。

277 ：276：05/01/30 02:19:04

二乗じゃないから「分散」を「標準偏差」に訂正

278 ：相変わらず初心者：05/01/30 21:53:18

質問です。
例えばこんなデータの場合どんな統計手法を使えば・・
【バスカードの処理機】
30日毎に取るデータで、
その30日間のカード通過枚数と、その期間に詰まった回数の関係を知りたい時
１ヶ月で1000枚通過・その期間の詰まりが５件　などなど
これが月毎にばらばらにある時です。（何時詰まったかは分からず、件数のみです）
このような場合どんな統計手法を用いればいいでしょうか??

279 ：１３２人目の素数さん：05/01/30 23:36:21

>>278
ポアソン分布。
たぶん。

280 ：相変わらず初心者：05/01/31 00:24:16

やはり二項分布とか、ポアソン分布になりますか・・
最近、Spearmanの順位相関係数というものを知りました。
故障回数を順序に変換または順序と考えて、
Spearmanの順位相関係数を利用しても問題ないでしょうか・・

281 ：１３２人目の素数さん：05/01/31 00:42:34

分からない問題スレで一つもレスが付かなかったので、改めてこちらでお願いします。

データの精度水準の中で、｢間隔尺度｣と言うものがありますが、
温度表示(摂氏、華氏)以外の例で何かありませんか？

282 ：１３２人目の素数さん：05/01/31 00:50:50

丸投げの季節がやってまいりました。

283 ：１３２人目の素数さん：05/01/31 02:05:30

>>281
「間隔尺度」とか「Interval Scale」とかでぐぐれ。
いくらでも例が出てくる。

284 ：１３２人目の素数さん：05/01/31 02:07:14

・・・と書いたけど、例を一つだけ挙げておく。
「テストの点数」

285 ：１３２人目の素数さん：05/01/31 03:06:16

えー！そうなんですか。
テストの点数は比例尺度だと思ってました。
全然理解して無かったです。orz
とにかくレス有難うございました。

286 ：１３２人目の素数さん：05/01/31 03:16:33

すごくいい例が見つかった、｢西暦｣

287 ：１３２人目の素数さん：05/01/31 06:57:57

例えばセンター試験でやった数学のテストの得点が０点だったとしても、
それによって数学能力がゼロだという解釈にならないので、
比例尺度じゃないんですね。

288 ：１３２人目の素数さん：05/01/31 20:05:45

>>287
センター試験の数学のテストが「数学能力」を測るものだなんて、
いったい誰が定義したのかな？
「数学テストの点数」を測るものかも知れませんよ。

289 ：１３２人目の素数さん：05/02/01 00:26:24

センター試験の数学テストが数学能力を測れるものじゃないからこそ比例尺度なんじゃないかな。
しかも >>287 は例え話をしていて、定義の話はしてないし。

290 ：１３２人目の素数さん：05/02/02 21:06:30

時系列のコレログラムについての質問です。

1,2,3,4,5,6,7,8,9,....,20

と時系列があるとします。
この時、自己相関はlag1 , lag2 , lag3 ...とずっと１のままだと思うのですが
ソフトウェアに計算させると値が違います。

lag1の自己相関は
1,2,3,4,5,6,7,8,9..19
2,3,4,5,6,7,8,9....20
の相関係数。

だと思っているのですが
根本的に考え方がちがうのでしょうか？

291 ：匿名：05/02/02 22:53:48

母比率の推定の応用
信頼区間　100（1-α）%を固定し、このときの母比率pの信頼区間を[P1,P2]
とするとき、P2-P1=l P1-P2 l＜δ
（δは、例えば0.05、0.02、…）
を満足させるのに必要な標本の大きさnを求めよ。っていう問題なんですけど。
お願いします。すいません。

292 ：１３２人目の素数さん：05/02/03 00:31:41

>>291
母比率の信頼区間の幅の公式 √(x(1-x)/n)を用いればよいが、標本比率を与える
必要があるのでは。

293 ：292：05/02/03 01:03:04

標本の大きさを決めてから調査するわけだから、標本比率を先に与えるのは変か。
nをとめたとき、誤差が最大になるのはx=0.5のときだから、その場合に条件を満足
させれば（十分条件としては）よいと思われ。

294 ：匿名：05/02/03 01:39:03

ありがとうございます。明日テストなんで、助かりました。

295 ：１３２人目の素数さん：05/02/03 02:35:42

http://ex9.2ch.net/test/read.cgi/net/1096780650/703
ここに限らず投稿型のレビューサイトって
無差別ではなく任意で投稿するから統計学的に信用できないよね。

296 ：１３２人目の素数さん：05/02/03 19:27:24

量子化誤差の平均値とRMSを数式で表すとどうなりますか？
最初の定義式から簡単でもいいのでやり方がわかればいいんですが

297 ：１３２人目の素数さん：05/02/03 22:39:06

明日テストです・・・助けてください・・・

宝くじは平均に賭けるのではなく分散に賭けるのだという
解釈がある。これについて簡潔に説明せよ。

298 ：１３２人目の素数さん：05/02/04 00:01:21

>>297
いくらなんでも丸投げ過ぎ。
平均と分散の意味がわかれば一発でわかるぞ。

299 ：１３２人目の素数さん：05/02/04 01:01:21

>>297
「平均に賭ける」というのは、
「１枚宝くじを買うと確率的にこれだけバックが来る」
という発想で賭けること。

「分散に賭ける」というのは、
「宝くじを買うと、ひょっとして１億円あたるかもしれない」
という発想で賭けること。

300 ：１３２人目の素数さん：05/02/04 20:27:14

>>290ですが、どなたかご教授下さい。

301 ：１３２人目の素数さん：05/02/04 20:59:05

>>300
あなたが考えているコレログラムの定義は？

302 ：301：05/02/04 21:01:09

平均を考慮しているのか？

303 ：１３２人目の素数さん：05/02/04 21:20:26

>>300
時系列の観測結果 x1, x2,…, xT が与えられているとき, 差が h (≧0) である２つの時点の値の相関を示す量

で、相関を示す量を「ピアソンの積率相関係数」だと思っています。

だとすると
時系列データ

1,2,3,4,5,6,7,8,9....20

のコレログラムはずっと1だと思うのですがソフトで計算するとそうならないのです。
具体的にはＲで

>acf ( 1:20 , plot=FALSE)
0 1 2 3 4 5 6 7 8 9 10
1.000 0.850 0.702 0.556 0.415 0.280 0.153 0.034 -0.074 -0.170 -0.252
11 12 13
-0.319 -0.370 -0.403

となります。アドバイスよろしくお願いします。

304 ：１３２人目の素数さん：05/02/04 21:32:36

「思うのですが」って自分で実際に計算していないのか？

305 ：１３２人目の素数さん：05/02/04 21:41:28

計算するまでもなく１

306 ：１３２人目の素数さん：05/02/05 15:57:38

教えてください！
母集団の分布がＮ（５０．６０）であるとき、　n＝１００の標本分布で
平均値ｘが４９以下となる確率はいくらか。また、n=４００の場合はどうか。
という問題です。

307 ：１３２人目の素数さん：05/02/05 16:14:45

>>306
xはＮ(50,60/n)にしたがう。あとは標準化（xから平均を引いて標準偏差で割る）
して標準正規分布表を使え。

308 ：１３２人目の素数さん：05/02/05 16:27:57

ありがとうございました！

309 ：１３２人目の素数さん：05/02/05 22:34:33

>>305
思いこみを捨てて計算しなさい。

310 ：１３２人目の素数さん：05/02/06 14:51:30

時系列データが

1,2,3,4,5,6,7,8,9....20

だとすると。

統計ソフトＲのコードで恐縮なのですが、

ρ(0) : cor ( 1:20 , 1:20 ) = 1
ρ(1) : cor ( 2:20 , 1:19 ) = 1
ρ(2) : cor ( 3:20 , 1:18 ) = 1
...

となると思っています。
コレログラムを間違って理解しているのだと思うのですが、
教科書を見る限りそうとも思えないのでアドバイスを求めています。

よろしくお願いします。

311 ：１３２人目の素数さん：05/02/06 17:56:34

確率変数 x, y があるとき、同時密度関数の特性関数から
クロスキュムラント cum(x,y) が定義されることは分かりますが、
クロスしていないキュムラント cum(x,x) は、
確率変数 x を単独で考えた場合の2次キュムラントと一致するのでしょうか？
一般に3次以上キュムラント cum(x,x,x) でも一致するでしょうか？
(x, y が独立なときは一致することは明らかですが、
独立でないときも一致するのでしょうか？)

312 ：１３２人目の素数さん：05/02/07 00:05:43

>>310
どの教科書を見ているのかな。
普通、自己相関係数の計算で、分散を出すのに使う「平均値」は
全データ [1,2,...,20} の平均値を使う。Rもそれで計算してる。よくしらないが。

{1,2,...,19} と {2,3,...,20} の相関係数を求めるときは、それぞれに平均値を求める。
これで自己相関を定義している本もあるのかもしれない。

データが多いときはどちらでも大差ないと思うが、
その例はずらすたびに最大値と最小値が消えていくから食い違いがでかい。

313 ：１３２人目の素数さん：05/02/07 03:03:14

>310
こういうことでは？
ttp://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc022/339.html#359

314 ：１３２人目の素数さん：05/02/07 20:56:19

>>312-313
すっきりしました。
ありがとうございました。

315 ：１３２人目の素数さん：05/02/08 17:56:00

いろいろ調べて、標本分散を用いるよりも、母集団標本に近い値を得ることができるというのはわかったのですが、
なぜ、不偏分散の分母がn-1なのでしょうか？n-2じゃだめなのですか？

n-1という数字がどのようにして求められたのかをご教授ください。

316 ：１３２人目の素数さん：05/02/08 18:16:25

>>315
「不偏推定量」で検索すると吉かも

317 ：１３２人目の素数さん：05/02/09 02:40:06

>315
探してみると、意外と見つからないね
↓がわかりやすいと思う。一部、間違えてるけど　2n(ｘ￣-μ) →2n(ｘ￣-μ)^2
ttp://www.sanken.keio.ac.jp/staff/hayami/biz/autumn/bc14.pdf
あと、標本平均の分散の導出をごまかしてる。
分布が正規なら再生性で一発。
正規でなくてもnが大きければ中心極限定理。

318 ：317：05/02/09 02:46:42

ごめん。中心極限定理いらんかった。独立だけで計算できたわ。

319 ：１３２人目の素数さん：05/02/11 10:59:57

新公認会計士試験に統計学が加わることになったのですが、そのサンプル問題
が公表されました。

http://www.fsa.go.jp/cpaaob/kouninkaikeishi-shiken/shinshiken/02.pdf

これです。この問題は統計学のレベルとしてはどうなのでしょうか。
大学の学部レベル？それとも大学院の入試レベル？
そんなに数学使うのでしょうか。

よろしくおながいします。

320 ：１３２人目の素数さん：05/02/11 11:02:30

>>319
大学１，２年の教養課程レベル

321 ：１３２人目の素数さん：05/02/11 13:23:29

>>319
一部は理系コースなら高校数学でも出てくるようなものかな。
あとは大学の基礎教養課程の範囲に収まってる。
会計士さんってこういうこともできないといけない時代なのね。

322 ：１３２人目の素数さん：05/02/11 13:34:20

でもあれだよね。
中途半端な知識持たれると、返って困る。

このレベルなら関係ないけど。

323 ：319：05/02/11 22:36:49

レスさんくすです。
この問題で教養課程なんですね。当方、統計学初心者です。でも確かに、高校数学の知識で
解けるような問題もちらほらあるみたいですね。
ところで、このサンプル問題が８割ぐらい解けるようになるには、高校の数学Ⅲの知識は
必要なのでしょうか。当方、文系なので数Ⅱ止まりでした。
質問ばかりですまそ。

324 ：１３２人目の素数さん：05/02/12 08:41:14

特に高校数学を勉強し直さなくても、
基礎からちゃんと説明してある統計学の本を読めばいいとおもう。
統計に関しては社会人向けの簡単な本がたくさんあるから、
独学でも十分に>319の問題は解けるようになるよ。

325 ：１３２人目の素数さん：05/02/12 20:42:26

検定方法についてアドバイスをください。

10人を対象とした5種類のゲームにかかった時間を採ったデータがある
とします。1種類のゲームにつき15回の測定をし、一人当たり75回の
測定をしました。
これをもとにそれそれ１人のサンプルを母集団とし、
検定によってそれぞれ母集団間の『差があるかどうか』を
求めたいのですが、どのような検定をすればいいのでしょうか？

なお、ノンパラメトリック検定のクラスカル・ウォリス検定はしましたが、
これでよいのでしょうか？

326 ：１３２人目の素数さん：05/02/13 03:59:41

帰無仮説は何？

327 ：１３２人目の素数さん：05/02/13 04:41:00

>325
仮定にもよると思うけど、それぞれのゲームを変量効果とした混合モデルかな。
もしも、10人の中から選んだ重複のない二人の組み合わせのうち、
ひとつでも有意差があることをもって有意とするならば、Tukeyの多重比較
という手もある。帰無仮説によるけど。

328 ：325：05/02/13 07:58:29

>>326-327さん
レスありがとうございます。
帰無仮説は『母代表値に差があるか？』です。
結局、明確に時間差が出ており、短時間で済むゲームと長時間かかるゲームが
存在することを見出したいのです。

Tukeyの多重比較、ちょっと調べてみます。
ttp://aoki2.si.gunma-u.ac.jp/lecture/tests.html
いちおうココを参考にしています。

329 ：１３２人目の素数さん：05/02/13 19:38:33

327です。

> 結局、明確に時間差が出ており、短時間で済むゲームと長時間かかるゲームが
> 存在することを見出したいのです。

ということは、どの人とどの人の間に差があるのかじゃなくて、どのゲームとどのゲームの
間に差があるのかをみたいの？
それだったら、人を変量効果とした混合モデル。

330 ：325：05/02/14 04:58:57

>>329さん
レスありがとうございます。
参考にしているページでみたら、なんかしっくりといきそうです。
ttp://aoki2.si.gunma-u.ac.jp/lecture/TwoWayANOVA/TwoWay3.html
上のページの混合モデルなのですが、

> どのゲームとどのゲームの間に差があるのかをみたい

となる場合、母数モデルに比較したいゲーム方法２つを用いて
解析するということなのでしょうか？
５ゲームまとめて行うと、漠然と『ゲームに差がある』としか
自分の素人考えでは考えられないので。。

331 ：325：05/02/14 05:01:29

とりあえずやってみます。

332 ：325：05/02/14 14:22:11

なんとか帰無仮説『差が無い』というのは、棄却されそうです。

要因A：ゲーム別
要因B：人別

二元配置分散解析（混合モデル）
-----------------------------------------------------------------
変動要因平方和自由度平均平方Ｆ値Ｐ値
要因Ａ83406.86420851.715.1760.002
要因Ｂ399437.8944381.9723.041.50E-34
交互作用145014.2364028.1722.0911.50E-34
残差13482197001926.027
全体19760787492638.288
-------------------------------------------------------------------
という形になりました。

もともと分散が大きなデータであったので、なんともいえませんが、
結果は結果として扱おうと思います。

333 ：325：05/02/14 14:25:16

見づらくて、すいません。
二元配置分散解析（混合モデル）
---------------------------------------------------------------------
変動要因　平方和　　自由度　　平均平方　　　　Ｆ値　　　　　　Ｐ値
要因Ａ　　83406.86　　4　　　　20851.71　　5.176469624　　0.00212513
要因Ｂ　　399437.8　　9　　　　44381.97　　23.04327509　　1.50E-34
交互作用　145014.2　 36　　　　4028.172　　2.091441086　　1.50E-34
残差　　　1348219　700　　　　1926.027
全体　　　1976078 　749　　　　2638.288
---------------------------------------------------------------------

334 ：１３２人目の素数さん：05/02/14 20:22:52

回帰分析において、説明変数に相関関係があったら、
回帰係数を用いて要因分析をするなんて無意味ですよな？？

いくら勉強してもどうもここがわからないのです。
平気で要因分析をしているレポートをよくみるのですが・・・・

335 ：１３２人目の素数さん：05/02/15 01:11:49

327です。

>325
どうもその混合モデルはちょっとちがうもののようです。
今時混合モデルという名前がポピュラーになったにもかかわらず何で同じ名称を
使うのか理解に苦しみます。専門家なのに。誤差の相関構造を考慮していないから別物です。
僕の言っているのはこれです。
http://hosho.ees.hokudai.ac.jp/~kato/seminar/030929/mixed-intro.pdf

>334
要因分析とは具体的に何をするの？
偏回帰係数をみて効果があるかを診るとか…

336 ：325：05/02/15 07:01:45

>>335(>>327)さん
たびたびどうもです。
混合モデルでの解析を行う前にその資料にも
目を通したのですが、『似たようなこと言ってるな』程度で
気にしてませんでした。
うーん、混合モデルと言っても違うものなんですね。
わかりました。
ひきつづき、解析してみます。

337 ：１３２人目の素数さん：05/02/15 21:13:13

>>335
レスありがとうございます。
マーケティング分野での利用を考えています。
どの要因がより効いているかを比較したいのです。

データに相関関係が少しでもあれば、偏回帰係数に意味がないと思うのですが、
レポートなどでは普通に偏回帰係数を比較することで、要因分析をしています。
どうなのでしょうか？

338 ：１３２人目の素数さん：05/02/16 00:08:52

>>337
335です。
多重共線性のもんだいですね。やっぱり相関関係のあるものは避けたいですね。
でも、まったく相関関係のないものは珍しいから、現実的にはある程度許容せざるを得なく
なるんでしょうね。
それと、多重共線性があるかどうかを調べるのにこんな方法があります。
ある説明変数を目的変数として、その他の全ての説明変数を説明変数として
重回帰分析を行う。そして、そのときの決定係数（寄与率）を調べる。
その寄与率が高いほど多重共線性の度合いが大きくなっているといえるでしょう。

339 ：１３２人目の素数さん：05/02/16 13:57:26

経済学部の学生です。
計量経済学のプレイス・ウインステン変換で、「定数項なしの最小二乗法」と
いうのが出てくるのですが、「定数項なしの最小二乗法」とはどのようにする
のか書いてある本がありません。
ご存知の方がいらっしゃったら、ご教授をお願いします。

340 ：１３２人目の素数さん：05/02/16 20:58:10

例えば最小二乗法で線形関数
y = b1 x + b0
をはめるとすると、b0が定数項だわな。
それを落として、y = b1 xだけを使ってやればいいんでそ。

341 ：１３２人目の素数さん：05/02/16 21:16:35

>>340
> をはめるとすると、b0が定数項だわな。
> それを落として、y = b1 xだけを使ってやればいいんでそ。
そんな乱暴な。単純にy切片を落としちゃだめだよ。
xとyの次元を1だけ拡大して定数1を追加しておいて、b1の対応する次元に定数項b0を
埋め込むんでしょ。

342 ：317：05/02/17 01:10:04

340で合ってると思う。341は、定数項なし→ありへの拡張じゃない？
y = b1x1+b2x2
だとしたら
残差の２乗はΣ(y-b1x1- b2x2)^2
これをb1,b2でそれぞれ偏微分したものが0になるとしてやると
正規方程式が出てくるので連立させて解く

y = b1x1
だったら、上と同様にして
b1=Σ(x1y)/Σ(x1^2)
になる

343 ：１３２人目の素数さん：05/02/17 02:39:36

>337
そんなあなたに共分散構造解析（SEM）

344 ：１３２人目の素数さん：05/02/17 02:46:52

大学受験板から来ました。
大学、また学部によって「偏差値法による得点の標準化」という作業を行っているところがあります。
「平均点を満点の半分とし、偏差値法を用いる」らしいのですが↓に書いたことは合ってるでしょうか？
統計学はかじった程度なのでちょっと自信なくて･･･

http://etc4.2ch.net/test/read.cgi/kouri/1107572881/301

345 ：軟弱マﾝ：05/02/17 03:07:26

誰か教えてください～！死者数とシードベルトの着用の有無の関連性についての
「ケガした人」と「死亡した人」の帰無仮説と対立仮説はなにかがわかりません！
こんなこともわからない私を助けてください。レポートなんです・・・

346 ：１３２人目の素数さん：05/02/17 03:24:19

>>345
「帰無仮説」とは文字通り無に帰して欲しい仮説。
それを考えればおのずと答は出るはず。

347 ：軟弱マﾝ：05/02/17 03:30:50

すいません（･･；）
無に帰してっていうことはどういうことなんでしょう？
０ってことですか？

348 ：１３２人目の素数さん：05/02/17 03:39:15

>>347
日本語の勉強汁
ついでにマルチが判明したので以降スルー

349 ：１３２人目の素数さん：05/02/17 04:36:49

有意検定の際に用いられる要素の一つに有意水準(α=0.05)がありますが、
この値そのものが妥当な値か否かを検証する方法論を教えて下さい。

350 ：１３２人目の素数さん：05/02/17 17:00:50

初歩的な質問です。
「確率」と「確率密度」の違いについて
素人でも解るように教えてください。
お願いします。

ぐぐっても↓のようなことが書いてあるだけで、さっぱり解りません（涙
確率密度とは確率を求めるため長さ△ｘに乗じるべき「密度」で
ｆ(x)が大きいところには確率が濃くあるということを示している。

351 ：１３２人目の素数さん：05/02/17 23:15:44

>>349
そんな方法あるのかね？
0.05ってのは経験的に導き出された数字だと思ってたけど。
分野によって、0.01とか0.001とか、逆に0.1ってのも見たことあるぞ。

352 ：１３２人目の素数さん：05/02/17 23:52:12

0.05はたぶん経験的。
表裏が0.5で出現するはずのコインが、
３回連続で表なら、まあ、偶然かなと思うけど、
４回(0.0625)、５回(0.02)になると、出現確率の「確からしさ」を疑う必要がある。

もう少し具体的なモデルを挙げると、
いつも同じくらいのテストの点数とっているやつに、
もしも５回連続で勝ったら、
実力に「差がついた」と思うような感じ。

353 ：１３２人目の素数さん：05/02/18 01:28:36

>>352
その数理モデルが知りたいのです。
その例でいうと何故５回連続で勝てば「差がついた」と「結論付けなければならないのか」を。

354 ：１３２人目の素数さん：05/02/18 01:31:08

強調の部分がずれてました
何故「５回連続」で勝てば差がついたと「結論付けなければならないのか」を。

355 ：１３２人目の素数さん：05/02/18 01:46:54

>>345
軟弱まんさんへ、、これは、シードベルトをしているときの死亡割合と、
シートベルトをしていないときの志望割合が同じかを調べたいんだよね？
それだったら、帰無仮説は双方の割合に差がない。対立仮説は逆。。。。それでカイ二乗検定

ところで、前から帰になっていたんだが、行と列の間に
関係があるかどうかを調べるカイ二乗検定で割合の差の有無を検証していいｎだろうか？
誰か、明快な答えをプリーズ。

>>350
これは、連続値のヒストグラムをイメージして、それぞれの棒の範囲を少しずつちじめて行って、
棒一つ当たりの確率が小さくなっていくのを想像したらどうかな。
ほとんど幅が0になるくらいまで狭めていったときの高さが確率密度。だからそのほとんど
0に近い幅をかけると確立になる。ほとんど０だけど。

356 ：１３２人目の素数さん：05/02/18 02:44:29

>>355

>>348

357 ：１３２人目の素数さん：05/02/18 05:07:02

>353
「差がある」か「差がない」のどちらかを決めたい。
あなたなら、どこを基準にする？

まぁ、５％とか１％とかが妥当な値だと思いませんか？

結論付けなければならないのではなくて、
どちらか結論したいけど、そのままじゃどうしようもないから、
仕方なしに有意水準というものを導入しようって感じ。

358 ：１３２人目の素数さん：05/02/18 05:40:26

>>357
なんで5%とか1%とかの数値に決めたの？どうして？その根拠は？
なんとなく？そんなの科学的ではないなぁ

359 ：１３２人目の素数さん：05/02/18 11:29:51

>>358
5% や 1% が科学的かどうかはともかくとして、それらの確率が
何の確率なのか、わかりやすく説明できるかい ?

360 ：１３２人目の素数さん：05/02/18 13:14:16

>>359
棄却率だろ。
だから何度も言うけどその数値で棄却あるいは採択してしまうことの信頼性の
科学的根拠を要求しているんだよ。経験則じゃなくてね。

361 ：１３２人目の素数さん：05/02/18 14:54:01

>>358
私も科学的でないと思う。
統計学を勉強して、検定をはじめて勉強したときの感想は
「うさんくさい」ですね。「数学的じゃない」とも。

362 ：339：05/02/18 15:55:41

>>340-340様、どうもありがとうございました。

363 ：１３２人目の素数さん：05/02/18 17:28:20

有意水準の値自体は許容できる標本数との関係から来る経験則だと思う。
値自体は経験則だが、得られた結論はその値の下で科学的
ということではないの？

364 ：１３２人目の素数さん：05/02/18 23:11:52

>>360
君の言う「仮説を棄却または採択することの信頼性」は
棄却率で与えているとおもうんだけど？？

365 ：１３２人目の素数さん：05/02/19 00:00:07

>>364
それだと定義を内包しているね。トートロジー。
命題全体の真偽を検証している訳ではないんだよ。

366 ：１３２人目の素数さん：05/02/19 00:38:24

>>365
何を検証している訳なの？

367 ：１３２人目の素数さん：05/02/19 00:48:38

確かに、p値が0.06とかだと棄却されない（有意傾向とか言うけど）が、
本当にそれで正しいのかは疑問ではある。

実は差があるのに差がないと言ってしまったり、
差がないのに差があるといってしまったりする、
その危険に対して一番折り合いのついた場所が、
経験的に３σなんだと思う。

368 ：１３２人目の素数さん：05/02/19 01:36:57

>>367
そう。その「経験的」にを数理モデルで表現したい訳なのですよ。
で、既に理論が存在していますかと問うている。
そもそもこの値は重要で、事実隠蔽も可能であるから、数理上で採用した値の
妥当性を検定の前に事前に証明しておかないことには実は検定そのものが成立しない。

369 ：１３２人目の素数さん：05/02/19 01:54:40

>>368
それはモデルの妥当性の問題。
一般的な理論はないよ。

370 ：１３２人目の素数さん：05/02/19 02:50:35

>>361
君のように考える人が他にもいたから、AICみたいなものが生まれたんじゃないの？
よく知らんけど。
AICじゃダメなの？

371 ：１３２人目の素数さん：05/02/19 15:46:57

時系列の基礎についてお伺いしたいです。
時系列の自己共分散関数は、
その時系列が弱定常であれば(その定義によって)、
時間差のみの関数となり、時間に依存しません。

では、弱定常な2つの時系列の相互共分散関数は、
時間差のみの関数になると言えるのでしょうか？

手元の教科書では、相互共分散を
C_k(i,j) = Cov[ y_n(i), y_(n-k)(j) ]
のように定義しています。
これは一般に時間 n に依存するように思うのですが、
左辺の記号では n がなくなっており、時間差 k しか記述がありません。

どうしてこのようなことが許されるのか理解できません。

372 ：１３２人目の素数さん：05/02/19 17:00:50

>>124
遅ればせながら、日本規格協会の「統計数値表―JSA-1972」に
FORTRANのプログラムが載っています。アマゾンで￥26,250 （税込）、
ユーズド価格 : ￥16,000より。図書館の禁帯出図書の所にあると
思うけど。

373 ：１３２人目の素数さん：05/02/19 18:25:41

>>349,353,354,357-368
ある確率を非常に小さいとか、大きいという風に判断するのは人間に任されてい
ることではないですか??数理で結論が下せる問題ではないと思います。（確率・
統計の講義でもそのように教えられました。）

例えば、１年間で１万人近くの交通事故死亡者が出ます。日本の人口は約１億
3000万人なので、１年間で交通事故で死亡する確率は、おおよそ１万分の１。つ
まり「万が一」の出来事です。１日あたり27名、１時間あたり１名以上交通事故
で死亡する計算になります。

これを滅多に起きないことと見なすか、ありふれたことと見なすかは、人間の側
の判断に任されていることでしょう。この判断は、ことの性質に依存すると思い
ます。

もしも日本人の飛行機事故の死亡者数が年間１万人だったら、誰も飛行機に乗ら
ないでしょう。（乗る人もいるかも知れないが…）

といことで、いいと思うんですけど…。いかが??

374 ：１３２人目の素数さん：05/02/19 18:58:30

すんません・・・。P値の出し方？がサッパリわかんないんですけど、
親切な方誰か教えてください・・・

375 ：１３２人目の素数さん：05/02/19 19:58:58

>>373
> これを滅多に起きないことと見なすか、ありふれたことと見なすかは、人間の側
> の判断に任されていることでしょう。この判断は、ことの性質に依存すると思い
> ます。
だから有意水準が恣意的に決定されてしまうと検定そのものが意味をなさない可能性を
含むのでそれを排除しない限りは検定自体の信頼性(モデル)を獲得できない。
「昔から今までこのようにしてきた」「そしてこれまで何の問題もなかった」「だから今後も安全ダロウ」
このような論理に依存した検定を改めようということなのです。
事故統計の例でいえばヒューマンエラーを内包した検定結果からは有意な結論は得られないということです。

376 ：３７３：05/02/20 00:27:57

>373です。

>375

>だから有意水準が恣意的に決定されてしまうと検定そのものが意味をなさない可
>能性を含むのでそれを排除しない限りは検定自体の信頼性(モデル)を獲得でき
>ない。

いや、いや、困ったなや。「１００分の１＜１０分の１」ということは数理的に
言えても、「１００分の１」を何の比較対象もなしに小さいとか、大きいとか論
理的、数理的に言えないでしょう。

「万が一」の確率を小さいと考えるか、大きいと考えるかは、それぞれの経験や
対象としている事象の性質によりますよね。いってみれば、それぞれの経験や許
容範囲と比較して、大きいとか小さいとかいっているだけの話です。統計学の入
門書にもそう書いてあると思いますが…。

377 ：３７３：05/02/20 00:29:02

>373です。

>376の続きです。

たとえば、古い本ですが、大山正、池田央、武藤真介　編「心理測定・統計法」
（有斐閣双書）の103ページから104ページに

・・・・
これらの２つの立場（ある確率を小さいと見なすか、大きい見なすかという立場
のこと：373の筆者注）のうち、どちらの立場をとるべきかということに関して、
論理的な解答は存在しない。……

とあります。

実際の所、有意水準を10％にして、「差がある傾向がある」とか「マージナル
(merginal)な差がある」なんてのたもう論文もあります。これも一つの見識かな
とも思います。有意差を出すことだけが問題ではないと思うのだけど…。

もしも、論理的に有意水準を決定する対案があるのなら、示してくださいな。私
にはできませんので。

378 ：１３２人目の素数さん：05/02/20 00:50:32

>375
それができないから、多少の恣意性を持ちながらでも何とかできるようにしたのが検定だと思う。
できるんなら教えて下さい。
AICでモデル選択するにしても、真のモデルを選択できてるとはかぎらなくて、
もっともらしいモデルを推測してるだけだし。基準を何にするかは解析者によるし。
統計学って、誤差を含んだ標本から何とかする学問だと思うが。
そこが強みでもあり、弱みでもあり。。

>371
時系列の自己共分散関数は、
その時系列が弱定常であれば(その定義によって)、
時間差(=k)のみの関数となり、時間(=n)に依存しません。

379 ：１３２人目の素数さん：05/02/20 00:53:16

>>377
数理的に差があるのか無いのかを求めたかったら、370が言っているように
AICを使って判定する方法が考えられるんじゃないかな。
帰無仮説のモデルのAICと対立仮説のAICをみて低いほうを採択していたはず。
ところで、BICを使った判定ってあるのかな？

380 ：１３２人目の素数さん：05/02/20 01:00:15

>>349は検定力とのバランスを考えろということでは？
これでもピタッと数字を示せるわけじゃないけど。

381 ：１３２人目の素数さん：05/02/20 01:02:40

もうひとつ検定の弱点を。
両側検定の場合、標本を無限に多くすると、
いつかは棄却できてしまう。。。
まぁ、仮説検定なら標本数を事前に計算できるが。
有意性検定なら標本数なんて決まらないし。

統計的有意と、現実的有意を区別しておかないと痛い目に合う典型例。

統計学やってる人で検定が絶対なんて思ってる人はいないと思う。
せめて検定で有意になってくれないと、ぐらいのもんだと思ってるんだが。

382 ：３７３：05/02/20 01:12:23

>373です。

>378
>381

おっしゃるとおり。

383 ：370：05/02/20 01:27:28

>>379
> ところで、BICを使った判定ってあるのかな？
AICが使えるならＢＩＣも使えないことは無いんじゃない？
俺は素人なんで良く分からんけど、例えば重回帰分析のときは
「説明のためのモデルなら変数を多めに取り込むＡＩＣ、
予測のためのモデルなら変数を少なめに取り込むＢＩＣを使う」
なんてことを聞いた事がある。

>>381
> 統計的有意と、現実的有意を区別しておかないと痛い目に合う典型例。
あー、まさに今俺が業務上で直面してる問題だわ。
統計を知らない人ほど統計的有意差を絶対視してくれちゃうんだよなぁ。
サンプル数が多いから有意になってるだけなのに。

384 ：１３２人目の素数さん：05/02/20 02:41:25

>>383
379です。
ベイズ流の検定だったらサンプル数が多くても有意にならないものはならないよ。
これは帰無仮説である確率を直接計算してる。
普通の検定だったら検定統計量よりも極端な値になる確率を計算するっている
ちょっとおかしな計算してるでしょ。
計算方法からしてもベイズ流のほうがよさそう。
サンプル数が多ければ多ければ必ず有意になるっているのは明らかにおかしいよね。

385 ：１３２人目の素数さん：05/02/20 04:45:05

>>376,377
> もしも、論理的に有意水準を決定する対案があるのなら、示してくださいな。私
> にはできませんので。
あのね、そんな方法論あるのですかと訊ねた方はこちらだったんだけど
勝手にすり替えられても如何なものかと。結局存在し得ないようだね。君の知識内だけによれば。

>>381
> 統計的有意と、現実的有意を区別しておかないと痛い目に合う典型例。
う～ん、その二つの優位性が同値となるような条件を検定自体で決定できるか否かという問いに対して
現実的有意性とは何かと突き詰めると実際は検定外の要素で検定の信頼性が決定するという事実に帰結し
このことは検定の方法論の意義が成立しないことを意味する。

386 ：１３２人目の素数さん：05/02/20 07:21:18

>>385
381へのレスが今一つ理解しがたいが、「検定をすること自体に意味が無いのでは。」
と言いたいの？
帰無仮説の立て方によっては、統計的だけじゃなくて現実的にも意味のあるものになるよ。
例えば、男女の身長の間に差があるかどうかを検証するときに、
男性の身長は女性のそれよりも10cm高くない、という帰無仮説を立てるとか。

387 ：381：05/02/20 19:10:14

>385
そんなことはとっくに分かっている。
しかし、他にもっと妥当な（マシな）方法がないから使ってるんだと思うが。

ある手法よりいい手法を提唱しないで、その手法がおかしい、と批判する。
それで？んじゃ、どうするの？全く何もしないの？
問題点に注意しつつできるだけ妥当にその手法を使うべきだと思うが。

だいたい誤差を含む標本から、母集団を完全に特定することは不可能であり、
それを認識したうえで、最も妥当な（マシな）手法を適用するのが統計学の立場。
数学は完全に正しいことを扱う立場で、その立場の違いが、
統計学が理学部数学科に入れてもらえない（入らない）理由のひとつだと思う。

388 ：381：05/02/20 19:31:46

>>384
ベイズは真剣にやったことなかったんですけど、ネットで読みました。
ttp://www.neurosci.aist.go.jp/~kurita/lecture/prnn/node3.html
ベイズ決定方式って、事前確率を決めておくだけで、事前分布はいらないんですね。
個人的にベイズの事前分布が好きになれなかったんですけど、ベイズ決定方式ってよさげですね。
ちょっと怖いのは、解析方法に自由度が高そうなところかな。もっと定式的にできないものか。

389 ：１３２人目の素数さん：05/02/20 23:38:29

>>388
事前確率が事前分布を含んだ関数になる場合もあるよ。
でも、確かに388が言うように解析方法の自由度が高いところが難点だよね。
事前確率を決める場合に帰無仮説と対立仮説の確率を何にするのかとか、
客観的な値って決めずらそう。
事前分布はジェフリーズの何とかを使えばデータを以って語らしむることもできそうだが。

390 ：１３２人目の素数さん：05/02/23 12:55:44

いま論文の翻訳をやっているのですが、
「homogeneous demographical variables」
という部分がうまく訳せず困っています。

おそらく、アンケートなどの、基本的な調査項目（性別、年令 etc...）みたいな
方向性だと思うのですが、できれば専門用語を使いたいのです。
大変お手数かと思いますが、どなたかご教示いただけませんでしょうか・・・
よろしくお願いいたします。

391 ：１３２人目の素数さん：05/02/23 13:47:17

>>390
適切な訳語は思いつかないけれど，「均質的なデモグラフィック変数」
とかじゃだめですか？

392 ：１３２人目の素数さん：05/02/23 14:49:53

>>387
理学部数学科でも統計学を扱っているところはあるだろ。
基礎研究が華やかだった頃は、カチカチの理論屋さんも
いたが、今になってパワーダウンしまくりで今後数学的
な扱いをされないかもな。情報系の一分野とか・・・

しかし統計界全体がダメポ状態だな。
一番痛いのは、統計学科がないことだ。

393 ：390：05/02/23 14:52:38

>>391様
おお～、demographical（demographic）はカタカナが正解だったんですね～！
まったくの盲点でした (>_<)
「デモグラフィック変数」でググってみたら、100件以上ヒットしましたよ～。
本当にありがとうございました！

あと、スレ汚しちゃってゴメンナサイ・・・

394 ：１３２人目の素数さん：05/02/23 17:11:06

***********************************************************
１．次のデータの平均値と標準偏差を求めよ。
７５、８９、８３、９０、９３、７６
(1)平均値
(2)標準偏差
２．次のデータの平均値と標準偏差の95%信頼区間を求めよ。
８３、８５、８２、８８、８１
(1) 平均値の95%信頼区間
(2) 標準偏差の95%信頼区間
***********************************************************
上の問題の２．(2)が解き方が解りませんので教えてください。

395 ：新古典派：05/02/23 19:11:48

私の職場では結構統計の手法を使う。
生産管理とかの現場でも統計は必要らしい。
金融でも使うらしい。
にもかかわらず、私の職場では統計学を系統的に学んだものがいない。
理系学部卒のやつが、適当に統計の本を読んでデータ処理している。
でも、一番統計を理解しているやつが大学の教育学部で発達心理学を
学んできたやつ（実験で統計を使いまくるらしい）で理系のやつがそい
つにいつも質問している。

　なんで、日本の大学には統計を系統的に学べる場所がないだろうか？
海外の大学院を修了した大学教員のなかにはDoctor　of staticsをもっている
者もいるのに。

396 ：１３２人目の素数さん：05/02/23 19:36:00

>>395
統計は理論より技術が優先されるからと思われ。

397 ：１３２人目の素数さん：05/02/23 19:47:00

>>395
> Doctor　of statics
ホントに統計学やってんのかと問いつめたい。

398 ：１３２人目の素数さん：05/02/23 21:54:09

漸近理論あたりを極めても、現場でデータを出されて
何も議論できないようじゃあ無用の長物になるし・・
理論もデータも扱える人は少ないね。

399 ：１３２人目の素数さん：05/02/26 16:01:12

数学オンチゆえ、ちと頓珍漢な質問かもしれませんが
現在、世帯視聴率で一般的に使用されている系統抽出法なる手法を使って
選挙の投票者を調査した場合、その結果は実際の選挙結果と誤差の範囲内に
おさまるはずですが、統計学に見てこれは正しい見方でいいのでしょうか？

400 ：１３２人目の素数さん：05/02/27 11:31:33

age

401 ：１３２人目の素数さん：05/02/28 00:18:44

>>399
その書き方だと事前調査のことか事後調査（出口調査）のことだか
わからん．

402 ：３９９：05/02/28 13:46:24

>401
あっ、すいません。どちらでもないです。
出口調査では必ずしも正直な答えとは限らない人がいるので。
この場合は、機械的にかもしくは他の手段でもいいですが、正確に投票を
サンプリングできる　と想定した場合についてです

403 ：１３２人目の素数さん：05/03/02 04:05:13

>>402
サンプリングの方法論を抜きにすると，統計学のイロハのイに属する
話なので，統計学の教科書を読んで欲しいのだけど，
結論を言うと，投票を確率抽出した場合（確率抽出というのは，全ての
投票が同確率で抽出される，という意味です），投票結果を「推定」ないし
「推測」（同じ意味）することは出来ます．

具体的に言うと，サンプルでのA候補の得票率がx％のとき，
「95％の確率で，投票結果は(x-α)％以上(x+α)％以下に収まる」
というように推定できます．

404 ：１３２人目の素数さん：05/03/02 08:36:32

age

405 ：１３２人目の素数さん：05/03/02 20:18:15

重回帰分析の質問です。

説明変数間に相関があるからこそ、変数間の影響が調整されて
重回帰分析の意味があるといえるのでしょうか？

406 ：１３２人目の素数さん：05/03/02 21:24:51

座標の取り方でどうにでもなるのでは？

407 ：１３２人目の素数さん：05/03/03 20:56:41

>>350
>「確率」と「確率密度」の違い．．．．
一言で言えば、>>355も言ってるが確率関数ダイアグラムの「積分値」と「y軸値」。

408 ：教えてください：05/03/03 22:22:06

自然対数ｅに関する質問です。

ｅ=1+1/1！+1/2！+1/3！+1/4！+…

と言うのは周知のことだと思いますが、

1+(1/1!)＾2+(1/2!)＾2+(1/3!)＾2+(1/4!)＾2+…

（つまり上記ｅの右辺の各項の2乗の和）
は、一体どんな値になるのでしょうか？教えてください。

409 ：教えてください：05/03/03 22:24:02

追加、一般のｎに対して、

1+(1/1!)＾ｎ+(1/2!)＾ｎ+(1/3!)＾ｎ+(1/4!)＾ｎ+…

の値はいくらになるのでしょうか？

410 ：１３２人目の素数さん：05/03/06 22:04:30

M2ですが、数理統計学をみっちり勉強したいと思っているのですが、
何かイイ本はないでしょうか？
数理統計学　稲垣宣生著　裳華房
の次ぐらいに読めるレベルの本を教えて頂きたいのですが。

411 ：１３２人目の素数さん：05/03/07 12:18:30

今、正の相関が強い2つの銘柄に投資したい投資家がいたとする。この投資家
は各銘柄の株価変動に対し平均的に見て上下20円までなら対応可能で株価変動
の期待値が上下20円になるまで各株式を購入しようと考えている。
この投資家はX,Y,W,Zをそれぞれ何株購入するか？上で求めた株式保有量でXと
Yを保有した場合のふたつの銘柄の保有価値（価格×保有量）の共分散を求め
よ。
同様にWとZの保有価値の共分散を求めよ。
定義　Xは確率関数　E[X]は期待値 Var[X]=E[(X-E[X])の二乗] pxy(相関係数）
=ルートVar[X]×Var[Y]分のCov[X,Y]
Cov[X,Y]=E[(X-E[X])(Y-E[Y])]　　Cov[X,Y]は共分散　　　　　　　　　　　
　　　　　　　　
Var[X]=Var[Y]=4 Cov[X,Y]=3.8
Var[W]=Var[Z]=400 Cov[W,Z]=152 マジでお願い助けてください

412 ：１３２人目の素数さん：05/03/07 15:00:31

>>411
統計学の入門書をみてね

413 ：１３２人目の素数さん：05/03/07 15:32:04

412さんへ　　死ぬほど見ましたが何か？

414 ：１３２人目の素数さん：05/03/07 16:11:19

>>413
まだ生きてるじゃねーか

415 ：１３２人目の素数さん：05/03/07 20:39:23

>>408
ちょっと考えたが、何某かの値に収束はするが、それを
厳密にあらわすのは無理ではなかろうか ?

416 ：１３２人目の素数さん：05/03/07 21:41:46

>>408,409
いづれも∞に収束する

417 ：１３２人目の素数さん：05/03/08 10:30:03

>>416
そんなわけないでしょう。
e より小さな値のはずでは。

418 ：１３２人目の素数さん：05/03/08 22:58:30

>>276
>(X-μ)/S は正規分布でなくt分布にしたがう．．．
ことの証明記事を載せた統計学書籍を、何例か紹介願えませんか。

419 ：１３２人目の素数さん：05/03/08 23:59:02

>>418
漏れが証明を見たのは岩波の小針「確率・統計入門」が最初かな。

420 ：１３２人目の素数さん：05/03/09 20:50:47

日本の統計学の重鎮は誰だと思う？

421 ：１３２人目の素数さん：05/03/09 21:33:49

>>419
Thanks。うーん、3000円か、図書館で探してみよう。
確率・統計入門　小針〓宏　岩波書店　1973
http://www.iwanami.co.jp/.BOOKS/00/1/0051570.html

422 ：１３２人目の素数さん：05/03/09 22:27:39

>>418
　t分布はコゼットだね。
証明は密度関数がわかっていれば結構簡単に計算できると思うが。。。

423 ：１３２人目の素数さん：05/03/10 21:01:10

>>422
片や(X-μ)/σは正規分布に、片や(X-μ)/Sはt分布に従う．．．この相違の理由を
判りやすく説諭してもらえると有り難いのですが。

424 ：１３２人目の素数さん：05/03/11 13:20:38

>>423
σは定数なのにSは確率変数。(X-μ)/σと(X-μ)/Sが異なる分布になるのは当然だろ？

（丁寧に書けば、X=(X[1]+X[2]+…+X[n])/nなわけだが、SもX[1],X[2],…,X[n]の
関数であることに注意）

(X-μ)/Sの分布（もはや正規分布ではなくなった、ゆがんだ分布）を「t分布」と名づけた
だけのこと。
Sの分布の密度関数は計算できるから、(X-μ)/Sの密度関数も計算できる。正規分布よりだいぶ
複雑な関数になるが。

425 ：１３２人目の素数さん：05/03/13 13:49:53

重回帰分析において、説明変数間の相関関係と、
パラメータ係数の標準誤差にはどういった関係があるのでしょうか？

426 ：１３２人目の素数さん：05/03/14 14:23:45

米国のＢＳＥ検査について
屠畜された３５００万頭のうち、２万頭を検査
信用できるサンプル数？

427 ：１３２人目の素数さん：05/03/14 21:09:38

重回帰分析の目的変数は等分散であるとされていますが、
この分散の値は具体的に何になるのでしょうか？

計算のしようがないと思うのですが。。。。

428 ：１３２人目の素数さん：05/03/14 21:32:01

判別分析をゼミでやっているのですが、何か実例を用いて判別をすることになりました。
そこでうまく判別が出来そうなデータを探しているのですが、中々いいのが見つかりません。
どの様なデータでやったらよいのでしょうか？

429 ：１３２人目の素数さん：05/03/15 02:55:39

因子分析を勉強し始めた者ですが、生のデータを載せて一から
解説しているサイトをどなたかご存知ないでしょうか。
どのサイトでも計算式はそこそこわかりやすいのですが、
データまで載せているところがないので聞いてみました。

430 ：１３２人目の素数さん：05/03/16 21:13:02

>>428
男性と女性の 3-size のデータ

>>429
ここは？
http://kogolab.jp/elearn/icecream/index.html

431 ：429：05/03/17 00:49:04

>>430　ありがとうございます。早速取りかかります

432 ：１３２人目の素数さん：05/03/20 23:53:07

群間比較の評価方法についての質問です。

医学論文で
変化量（後値-前値）の値で単純に群間比較を行っているのと
変化率（　{（後値-前値）/(前値)}×100　）の値で群間比較を行っているのを
見かけますが、厳密にはどちらが正しい方法なのでしょうか？
それとも、場合により使い分けるべきものなのでしょうか。

433 ：１３２人目の素数さん：05/03/21 00:05:10

数学記号って顔文字になるから面白いよね～！
あはははははまはやなははははぱぱばはははばばばぱはははははははははははははは

434 ：エクセルの相関について質問です：2005/03/23(水) 18:37:36

エクセルのグラフで
「近似曲線の書式設定」で傾きと切片が表示されますが

関数で用意されているSLOPEとINTERCEPTで算出される
傾きと切片の値と一致しません

SLOPEとかINTERSEPTでは駄目なんでしょうか？

435 ：１３２人目の素数さん：2005/03/23(水) 20:23:51

とある田舎の企業で、技術を商売にしています。
さて、突然上から商社部門で在庫を持つ商品を増やすことになったが、
何をいくつ持てばよいのか、というたらい回しの課題が私に回ってきました。
回転サイクルを６ヶ月位に併せたいとの事でしたが、

とりあえず出荷実績をピボットテーブルで集計して、
商品Ａ　４月－１００個　５月－２００個　６月－１０個
といったデーターを作りました。
この結果、８，９月の出荷がほぼ全ての商品に置いて出荷が伸びていたり
突出して高い月や低い月がしばしばあることが解りました。

さて、このような１２ヶ月分のデーターを基に来年の出荷数の
期待値を求めたいのですが、単純に今年の半分にするには少々怖い気がします。
かつ、来期の経済動向を見る限り出荷が今年以下なのは間違い無いと思われ、
出来るだけ弱気な予測で進めたいのですが、
このような場合に置いて、標準偏差等から月の出荷数の最小値予測等を
たてられないものでしょうか。

一例を示しますと、
４月から順に61,120,180,120,120,180,60,62,60,60,61
別の商品では 80,50,10,50,60,20,70,60,40,40,20
といった感じです。前者は感覚的に最低60個くらいかなといった感じですが、
何か根拠のある数字を算出することは可能でしょうか。

436 ：435：2005/03/23(水) 20:25:08

技術と言っても、全然統計なんかとは異分野なのですが
数字使う以上は一緒だろう・・・という事で明日までに根拠のある
数字を出さねばならず困っています・・
何卒ご助力をお願い致します。

437 ：１３２人目の素数さん：2005/03/23(水) 22:52:18

正規分布の式なんですが。

天下りに、与えられていますよね。
母関数から、漸化式から、積分形式から～～など。

ところで、フーリエ変換だとみると、
Ｆ（ｘ→ｆ）について、変換前後で同じ様な形になるのは何故なんでしょうか？
ｅｘｐの積分だから？だけで良いとは思うんですが、どうもしっくりきません。

分かる方説明お願いします。

まあ、別に使うだけなら何の問題もないことなんですが。

438 ：１３２人目の素数さん：2005/03/24(木) 02:32:59

＞さて、このような１２ヶ月分のデーターを基に来年の出荷数の
＞期待値を求めたいのですが、単純に今年の半分にするには少々怖い気がします。
質問の意味から訳が分からないんだけど～・・・。

期待値っていうのは平均値でしょ？
文章全体では、今年の出荷数から来年の出荷数の平均を出せっていうんだから・・・。

今年の出荷数×係数＝来年の出荷数でしょ。

結局係数を適当に出して、今年の数に係数を書ければいいだけじゃん。・・・。
小学生でも出きる算数だが・・・・。

係数をどう出すか・・・。それは野生のかんでだしてね。
というか、ホントに技術にいるの？

439 ：１３２人目の素数さん：2005/03/24(木) 04:48:25

＞係数をどう出すか・・・。それは野生のかんでだしてね
それはむしろ小学生の方が直感強そうな気がするなｗ

440 ：１３２人目の素数さん：2005/03/24(木) 21:38:38

PCゲーム板の10段階評価スレをまとめてるんだけど
平均値よりもっと参考になってわかりやすい数値ってあるかな？
最高点、最低点、平均点だけだと、ぱっと見てどれがいいのかわかりにくいようなので
何卒よい知恵をお貸し下さい
ちなみに当方、かなりの数学オンチなので優しくご指導くださるとうれしいっす
http://miyoshiza.s59.xrea.com/pcgame10/index.php

こういう質問はこのスレでよかった？

441 ：１３２人目の素数さん：2005/03/24(木) 21:50:08

>>440

そうだね～、平均点だけで良いんじゃない？

アンケートの標本数をある程度以上大きくしないと、いみのある統計にならないからね～。

でも、全数検査して平均点出すと（全てのデータをエクセルに入れると）
標本を抜き出すよりも正確なので、ＰＣにシコシコ打ち込んで、標準偏差とか
機械的に書いておけば良いんじゃないの？

平均点に標準偏差を付け加えておけば、それで完璧でしょ？

詳しい人　　→標準偏差から自分で詳しく計算し出す
詳しくない人→標準偏差は偏差値みたいなもんだとおもう。

442 ：１３２人目の素数さん：2005/03/24(木) 22:03:49

すいません、統計学に素人なのですが、ほぼ正確な平均点をだすには、
最低点数って何個必要なんですか？教えていただけませんか？

443 ：１３２人目の素数さん：2005/03/24(木) 22:05:00

相加平均にしれよ

444 ：１３２人目の素数さん：2005/03/24(木) 22:12:48

>442
教科書見ないと正確なこと言えないけど。

（標本数）^（1/2）にひれいして信頼区間が狭くなるはず。

あと・・。何か入門書呼んでから質問してくれ。

［基本］
①正規分布の式があって、全部を足し算すると（積分すると）１００％になる。
②平均値±σ（標準偏差）で６３（？）パーセントになる。

をふまえた上で

［応用］
使う分布
危険率を何％にするかをきめる。

こういう関係です。

分布表があったとして、人間様がある程度条件を指定してやったらある数字を出してくれます。
それが統計なんです。

つまり、質問のままでは答えようがないんです。

（かな～り親切に答えてしまった。普通って本をよめで終わるぞ）

445 ：１３２人目の素数さん：2005/03/24(木) 22:38:33

>>442
ある程度信頼できる平均値を出すには、サンプルが30個以上は必要。
経験則だけど、割と一般的な基準だと思うよ。

446 ：１３２人目の素数さん：2005/03/24(木) 22:56:28

>>445
詳しそうだね！

（離散型分布の）半値幅補正って、するときとしないときの違いってどうやってますか？

447 ：１３２人目の素数さん：2005/03/25(金) 00:44:51

>>446
詳しかないよ。
分布が気になるならGrimmの式で中央値でも出せば？

448 ：１３２人目の素数さん：2005/03/25(金) 01:42:10

>>447

半値幅補正するときとしないときでずいぶん確率変わりますよね。
しかし、するための方針が書いてない（きがする）ので悩んでました。

まあ、授業で言われたとおりにしただけですが。

中央値によってする・しないでいいんですか？

449 ：１３２人目の素数さん：2005/03/25(金) 03:54:23

この本最高！
この本がお薦めです。
http://www.amazon.co.jp/exec/obidos/ASIN/4774109290/

450 ：１３２人目の素数さん：2005/03/25(金) 06:43:18

>>446
面接官「サンプル数は30とありますが？」
学生　「はい。30です。」
面接官「30では少なくありませんか？」
学生　「経験則です。」
面接官「え、経験則？」
学生　「はい。経験則です。ほぼ正確な平均点を与えます。」
面接官「・・・で、その経験則だと95%信頼区間は何点から何点までですか？」
学生　「はい。ほぼ正確な平均点です。」
面接官「いや、私は具体的な誤差をたずねています。それにほぼ正確ではあいまいですよね。」
学生　「でも、一般的な基準ですよ。」
面接官「いや、一般的とかそういう問題じゃなくてですね・・・」
学生　「詳しそうな人が言っているんですよ。」
面接官「ふざけないでください。それに詳しそうな人って何ですか。だいたい・・・」
学生　「統計に詳しそうな人です。素数さんとも呼ばれます。素数さんというのは・・・」
面接官「聞いてません。帰って下さい。」
学生　「あれあれ？怒らせていいんですか？使いますよ。半値幅補正。」
面接官「いいですよ。使って下さい。半値幅補正とやらを。それで満足したら帰って下さい。」
学生　「運がよかったな。今回は半値幅補正が必要ないみたいだ。」
面接官「帰れよ。」

>>445は精度が問題にならない時の簡易法でしょう。
精度について適当なのに半値幅補正を行うのはちぐはぐです。
精度を重視するなら>>444の通りにやるべきでは？

母平均の信頼区間
http://aoki2.si.gunma-u.ac.jp/lecture/Average/Mean2.html

451 ：１３２人目の素数さん：2005/03/25(金) 12:48:37

>>434

エクセルのグラフのX軸の参照がきちんとされているかどうかを調べましょう。

452 ：440：2005/03/25(金) 14:49:48

>441
数が少ないとあんまり意味ないんですな、なるほろ
即レスサンクスっした

453 ：１３２人目の素数さん：2005/03/26(土) 00:22:13

統計学で有名な大学って何処かわかりますか？

454 ：１３２人目の素数さん：2005/03/26(土) 00:52:01

コルモゴロフ大学

455 ：１３２人目の素数さん：2005/03/26(土) 00:58:14

>>453
なぞなぞ？
んー、あ、分かった。東京経済大学（東経大）

456 ：１３２人目の素数さん：2005/03/26(土) 01:07:12

いや、真面目な話です。国内だと何処になりますか？

457 ：１３２人目の素数さん：2005/03/26(土) 11:49:56

一橋

458 ：１３２人目の素数さん：2005/03/26(土) 20:23:51

>>453
総合研究大学院大学の統計科学専攻なんかどう？

総研大自体は無名だけど統計科学専攻ほぼイコール統計数理研究所
（厳密には違う）だから、先生にきちんと頼んで、授業してもらったら勉強に
なると思うよ。

統数研は統計学者と確率論の専門家を中心に50人も先生がいるし、
これだけ統計学者が集まってる所は国内では他にないんじゃないかなぁ。

問題は博士課程しかとらないのと、毎年数名しか入学できないってことか。

URLを貼っとくね。
http://www.ism.ac.jp/index_j.html
http://www.ism.ac.jp/senkou/

459 ：１３２人目の素数さん：2005/03/26(土) 21:44:22

証券系の資格とってそれ系の職に就けば嫌でも統計のエキスパートになると思うけどね

460 ：１３２人目の素数さん：2005/03/27(日) 06:55:26

>>459
統計学者になるか、統計解析エキスパートになるかで違うのではないかな？

461 ：１３２人目の素数さん：2005/03/27(日) 08:41:09

>>459
は？ｗ

462 ：１３２人目の素数さん：2005/03/27(日) 22:31:04

「最尤推定」ってどう読むんですか?

463 ：１３２人目の素数さん：2005/03/27(日) 23:31:48

さいゆうすいてい

464 ：１３２人目の素数さん：2005/03/28(月) 00:05:34

さいいぬすいてい

465 ：１３２人目の素数さん：2005/03/28(月) 08:18:56

さいけんすいてい

466 ：１３２人目の素数さん：2005/03/28(月) 18:55:04

もっともやりてい

467 ：１３２人目の素数さん：2005/03/28(月) 19:33:46

さい尤すいてい

468 ：１３２人目の素数さん：2005/03/29(火) 01:23:22

もっともっとすいてい

469 ：学籍簿”削除”：2005/03/29(火) 10:23:48

　統計って、純粋に数学が得意だぜってやつがやってもわからないとかいうよね。
俺の大学の数学専攻のやつら、一般教養の社会統計学を落としまくっていたよ。
なんで、数学科が社会統計かというとだね、時間割上、この科目しかとれないからだよ。

470 ：463：2005/03/29(火) 12:51:06

>>464-468
おまいら、おもろすぎる

>>469
統計学って数学は使うが、数学とはぜんぜん別の学問だと
思った方がいいと思うよ（個人的にはそー思っている）

471 ：１３２人目の素数さん：2005/03/29(火) 20:50:11

別にどうでもいいんだけどさ、F分布と二項分布の関係使ってやる検定ってめんどくさいよね。

472 ：１３２人目の素数さん：2005/03/31(木) 14:27:16

相関行列って半正定値行列だっけ？

473 ：１３２人目の素数さん：81/64/49/36/25/16/09/04/02(土) 10:22:01

すみません。教えてください。
定期的に測定している値が
ある時期シフトしているって部分を
検出したいのですが何かいい方法ありますか。
ヒントをお願いします。

474 ：１３２人目の素数さん：2005/04/03(日) 00:15:09

>>473
それはね～。干渉項がきいているからなんだ～。

実測される値は内積なので問題ないんだよ～。

なんか、こう答えたくなった。

475 ：473：2005/04/03(日) 09:38:09

>>474
みないといけない項目が多いので
自動的に検出できる仕組みを作りたいわけです。
検出した項目に着目して解析を進めて問題有り無しの判定をかけたい。
何かヒントを..

476 ：１３２人目の素数さん：2005/04/03(日) 11:03:03

>>475
そんな真剣に聞かれても・・・。

統計学には全く答えていないよ？
あと、つい最近の答えにもあったけど。
統計学って、何か条件を指定してやると、ある数字（確率）を返す様なもんだよ。

定期的にずれる～だけでは何とも。
どの分布を使うのか・・・。良くは分かりません。

入門書読んだらいいとおもうよ。

477 ：１３２人目の素数さん：2005/04/03(日) 15:44:55

>> 475
outlier detection とか、anomaly detection とかの
論文は参考になるかも。

478 ：１３２人目の素数さん：2005/04/03(日) 15:52:51

>>473
これだけの情報じゃ、誰もアドバイスできないと思うな。

回帰分析なんかでの係数の構造変化を知りたいならchow testというのがある。
まずは構造変化＋chow＋testとかでぐぐってみそ

479 ：１３２人目の素数さん：2005/04/03(日) 18:07:52

　因子分析をして、プロマックス回転後の因子負荷量が

　　　　　　　 Rotated Factor Loadings
　　Variable |　　　1　　　　　2　　　　　3　　　　　4　　Uniqueness
-------------+------------------------------------------------------
　　qstn18_1 |　 0.67214　　0.05747　　0.05408　　0.31874　　0.47035
　　qstn18_2 |　-0.03822　　0.73199　　0.05834　 -0.01974　　0.47065
　　qstn18_3 |　-0.22900　　0.01113　　0.18645　 -0.62278　　0.52126
　　qstn18_4 |　 0.07614　 -0.12252　 -0.92382　 -0.09130　　0.18167
　　qstn18_5 |　 0.41901　 -0.38076　　0.27673　 -0.32740　　0.37523
　　qstn18_6 |　-0.06754　 -0.13585　　0.36188　　0.68273　　0.43877
　　qstn18_7 |　 0.20298　　0.67146　　0.18360　 -0.15224　　0.49381

と出てきたのですが、たとえば４に、符号が逆で大きなものが出てきております。こういうのはおかしいのでしょうか。

480 ：１３２人目の素数さん：2005/04/03(日) 20:17:15

>>479
おかしくない。
qstn18_6 と qstn18_3 って反対の意味になるような項目なんじゃない？
あとは、変数削れるなら qstn18_4 は削りたいなぁ、とか。

ところで、因子の抽出法は何使ったの？

481 ：479：2005/04/03(日) 21:18:03

>>480
お世話になっております。おっしゃるとおり、確かに６と３は反対の項目であります。
ということは、反対の項目であることを考慮しつつその因子がなにを表すかを
考えればよいのですな。

因子の抽出には主成分分析を用いており、主成分分析で固有値が1以上にあるのが4つなので4としてみました。

さっき貼り付けたものですが、一番下のものがかけておりました。
ごめんなさい。「その他」という奴です。
　　qstn19_8 |　-0.78053　 -0.05101　　0.16223　　0.05360　　0.37775

項目を削ったり入れたりする判断をどうするのか私はわからないのですが、
何かよいサイトはないものでしょうか

482 ：１３２人目の素数さん：2005/04/03(日) 23:01:18

素人質問すみません。
ガウス分布は正規分布と同じですか？

483 ：479：2005/04/03(日) 23:22:21

や、もうしわけありません。項目の出し入れは共通性の高低で判断するのですな。

484 ：１３２人目の素数さん：2005/04/03(日) 23:29:44

>>482
同じだ。

485 ：１３２人目の素数さん：2005/04/04(月) 00:51:40

>>479
> 因子の抽出には主成分分析を用いており、

主因子法か最尤法を使ってみたらどうかな。

> 項目を削ったり入れたりする判断をどうするのか私はわからないのですが、

共通性の高低は変数選択の目安になるけど、最終的には事前仮説や分析の目的に照らして
分析者が判断するべきだと思うよ。

> 何かよいサイトはないものでしょうか

因子分析について
http://home.hiroshima-u.ac.jp/keiroh/maeda/statsfaq/efa.html
http://home.hiroshima-u.ac.jp/keiroh/maeda/statsfaq/efa1.html
http://home.hiroshima-u.ac.jp/keiroh/maeda/statsfaq/efa2.html

心理統計の注意点：因子分析についての注意点
http://www4.ocn.ne.jp/~murakou/factor.htm

探索的因子分析リンク集
http://www.ec.kagawa-u.ac.jp/~hori/spss/factorlink.html

486 ：479：2005/04/04(月) 03:53:39

どうもありがとうございます。さらに研鑽を積みます。

487 ：１３２人目の素数さん：2005/04/05(火) 15:21:57

"nearest neighbor" って、何て訳すのがいい？

488 ：１３２人目の素数さん：2005/04/05(火) 17:57:22

もっとも身近なご近所さん

489 ：１３２人目の素数さん：2005/04/05(火) 18:03:12

隣のお姉さん

490 ：BlackLightOfStar ◆ifsBJ/KedU ：2005/04/05(火) 18:06:09

Re:>489 何故お前にそんなことが分かる？

491 ：１３２人目の素数さん：2005/04/06(水) 11:05:29

T2-統計量ってなんのことか分かりますか？

492 ：１３２人目の素数さん：2005/04/06(水) 11:25:10

T^2 = (X-m)^G C^-1 (X-m)

(X は確率変数ベクトル、m はその平均ベクトル、C は共分散行列)
と書いてあるのですが、^G ってなんなのかな。。。

493 ：１３２人目の素数さん：2005/04/06(水) 18:50:29

>>492
転置...かなぁ。

494 ：１３２人目の素数さん：2005/04/08(金) 10:23:07

>>487

クラスター分析の最近傍法とか、それっぽい話？

495 ：487：2005/04/08(金) 20:14:24

>>494
そのとおりです。
「最近傍」という訳が一般的ですか？

496 ：494：2005/04/08(金) 20:22:33

じゃないすかね。

497 ：１３２人目の素数さん：2005/04/14(木) 00:37:43

独立成分分析において、フィルタの更新式にtanhなどの非線形関数が入る理由について、
誰かわかりませんか。。。？

498 ：１３２人目の素数さん：2005/04/15(金) 11:13:02

age

499 ：１３２人目の素数さん：2005/04/21(木) 19:45:06

初心者からの質問です。
ある２つの薬物の効果を調べています。
薬物Ａを暴露した場合、1 nM, 10 nM, 100 nMでそれぞれ10, 25, ８0 mmHgの血圧上昇が認められました。
同様に薬物Ｂを暴露した場合、1 nM, 10 nM, 100 nMでそれぞれ20, 50, 100 mmHgの血圧上昇が認められました.
次に薬物Ａ，　Ｂを同時投与して（それぞれ1 nM, 10 nM, 100 nM）で25, 60, 120 mmHgの血圧上昇が認められました。
この場合、薬物の相加作用、相乗作用を調べるにはどのような統計方法を使いますか？

500 ：１３２人目の素数さん：2005/04/22(金) 18:51:29

ご教授お願いしますm(__)m
(1)平均µ，分散σ^2の母集団から抽出した２個の無作為標本をＸ1、Ｘ2 とするとき、ａＸ1＋ｂＸ2が母平均µの不偏推定量で，かつ有効推定量となるような定数a ， b の値を求めよ．
(2)パンをたくさん作ったとき、パンの重さは平均μ(g)、標準偏差３(g)の正規分布に従うとする。このパンのなかから無作為に16個だけ抽出して、「推定の誤差が1.47以下で母平均μを推定できる確率」は0.95である。これはなぜか答えなさい。

501 ：１３２人目の素数さん：2005/04/23(土) 11:07:30

57 ：１３２人目の素数さん：2005/04/22(金) 18:24:50
平均-1.5SDって偏差値で言うと35でいいんでしょうか？
それと、平均-1.5SDは、正規分布であれば大体下位何％に相当するのでしょうか？

502 ：１３２人目の素数さん：2005/04/23(土) 14:42:08

>>500
（１）は去年のアク試験の問題だね。
有効推定量の定義は分散が最小になる不偏推定量、もうできるだろ？

（２）についてだが、お前は考える気あんのか？
ここまでわかったが、この先がわからないとか質問しろ。
数値が入ってる問題はこっちもめんどくさいんだよ。

503 ：１３２人目の素数さん：2005/04/23(土) 18:27:54

結合ガウス分布ってなんですか？
教えて下さい、どこにものってないんです

504 ：１３２人目の素数さん：2005/04/23(土) 19:48:13

都市の人口の統計は、なぜ対数正規分布になるのですか？

505 ：１３２人目の素数さん：2005/04/23(土) 22:10:23

>>503
結合じゃなくて混合じゃないのか？

506 ：１３２人目の素数さん：2005/04/24(日) 11:59:01

分析にあたって、サンプルの分布形状がかけ離れたものを一緒くたに
扱いたくないので、あらかじめサンプル分布の形状でサンプルを
分類しておきたいと思います。
このような場合、どのような手法を用いるのが一般的でしょうか？

平均値や標準偏差などの要約値にした上で分類することも考えた
のですが、二峰性やすそ引きなども検出するにはうまくそれらの
分布形状を表現できる指標をそれぞれ導入しなければなりません。
できればそのような事前知識なしに直接に分布の類似性を判断
したいと考えています。

507 ：１３２人目の素数さん：2005/04/24(日) 19:20:01

Excel97のワークシート関数の相関係数計算用の=correl(Xi．．,Yi．．)と
=pearson(Xi．．,Yi．．)って、同じ数値がセルに表示されるんですが、どの
ように使い分けるのですか？

508 ：１３２人目の素数さん：2005/04/25(月) 03:45:14

>>440
亀レスだが自演投稿以前に、このタイプの投票は統計学的にまったく信頼できない。
本来統計とは無差別にサンプリングして集計するもの。
サンプリング手法自体に問題があって、統計学の基本は「無作為抽出」以外の方法は信頼に値しないはずでしょう？
この場合任意で投稿している。つまり膨大に標本数があってもまったくの意味のない統計だと思うが？

509 ：１３２人目の素数さん：2005/04/25(月) 17:13:58

はじめまして、大学の統計学で教授が問題を出したのですが、わかりません。
どなたか教えてくだされば幸いです。
問題
ある検定法では有意だが、別の検定法では有意でない場合、何が原因か？またこの場合、結論はどうなるのか？

よろしくお願いします。

510 ：１３２人目の素数さん：2005/04/25(月) 22:31:40

>>509
自分で考えな。
答えを出そうともがく経験は大切なんだよ。

511 ：１３２人目の素数さん：2005/04/26(火) 20:27:31

調査によるとあるTV番組を夫が見る確率は５０％、妻が見る確率は３０％である。
しかし、妻が見ていたら夫が見る確率は６０％の増加する。
夫妻が両方みる確率はどの程度か。
お願いします。

512 ：BlackLightOfStar ◆ifsBJ/KedU ：2005/04/26(火) 20:39:15

Re:>511 夫がみて妻が見ない確率、妻がみて夫が見ない確率、夫妻が両方みる確率、両方見ない確率に分けて考えよう。

513 ：１３２人目の素数さん：2005/04/26(火) 20:41:56

>>512
わかりました、事前確率とかベイズの定理だとかが混ざってわけわからない状態です。
やってみます

514 ：１３２人目の素数さん：2005/04/26(火) 20:53:23

一応全部だしたんですが、先が見えません。
前回、事前確率の問題を教授がすごい面倒な計算をしていてトラウマです。
実は簡単な問題なのかな・・

515 ：１３２人目の素数さん：2005/04/27(水) 10:41:32

ただ答えが知りたいだけなんで教えてください。

①男女間での肉・魚の好みの差異を調べるために、肉か魚かのどちらかを選ばせる調査をした。
このデータを解析するために最も適当な手法はどれか？
a.分散分析　b.因子分析　d.回帰分析　e.t検定　f.カイ2乗検定

②3群の平均値に差があるか否かを検定するための手法はどれか？
a.因子分析　b.分散分析　d.回帰分析　f.クラスター分析　g.t検定

516 ：１３２人目の素数さん：2005/04/27(水) 11:03:58

ウィーク型効率的市場仮説を検証するために、時系列分析を考えています。
例えば、Nikkei225等のデータを用いて、ARMAモデルを推定したとします。
仮説が成立するのであれば、推定されたモデルの有意性というものが棄却
されると思うのですが、どのような検定を行ったらよいのか、アイデアを
いただけませんか？
単に、自由度修正済み決定係数を計算しても意味がないと思いますし、
また、モデルの係数が全て０という仮説を棄却できるか？という事を
調べるのも安直のように感じますし。

517 ：１３２人目の素数さん：2005/04/27(水) 23:02:24

>>515
> ①男女間での肉・魚の好みの差異を調べるために、肉か魚かのどちらかを選ばせる調査をした。
> このデータを解析するために最も適当な手法はどれか？
> a.分散分析　b.因子分析　d.回帰分析　e.t検定　f.カイ2乗検定

b

> ②3群の平均値に差があるか否かを検定するための手法はどれか？
> a.因子分析　b.分散分析　d.回帰分析　f.クラスター分析　g.t検定

f

518 ：515：2005/04/28(木) 00:29:15

>>517 ありがとうございます。

519 ：１３２人目の素数さん：2005/04/29(金) 11:25:50

整数上で定義される実数値関数が定常時系列の自己共分散関数であるための
必要十分条件は、それが偶関数かつ非負定値となることを示してほしいのですが。
レベルの低い学部生なものですみません。おねがいします。

520 ：１３２人目の素数さん：2005/04/30(土) 12:49:36

>>509
powerが足りないとか。

521 ：１３２人目の素数さん：2005/04/30(土) 13:26:09

>>519
行列の非負であるための条件は知っているの？
Brockwell and Davisで勉強すれば

522 ：１３２人目の素数さん：2005/04/30(土) 15:55:27

よかったら、大学2年生ぐらいの人向けの「確率と統計」のいい演習書をおしえてくれませんか？

523 ：１３２人目の素数さん：2005/04/30(土) 21:17:24

野田一雄、宮岡悦良著「数理統計学の基礎」とその演習書

524 ：１３２人目の素数さん：2005/04/30(土) 21:17:51

共立出版

525 ：１３２人目の素数さん：2005/04/30(土) 21:43:43

ブートストラップとは要するになんなのでしょうか？
全くわかりません。

526 ：１３２人目の素数さん：2005/04/30(土) 23:41:38

>>519皮膚低地の正確な意味は？

527 ：１３２人目の素数さん：2005/04/30(土) 23:43:18

>>519はBochnerの定理（伊藤「ルベーグ積分入門」にある）の離散版だと思われ？

528 ：１３２人目の素数さん：2005/05/01(日) 10:11:52

>>525
無限次元母集団からの復元抽出による信頼性試験

529 ：１３２人目の素数さん：2005/05/01(日) 10:35:53

>>527
？？？

530 ：１３２人目の素数さん：2005/05/01(日) 10:44:32

ケータイ初！音声通話完全定額！

・旧DDIポケットのWILLCOMが月額2900円で、WILLCOM(エッジ)同士の通話が完全定額！
　しかも、2台目以降の基本料金は2200円！
　音質も固定電話並！北海道から沖縄にかけても無料！

プラン：定額プラン
通話：エッジ同士の通話が完全無料
Ｅメール：完全無料

http://www.willcom-inc.com/cp/teigaku/index.html

531 ：519：2005/05/01(日) 11:26:49

>>521 >>526 ありがとうございます。なんとかやれそうです

532 ：１３２人目の素数さん：2005/05/01(日) 13:56:56

2000個のサンプルを無作為に抽出してヒストグラムを描くと、かなり右裾が長い分布になりました。
その後、3000個のサンプルを抽出してもう一度ヒストグラムを描くとその分布の形状はどうなると予想されますか？

…という問題なんですが、やっぱりまた右裾が長くなりますよね？
左右対称にはなりませんよね？

533 ：１３２人目の素数さん：2005/05/02(月) 00:15:43

t分布じゃね？

534 ：１３２人目の素数さん：2005/05/03(火) 17:30:09

>>532
2000個のときよりは中心寄りになる。

535 ：１３２人目の素数さん：2005/05/03(火) 17:50:24

中心極限定理か、なるほど。そういう意図の問題なんだね。理解した。おれは532ではないけど。

536 ：ちなみに：2005/05/03(火) 21:19:31

でも中心寄りになることと中心極限定理の「中心」は意味が違う。
後者は幾つかある極限定理で中心的役割を果たすから「中心」なのである。

537 ：１３２人目の素数さん：2005/05/03(火) 21:24:13

↑こいつ嘘だから信用するな。
中心極限定理はx1、・・・、xnの平均ｍの確率分布が（n->∞）のとき分散が０になるからでしょ。

538 ：１３２人目の素数さん：2005/05/03(火) 21:34:49

>>537
それこそ違うんじゃないのか？
中心極限定理(central limit theorem)は、

母集団が平均μ、分散σ^2の分布にしたがっているとき、
標本平均の分布は平均μ、分散σ^2/nに近似される

ということじゃないのか？
「中心」という言葉自体、特に意味ないのは各統計書籍で
著名の先生方がいっているぞ。

539 ：１３２人目の素数さん：2005/05/03(火) 21:41:46

（n->∞）のとき、分散が０になる：
分散σ^2/n　－＞０

540 ：１３２人目の素数さん：2005/05/03(火) 21:44:38

>>539
ああ、それは分かるよ。
「↑こいつ嘘だから信用するな。」というのがおかしいよ。
別に言ってることあってるし。

541 ：１３２人目の素数さん：2005/05/03(火) 23:03:47

「中心」と呼ぶ理由が出てる文献希望

542 ：１３２人目の素数さん：2005/05/04(水) 00:01:00

>>541
統計的方法のしくみ―正しく理解するための30の急所 : 永田靖 (著)
にそんなようなことが書いてあったと思う。
手元にないので確認できず申し訳ない。
この本は一般人にとっての読み物としても非常に良い本なのでオススメ。

543 ：１３２人目の素数さん：2005/05/04(水) 09:47:52

Sample数を決定するのにいいsoftwareありますか？
SPSSのSmplePower2．0がいいかなと思ったのですが、Win XP SP2では動かないんです。
他群を設定した場合もできた方がよいのですが。

以上、宜しくお願いいたします。

544 ：１３２人目の素数さん：2005/05/04(水) 10:31:52

>>541
俺、古本屋で買ったんだけど、放送大学教材「統計学」長坂建二著,1989
に「中心化傾向」として記述されてる。

545 ：１３２人目の素数さん：2005/05/04(水) 18:32:01

>>544
なるほど、中心化傾向ね。
その著者がイメージするところは、
「平均の分布を取れば、それは元の分布の平均（すなわち中心）に寄る」
という考えから来てるんだろうな。
ここで補足しておきたいのは、「中心化傾向」は主に心理系の統計で
使われる言葉。例えば5件法のリッカート尺度で質問紙をとったときに、
ネガティブ項目に対しては「３．どちらでもない」に回答が集まりやすい傾向
が出る。これを中心化傾向といったりする。
総じて、中心化傾向というのは「母集団からサンプリングした際、その反応が
ある一点（連続不連続は別にして）に寄りやすい傾向がある」という場面で使うべき
だと思う。傾向なんだからさ。

あと、中心極限定理の仮定は
「母集団が平均μ、分散σ^2の分布にしたがっているとき」
だけで、別に何の分布でもいいんだよね。正規分布でなくても一様分布でもいい。
だから「中心に寄る」ということには、はっきり言ってあんまり意味はない。
海外の文献でも（何か忘れた。後日あげます）、
「centralではなく、fundamentalとして捉えるべきだ」
という表現が見られる。
他に何かある人お願いします。

546 ：１３２人目の素数さん：2005/05/04(水) 23:50:41

>>534 >>535
もし出題者の想定した回答がそれだとしたら、悪問のような気がするなぁ。

547 ：１３２人目の素数さん：2005/05/05(木) 00:45:27

>>546
ですね。>>534 でいう「中心に寄る」の別表現としては、
「スリムな形状になる」ぐらいかな。
だが、>>532 で分布がスリムになる保証はないし、ましてや>>533 でいうt分布にもならない。
だってリサンプリングするだけなんだろ？
解決の一つの方法としては、簡単なブートストラップ法を使うとか。

548 ：１３２人目の素数さん：2005/05/05(木) 03:31:48

純出生過程の一様乱数を発生させ、パラメータを作るプログラムって検索かけたら出る？出ないんだが

549 ：１３２人目の素数さん：2005/05/07(土) 19:39:15

灰色理論って何？

550 ：１３２人目の素数さん：2005/05/07(土) 22:54:00

>>532と似ている問題なんですけど、
「ある母集団からn個を抽出し、ヒストグラムを書く場合、nが大きくなるにつれて
ヒストグラムの形は
1)カイ2乗分布に似てくる
2)正規分布に似てくる
3)これだけではわからない」

…(3)じゃないんですか？

551 ：１３２人目の素数さん：2005/05/08(日) 01:11:38

2)が正解

552 ：１３２人目の素数さん：2005/05/08(日) 06:05:40

>>551
んなーわけない。1000個の母集団から1000個抽出したら当然母集団分布に従う。
1個抽出して戻して、という独立試行をn回行うなら確かに正規分布に似るだろうが。

553 ：１３２人目の素数さん：2005/05/08(日) 11:35:31

確かに母集団の分布が示されてない以上、3を正解とするのが適当でしょ

554 ：１３２人目の素数さん：2005/05/08(日) 20:54:52

ピクロトキシンは痙攣を誘発する。フェノバルビタールはピク
ロトキシンの効果を抑制すると考えられている。
ピクロトキシン単独投与の際に痙攣した個体は35、しなかった個体は10。
ピクロトキシンとフェノバルビタールを同時に投与した際は痙攣した個体は１、
しなかった個体は44である。
この時、フェノバルビタールに痙攣を押さえる効果があるかχ^2分布で求めよ。
有意差は五パーセントとする。

555 ：１３２人目の素数さん：2005/05/08(日) 20:56:32

>>551 >>553は馬鹿決定

母集団は無限集合を仮定していると考えるのが普通。
従って正解は２）

556 ：１３２人目の素数さん：2005/05/09(月) 05:10:32

>>550が「>>532と似ている」と書いてても、無限集合しか前提にできず、挙げ句に
自分にレスアンカーをつけて馬鹿決定とは・・・GWの締めくくりにふさわしいなｗ

557 ：１３２人目の素数さん：2005/05/09(月) 16:29:01

初歩的な質問ですが、どなたか助言をお願いします。
2群の比率を検定したいのですが、片方の比率が0の時は「解析不能」とすべきでしょうか。
無理矢理計算できるのですが、
X-squared = 0, df = 1, p-value = 1
となります。

558 ：１３２人目の素数さん：2005/05/09(月) 22:23:09

「片方の比率が0」とはデータ結果か理論から予想される比率か？

559 ：１３２人目の素数さん：2005/05/10(火) 11:14:15

>>558
観察結果です。よろしくお願いします。

560 ：１３２人目の素数さん：2005/05/15(日) 13:11:53

分散や平均値などから他の値における確率は逆算できるのでしょうか？

561 ：１３２人目の素数さん：2005/05/15(日) 13:37:49

>>560
標本分散や標本平均の値から、という意味？

標本平均3、標本分散１でした。標本の値は幾つでしょう？って
解ける？
標本数は幾つ？

562 ：１３２人目の素数さん：2005/05/15(日) 14:48:51

>>561
標準正規定数Zの問題でした。

ちなみに解けません。

563 ：１３２人目の素数さん：2005/05/15(日) 16:59:30

>>562
標準正規定数って何？
初めて聞きました。

明日、稲垣先生に聞いてみよ。

564 ：１３２人目の素数さん：2005/05/15(日) 17:11:34

>>563
正確には標準正規変数Zで 1/√2π e　-(1/2)ｚ二乗　です。

正直意味はわかりません

565 ：１３２人目の素数さん：2005/05/15(日) 17:41:44

Mercury Mufflers guarantees its mufflers for 5 years
On each muffler they sell make $8 ,out of which they must pay fo possible replacements under gurantee
Each time a muffler is replaced ,it costs $40
Their muffler life is approximate normally distributed around a mean of 7years ,
with standard deviation of 3 years

a What is the avarage profit per sale

b If they want their average profit per sale to be $3 ,
to what time period should they reduce the gurantees?
意訳）ある会社はマフラーに5年間の品質保証を置いている。
マフラーひとつあたり８ドルの利益がある
毎回マフラーは返却され、その際４０＄かかる。
それがおおよそ7年を平均とした正規分布であり、また標準偏差は3年である。

a 一度の売り上げの利益の平均は？
b 仮に一度の売り上げの平均が３＄としたら、どのくらい保障期間を減らせばいいか？

必死です、よろしくお願いします。

566 ：１３２人目の素数さん：2005/05/15(日) 18:23:31

>>565
ググルと
ttp://www.acad.polyu.edu.hk/~mathipwc/subjects/ama217/normal.pdf
こんなん出ました。
ハハハ♪ (*'▽')
See page 8!!

567 ：１３２人目の素数さん：2005/05/15(日) 18:50:06

>>566
うおおおおお
ありがとうございます。

ﾈﾀﾊﾞﾚですが、しっかり考えます。

568 ：１３２人目の素数さん：2005/05/15(日) 20:11:31

8*P(X>5)+(8-40)*P(X≦5)
=8-40*P(X≦5)
に展開されるのがよくわかりません
お願いします。

569 ：１３２人目の素数さん：2005/05/15(日) 20:27:48

>>568
私も一瞬間違いかと思った。
P(X>5)+P(X≦5)=1
代入してます。

570 ：１３２人目の素数さん：2005/05/15(日) 20:39:54

>>569
なるほど、ありがとうございます。

P(Z≦t-7/2.3)=0.125
t-7/2.3=-1.15
の展開でなぜ左辺に－がつくのかわからないんですが
よかったら教えてください。

571 ：１３２人目の素数さん：2005/05/15(日) 20:42:43

>なぜ左辺に－がつくのかわからないんですが
右辺でした訂正です。

あと1.15ってのはZ=0.125のときの値です

572 ：１３２人目の素数さん：2005/05/15(日) 22:05:01

>>572
0.125<0.5 ∴ 負になる。

Φ(z)=1-Φ(-z)です。Φは標準正規分布関数。

標準正規分布関数の性質です。
この辺り分かっていないと何も出来ません。

573 ：１３２人目の素数さん：2005/05/16(月) 04:22:14

Normalized Mean Squared Error(NMSE)とは日本語で何と言うのでしょうか？
またこれは何を指しているのでしょうか？
学校の論文に出てくるのですが、検索しても全く分からないのです。
ご存知の方、是非教えください。お願いします。

574 ：１３２人目の素数さん：2005/05/16(月) 07:24:25

>>573
MSEなら平均二乗誤差。
どういう局面でどう定義されたものかが分からないのでなんともいえんが、これになんらかの正規化、標準化をしたものだろ。
正規平均二乗誤差とか正規化（された）平均二乗誤差とかでいいんじゃね？

575 ：１３２人目の素数さん：2005/05/16(月) 19:51:32

>>573,574
なんとなく、誤差を平均0分散1に基準化した後でのMSEだと思ったんだけど、
違ってたらごめん。

576 ：１３２人目の素数さん：2005/05/16(月) 21:31:05

質問です。
十分統計量の直感的イメージを教えてください。
教科書などの例を見ても、どうもしっくり来ません。

577 ：１３２人目の素数さん：2005/05/17(火) 12:28:01

>575

ならstandardizedでしょ。正規化と標準化と明確に意味が違いますよね。
でも573のNMSEってあまり聞かないですね。変数変換によって残差がガウス化
されました、みたいな話ですかね。

578 ：１３２人目の素数さん：2005/05/18(水) 14:13:03

なんだかよくわからないので、質問させてください。
ANCOVAを使うのに最も適した状況はどんな場合なんでしょう？
また、使ってはいけない状況はどんな場合ですか？

教えてください。
お願いします。

579 ：NMSE：2005/05/18(水) 14:44:57

>>573
NMSEというのは、正規化２乗誤差のこと。
つまり、平均２乗誤差を真値の分散で正規化した値のことらしい。

580 ：１３２人目の素数さん：2005/05/18(水) 14:47:41

>>578
これ見れば？
http://kyoumu.educ.kyoto-u.ac.jp/cogpsy/personal/Kusumi/datasem/ANCOVA.files/frame.htm

581 ：１３２人目の素数さん：2005/05/18(水) 15:40:26

578です。
580さんどうもありがとう。

582 ：１３２人目の素数さん：2005/05/18(水) 21:30:01

モデルを使った統計分析の話なのですが、
パラメータを推定する際に最尤法を使うとすると、
最尤方程式を解くために遺伝的アルゴリズム等の最適化手法が使われているのでしょうか？

583 ：１３２人目の素数さん：2005/05/19(木) 00:49:51

>>579
>平均２乗誤差を真値の分散で正規化．．．
真値の分散って、何の分散のこと？

584 ：１３２人目の素数さん：2005/05/19(木) 03:01:50

数学的素養がまったくない人間なんですが、調査方法で悩んでるので助言お願いします

ニュース議論板にあるこのスレのこのあたり
http://news18.2ch.net/test/read.cgi/news2/1112627372/862-

で、ゲハ板（http://game10.2ch.net/ghard/）住人が「GK問題発覚後に板が不自然
なほど静かになった」という所感を述べていて、これを何とかデータ化できないかと
考えてるんですが、
これ調べる方法ってどういうものがありますかね？

条件としては
・●持ってるので当時の板の過去ログは全て掘れる
・grep等のツール、DB使ったプログラムなどは使用できる
・調べる日2004/12/17-18は土日なのでその影響も加味する必要がある

何か統計学の素人でもデータを出せるいい手順はないでしょうか？

585 ：584：2005/05/19(木) 04:15:50

間違えました
訂正
×調べる日2004/12/17-18は土日なので
○調べる日2004/12/17-18は金・土なので

586 ：１３２人目の素数さん：2005/05/19(木) 04:39:45

普通にトレンド出せば良いのでは？

587 ：１３２人目の素数さん：2005/05/19(木) 07:53:19

最小２乗法の変わりにロジスティック回帰分析をつかう時はどんな時か知りたいのです。
どんなデータの時にロジスティック回帰分析を使い、どんな時に最小ニ乗法を使うんでしょう？

588 ：１３２人目の素数さん：2005/05/19(木) 11:38:37

わからない統計の問題があるので、教えてください。

3つの独立変数があり、
回帰分析の結果すべてのb-weightに有意差があることがわかりました。
この場合、階層的重回帰分析を使うこともできるけど、する必要がないのはなぜか？
という問題なのですが、まったくわかりません。

わかる方がいたら、教えてください・・・・。

589 ：１３２人目の素数さん：2005/05/19(木) 15:21:32

>587

りんごとみかんを比べとる。

ロジスティック回帰→モデルの種類
最小二乗法→モデルのパラメーターの推定方法

590 ：１３２人目の素数さん：2005/05/21(土) 17:08:56

正規分布　X～N(m,σ^2)
とし、
(X-m)/σ = Z
とおくと
標準正規分布　Z～N(0,1)
となることを証明せよ

これってどうやればいいんですかね？
僕が思うに、ZとXが逆のような気がするのですが……

591 ：１３２人目の素数さん：2005/05/21(土) 17:35:34

>>590

標準化とかそんな用語で説明書いてあるんじゃない？

ちゃんとあっている式です。

確率密度関数で計算するとか、特性関数で計算するとか、
証明法は沢山あります。
使っている教科書、今までの講義内容見れば分かると思うけど…

592 ：590：2005/05/21(土) 18:35:41

>>591
「標準化」でこれ書かれているわけですが、授業でこの部分を省略したんですよ。
んで、証明してこいと……

X=1/(√(2π)σ)exp[-{(x-m)^2}/{2σ^2}]
Z=1/{√(2π)}exp(-x^2/2)
としてもなりませんよね……

593 ：１３２人目の素数さん：2005/05/21(土) 19:03:35

>>592
Xの従う分布の密度関数が
f(x)=1/(√(2π)σ)exp[-{(x-m)^2}/{2σ^2}]
だから、確率変数
(X-m)/σ = Z
の従う密度関数は
f(σZ+m)*σ
という話があったんじゃないかな？

微積の教科書なら変数変換で、統計の本ならちゃんと
書いてあるはず。

mでなく、μですね。

594 ：１３２人目の素数さん：2005/05/21(土) 20:10:02

誤差項のない因子分析のモデルは
主成分分析のモデルに逆行列をかけたものと同じようにみえるのですが
そういう理解でいいのでしょうか。

595 ：590：2005/05/21(土) 21:04:44

>>593
つまりXの密度関数f(x)を
f(σz+m)*σ
としたらZの密度関数
g(z)=1/{√(2π)}exp(-x^2/2)
が出るというわけですね

596 ：590：2005/05/21(土) 21:15:46

あぁ、分かりました
何か変なことばかり訊ねてすみませんでした
答えてくれた方、どうもありがとうございます
スレ汚しスマソ

597 ：１３２人目の素数さん：2005/05/21(土) 22:30:53

>>590
さすがに頭悪すぎ。分布関数と密度関数の違いが全く理解できてない。

598 ：１３２人目の素数さん：2005/05/22(日) 21:45:58

再質問です。
十分統計量の直感的イメージを教えてください。
教科書などの例を見ても、どうもしっくり来ません。

599 ：１３２人目の素数さん：2005/05/23(月) 00:02:04

>>598
1が出る確率p
2が出る確率2p
3が出る確率1-3p
という分布があったとしよう。この分布はpの値に関わらず2が出る確率は常に1の2倍だから、3pと1-3pの確率でまず「1 or 2」か「3」かを決めて、前者なら確率1/3で1、確率2/3で2を出す、ってことと一緒。
だから、pについての情報としては「1 or 2」か「3」のどちらが出たか、さえ分かれば十分。後はpと関係ない確率で事象が生じる。

次によく出てくる標本の例。
たとえば、確率pで1、1-pで0、っていう母集団から(X_1,X_2)っていう大きさ2の標本を取った場合、(X_1,X_2)の分布は、
(0,0)である確率は(1-p)^2
(0,1)である確率はp(1-p)
(1,0)である確率はp(1-p)
(1,1)である確率はp^2
で、(0,1)と(0,1)は確率はpに関して同じ形。だから、(0,0)、(0,1)と(1,0)、(1,1)の3通りのどれが生じたか、さえ分かればことpに関しての情報は漏れなく取れることになる。
統計量の言葉で言えば、統計量T(X_1,X_2)がpの十分統計量であるためには、関数T(・,・)が、(0,0)、(0,1)と(1,0)、(1,1)の3通りで違う値を取ればいいことになる。
例えばT(X_1,X_2)=X_1+X_2は十分、T(X_1,X_2)=(X_1)*(X_2)は十分じゃないわけだね。

結局、(X_1,…X_n)が、まず統計量T(X_1,…X_n)の値を先に決めて、そこから母数θに関係ない分布で(X_1,…X_n)を決める、というプロセスに分解できればT(X_1,…X_n)はθの十分統計量ということになる。
(X_1,…X_n)の実現値そのものすべてを知らなくても、ことθの推定に関しては十分統計量T(X_1,…X_n)の実現値を知れば十分なわけだね。

600 ：１３２人目の素数さん：2005/05/23(月) 16:27:22

とある人から、「これからはベイズの時代だ」と聞いたことがあります。
どういう根拠で、これからはベイズの時代なのでしょうか。

601 ：１３２人目の素数さん：2005/05/23(月) 22:07:19

ただ単にそう言いたかっただけちゃうんかと。

602 ：１３２人目の素数さん：2005/05/24(火) 09:11:20

>>600
意外と使えるということだろうね。
何を対象にしているかにもよる。

603 ：１３２人目の素数さん：2005/05/24(火) 09:27:09

>>600
計算機のソフトを利用して、事前分布の候補を沢山設定できる
ようになり、もっともらしく結果が書けるようになったから

604 ：598：2005/05/25(水) 00:49:23

>>599

ありがとうございます。
よく分かりました。

605 ：１３２人目の素数さん：2005/05/25(水) 06:05:59

最小十分統計量ってどうやって求めるのでしょうか。

606 ：１３２人目の素数さん：2005/05/25(水) 06:59:06

一致推定量の分散が、有効推定量の分散より
小さくなる場合はあるのでしょうか。

607 ：１３２人目の素数さん：2005/05/25(水) 22:23:01

２変量の相関係数を分割したデータセットから求めることってできますか？
つまり
（112.5, 88.4）
（-5.3, 600.5）....
みたいなデータが１０万組ぐらいあったとして、その全てを一度に扱えるなら
相関係数は普通に計算できるのですが、それではメモリが足りません。
そこで最初の１万組から何らかの統計量を計算しておいて、また別の１万組で
計算して・・・というのを繰り返し、最後にそれらを合わせることで
１０万組のデータについての相関係数を求める、ということをしたいの
です。

そういうことってできるのでしょうか？　また出来るとすれば
どんな統計量を保存しておけばいいでしょう？

608 ：１３２人目の素数さん：2005/05/26(木) 02:17:44

>>606
ない。

609 ：１３２人目の素数さん：2005/05/26(木) 04:48:53

>>606
L.LeCam (1953)?

610 ：１３２人目の素数さん：2005/05/26(木) 13:31:39

LL confidensial

611 ：606：2005/05/26(木) 19:55:06

>>608

クラーメルラオの不等式は、不偏推定量で、かつ分散最小の時に、
等号が成立するという意味ですが、不偏推定量でなければ
有効推定量の分散より小さくなる場合があるのかということが質問の意味です。
質問は、一致推定量に限っているわけでないです。

>>609
その論文に書いてあるということでしょうか？

612 ：１３２人目の素数さん：2005/05/26(木) 22:32:46

相関がある対数正規乱数ってどうやって生成できます？

613 ：１３２人目の素数さん：2005/05/27(金) 02:36:11

>>611
不偏でなければ当然分散は有効推定量より小さくなりえるよ。っていうか推定量を定数にすりゃ分散はゼロだし。

そういう特殊なものはおいといて、推定量に関して
MSE（平均二乗誤差）＝分散＋bias^2
っていう関係があるけど、不偏推定量(bias=0）の場合、分散にクラメール・ラオの下限があるからMSEにも下限がある。
でも、不偏じゃない（bias≠0）の場合は分散に下限が無いから、MSEが不偏推定量のそれより小さくなることがありえる。

614 ：１３２人目の素数さん：2005/05/30(月) 20:40:57

導出法なんですが・・・・
キュムラントのための積率母関数を求める際に、

E[e^{θλ}]=・・・・* ∫_{0}^{∞} exp{zθ/z - nθ/z logz}g(z)dz *・・・・
g(z)=カイ二乗分布のpdf

の真ん中の部分をとくと

=2^{-nθ/2} (1-θ)^{(-(1-θ)n-1)/2} *（ (Γ((1-θ)n-1)/2）/Γ((n-1)/2) )

となるはずなんですが、過程がわかりません。
ガンマ関数の使いどころがわからず解けずにいます。
どうか教えてください。

615 ：１３２人目の素数さん：2005/05/30(月) 22:44:33

この問題がどうしても解けません・・・。
どなたか教えて下さい。

受験者１万人の模擬試験を行った。
この模擬試験の得点の分布が平均５５点、標準偏差１２点の正規分布に従っていると仮定した場合、
順位５０位の人の偏差値はどれくらいになるか小数第１位まで求めよ。
また、採点が１点単位で行われているとしたとき、上位５０位以内の順位に入るには何点以上の得点が必要か求めよ。

616 ：１３２人目の素数さん：2005/05/31(火) 00:06:50

>>615
偏差値=((得点-平均)*10/標準偏差)+50
と、
(得点-平均)/標準偏差　が標準正規分布に従うこと
が分かってりゃ解けるだろ。

>>614
それだけじゃ何やってるか意味不明。
…の部分が分からないし、そもそもλがカイ2乗分布に従うのか？
質問するならもっとしっかり式や仮定を書けよ。

617 ：１３２人目の素数さん：2005/05/31(火) 08:09:50

適合度の検定でOiを観測度数、Eiを期待度数として
Σ((Oi-fi)/fi)^2という統計量を考えますが、
この値がχ2乗分布に従うことの証明が乗っているＷＥＢや本はないでしょうか？

618 ：617：2005/05/31(火) 08:50:15

誤：Σ((Oi-fi)/fi)^2
正：Σ(Oi-fi)^2/fi
2項分布で計算してみたらこの値が((x-μ)/σ)^2
μ,σは2項分布の平均、分散になっていました。
2項分布が正規分布で近似できるなら確かにχ2乗分布になりますが
そういうことなのでしょうか？

619 ：１３２人目の素数さん：2005/05/31(火) 09:19:47

>>618
Pearson Chi square testとかでググれば出てくると思う。

手元にある
栗栖忠、濱田年男、稲垣宣生
統計学の基礎
裳華房
のpp.149--150に書いてある。
絶版になっている
柳川堯
離散多変量データの解析
共立出版
なんか見るとこの辺り詳しく書いてあると思う。
すいません。証明は無かった。

620 ：１３２人目の素数さん：2005/05/31(火) 17:55:01

残差平方和と回帰平方和をたしても全平方和にならないんですが、計算ミスですか？

621 ：１３２人目の素数さん：2005/05/31(火) 20:06:35

>>620 定数項のない回帰モデルだと、一致しません。

622 ：１３２人目の素数さん：2005/05/31(火) 21:17:56

>>621
定数項ってなんですか？

623 ：１３２人目の素数さん：2005/05/31(火) 22:26:39

計算機統計学って分野を研究したいんだけど
あんまり大学院で研究してる先生いない
みたいなんだけどいい大学院ってしらない？

624 ：１３２人目の素数さん：2005/06/01(水) 00:04:14

たこやき大学，ポプラ大学，桃太郎大学あたりが計算機統計学会の
主要大学だと思うが，いい大学院は知らない．

625 ：１３２人目の素数さん：2005/06/01(水) 00:43:45

誠大学がいいと思うよ。

626 ：１３２人目の素数さん：2005/06/01(水) 02:31:07

>>622 切片のことです。

627 ：１３２人目の素数さん：2005/06/01(水) 02:47:39

完備統計量の直感的意味が良くわかりません。
教科書などの例を見ても、どうもしっくり来ません。
どなたかご教授お願いいたします。

628 ：１３２人目の素数さん：2005/06/01(水) 03:55:13

性器分布って何ですか？

629 ：615：2005/06/01(水) 11:41:55

>>616
どうもありがとうございました。

630 ：１３２人目の素数さん：2005/06/02(木) 11:16:29

統数研に計算機統計グループってのができましたね。

院はあったはず（ドクターだけだったかも）

631 ：１３２人目の素数さん：2005/06/02(木) 13:44:32

>>627
Tが完備統計量なら、Tの関数の形をした統計量で平均が同じものは本質的に1つしかない、ということ。

632 ：オスエテ：2005/06/02(木) 18:08:56

AsB(２要因混合計画）の分散分析をしました。
A→２水準、Ｂ→２水準
すると、Aに主効果（p<0.00001),Bに主効果（p<0.00001),　ABの交互作用（p<0.0001)が有意でした。
しかし、交互作用に関する下位検定をしたところ、
B1におけるAの効果が有意（p<0.00001),
B2におけるAの効果が有意（p<0.00001),
A1におけるBの効果が有意（p<0.00001),
A2におけるBの効果が有意（p<0.05)
と全てが有意になりましたwww
おそらく、A1におけるBの効果（p<0.00001)と、A2におけるBの効果（p<0.05)の違いが、交互作用をもたらしたのだと思うのですがこれを交互作用と呼んでもよいのでしょうか？？？
統計的には普通（p<0.00001)と（p<0.05)を異なるとは言うことはできないわけですよね？？？
下位検定でどこかの部分だけが有意でない、もしくは逆方向に差がでていればわかりやすいのですが。。。。
専門家の方、教えてくりとりす！！！

633 ：１３２人目の素数さん：2005/06/02(木) 18:09:25

>>632
まるちのかほりがする

634 ：１３２人目の素数さん：2005/06/02(木) 18:18:33

みんな、ここでも議論しようよ。
http://bbs.enjoykorea.naver.co.jp/jaction/list.php?id=enjoyjapan_16

635 ：１３２人目の素数さん：2005/06/02(木) 20:27:05

突然すみません。数学に詳しい方教えて下さい。
問題：任意に抽出した３５人のうち３人が同じ誕生日（年は
考慮しないで月と日のみが同じ場合）である確率は何％？
１年は３６５日で計算します。
というものです。よろしくお願いします。

636 ：GreatFixer ◆ASWqyCy.nQ ：2005/06/02(木) 20:34:01

[>>635]の問題はこっちでやってくれ。
http://science3.2ch.net/test/read.cgi/math/1115597455/22-n

637 ：１３２人目の素数さん：2005/06/03(金) 09:59:14

今日から統計の勉強を個人的に始めたのですが、なぜ幾何平均は
増加率の平均を求めるのに適しているのでしょうか?

例えば、GDP成長率として01年2%　02年8%とした場合、
普通に平均を求めて、5％とせずに、4%とするってところがわからないです。
教科書には、さらっと計算式しか載っていないんで、理由がわかるかた
いらっしゃいましたらよろしくお願いします。

638 ：１３２人目の素数さん：2005/06/03(金) 12:14:19

GDP成長率aの定義は？
今年度GDP=(1+a)*前年度GDP?

639 ：１３２人目の素数さん：2005/06/03(金) 13:38:11

>>637
増加率は複利計算になっているから。
GDP[01]=(1+0.02)*GDP[00]
GDP[02]=(1+0.08)*GDP[01]=(1+0.08)*(1+0.02)*GDP[00]
00年から02年までの間にGDPは(1+0.08)*(1+0.02)倍になった。
だから平均増加率は{(1+0.08)*(1+0.02)}^(1/2)-1。

640 ：オスエテ：2005/06/03(金) 20:11:47

ありゃ、オレ様の>>632の質問に答えてくれる賢人はおらんのか？
統計スレの住人のレベルも大したことないのう。。。。。。
ガッカリじゃ。。。。。。

641 ：１３２人目の素数さん：2005/06/03(金) 21:07:31

>>640
専門家、がいないだけだろｗ
A2におけるBの効果が高度に有意、ってことで何か問題あるのか？

642 ：オスエテ：2005/06/03(金) 22:26:21

>A2におけるBの効果が高度に有意、ってことで何か問題あるのか？

有意水準を設定した場合、二つのうち片方がそれ以下で片方がそれ以上
の場合、両者の効果に違いがあると言ってよい。しかし、両方とも有意
な場合、もしくは両者とも有意でない場合は、帰無仮説棄却の原則から
考えると、P値が違っていても二つの効果が異なるとは言えないはず
じゃないの？　

ただ、こういう特殊な場合には、基本原則の例外ということで両者に違
いがあると言っちゃってもいいのかな？　統計の本読んでもこういう例
は載ってないのでちょっぴり困ってるボクちゃん。

この質問に確信をもってこたえてくれる賢者はおらんのかのう？

643 ：１３２人目の素数さん：2005/06/04(土) 00:11:47

全国の小学生854人についてのある調査によると、2004年の正月にもらった
お年玉の平均額は24668円で、前年の平均23777円よりも891円多かった。
ただし、標準偏差(n-1で割ったもの)は17610円とかなり大きかった。
仮に、このデータが全国の小学生からの無作為抽出だとして、果たして本当に
母集団で平均額が上がったのかどうかを検定してみたい。
前年の詳しいデータが無いので便宜上、前年のケース数と標準偏差とは2004年と同一だと仮定する。
帰無仮説を「母集団において２つの年のお年玉の平均額は等しい」とするとき
検定結果はどうなるか？という問題。

設問からなんとなく片側検定でいいような気がするんですがどうでしょうか？
この場合、帰無仮説は棄却されるんですか、それともされないんですか？
tを求めることができないのでどなたかご教授願います。

644 ：１３２人目の素数さん：2005/06/04(土) 01:10:44

>>642
>有意水準を設定した場合、二つのうち片方がそれ以下で片方がそれ以上
の場合、両者の効果に違いがあると言ってよい。しかし、両方とも有意
な場合、もしくは両者とも有意でない場合は、帰無仮説棄却の原則から
考えると、P値が違っていても二つの効果が異なるとは言えないはず
じゃないの？　

俺もそう思う。

逆に一言聞きたいんだが、下位検定に関しては多重性を考慮しなくていいのか？
下位検定については詳しく知らないので、ちょっと聞いてみた。
出来れば下位検定について簡単に教えてくれ。

645 ：１３２人目の素数さん：2005/06/04(土) 01:27:20

このスレは隠れマルコフモデルとかの話も可ですか？

646 ：オスエテ：2005/06/04(土) 17:32:17

>>644
オレもあまり詳しくないのだが、
なお、交互作用が有意だった時の下位検定である単純主効果検定は、多
重性とは関係ないんじゃないかな。交互作用が有意だったときには、オ
レの例（>>632）でいうと
B1におけるAの効果＆ B2におけるAの効果、A1におけるBの効果＆A2
におけるBの効果があったかどうか、それぞれについて全体の誤差項を
分母にF値を算出する。そして、B1におけるAの効果はあったけどB2に
おけるAの効果はなかったなとかかんとか、それぞれの効果の違いにつ
いて考察する。
ただ、今回は交互作用が有意なのに、全ての単純主効果が有意だったの
でどう解釈してよいのか困っているわけ。

一方、主効果が有意だった場合に行う下位検定の多重比較については、
多重性について考慮に入れているのがほとんどのはず。
TukeyのHSD法なども、あらかじめその要因に含まれる水準数を考慮
に入れた臨界値を算出し、水準A1と水準A2の差が、その臨界値を上回
る場合は有意、下回る場合は有意でないと考える。また、ライアン法
も、ステップ数という概念を用い、多重性について考慮に入れている。

647 ：おみゃ：2005/06/04(土) 17:42:25

情報系の大学生です。
データ、(X1,Y1),(X2,Y2), ... ,(Xn,Yn)
標本相関関数が -1 <= rxy <= 1 となるのを
シュワルツの不等式の関係をつかってときたいのですが、
すっきりいきません。

また、Yi = a*Xj + b (a not = 0)のとき、
lrxyl = 1 を証明したいのですが、代入後の式がごちゃごちゃして
よくわかりません。
どなたか助けてくださいませんか?

648 ：648：2005/06/04(土) 17:55:38

√64 = 8

649 ：おみゃ：2005/06/04(土) 19:06:20

>>647
一応解決しました。-1 <= rxy <= 1 の方は
きちんと立式できませんでしたが

650 ：１３２人目の素数さん：2005/06/04(土) 19:47:05

>>643をお願いします。

651 ：１３２人目の素数さん：2005/06/04(土) 20:53:45

>>650
何がわからんの？

652 ：１３２人目の素数さん：2005/06/05(日) 00:19:19

カイ二乗検定をやるようなデータで、
サンプル数とデータ数、そしてp値がわかっているとき、
そのデータの検出力を算出する方法を教えて下さい。
具体的な数字を出してくれると嬉しいです。
お願いします

653 ：１３２人目の素数さん：2005/06/05(日) 17:32:57

>>649
ベタな証明じゃないですけど。
yi, xi をそれぞれ Xi, Yi の平均からの偏差とします。
t に関する２次式 Σ(yi-t*xi)^2 が非負となるように
判別式の符号を決めてやります。
これで -1 <= rxy <= 1 が導出できます。

654 ：643：2005/06/05(日) 23:15:54

>>651
tの値。
自分で計算したら1.479になった。
危険度5%の片側検定で帰無仮説を棄却………できるの？
教えてニダ。

655 ：１３２人目の素数さん：2005/06/06(月) 00:43:27

[人] 1 2 3 4 5 6 7 8 9 10
____________________________________
[Ａ] 77 68 67 72 60 54 51 53 44 41
[Ｂ] 58 68 79 70 64 65 49 69 60 58

↑10人の[Ａ][Ｂ]の平均値、標準偏差、共分散、相関関係を求めたい。
もちろん平均は[Ａ]=58.7 [Ｂ]=64 と計算できたし、
教科書見ながらだから標準偏差^2=分散や他の公式とか分かるんだが
イザ問題となるとなぜか使いこなせない。
誰か手取り足取り教えて栗。　orz

656 ：１３２人目の素数さん：2005/06/06(月) 06:01:14

>>631
「Tが完備統計量なら、Tの関数の形をした統計量で平均が同じものは本質的に1つしかない、ということ。」
とありますが、完備統計量の定義式をどう解釈すれば、そう解釈できるのでしょうか。

657 ：１３２人目の素数さん：2005/06/06(月) 19:27:33

>>656
では、まず完備統計量の定義を書いてみて。

658 ：１３２人目の素数さん：2005/06/07(火) 19:13:50

>>657

Xを十分統計量としたとき、E{u(X)}=0を満たすのは
確率が0になる集合を除いて恒等的にu(X)=0のとき

659 ：１３２人目の素数さん：2005/06/07(火) 19:44:02

>>658
それから、Xの関数f(X),g(X)について、
E[f(X)]=E[g(X)]　⇒　f(X)=g(X) a.e.
を証明してみな。

660 ：１３２人目の素数さん：2005/06/08(水) 01:03:10

突然失礼します（＞＿＜）

クラスター分析で非階層的手法（k-means法など）
の基礎の基礎を勉強したいのですが、
オススメの書籍ありませんか？？
初心者なので、解りやすく薄い本がいいのですが・・・。

661 ：１３２人目の素数さん：2005/06/08(水) 01:52:53

>>660
クラスター分析って階層的か非階層的かに関係なく大して理論的な背景がないから
どのパターン認識の教科書でもたいてい最後の方にちょこちょこっと解説が出てるだけだよ。
発表されてる論文の多くも、ほとんどがアドホックなヒューリスティックな話ばかりで
深みのあるような内容はまるでないし。

662 ：660：2005/06/08(水) 03:04:23

>>661
ご返事ありがとうございます。
やはり、そうでしたかー。
学部学生でspss、クレメンタインを使って解析しているのですが、
教科書的なものが意外と少なくて困っていました。
けど、少ないのはクラスター分析の内容自体みたいですね（安心）。
勉強になります！！

663 ：１３２人目の素数さん：2005/06/08(水) 15:54:57

「X_1,X_2,・・・・X_nを
f_X(x;θ)=exp{-(x-θ)} θ≦x＜∞　からの確率変数とする。
パラメ-タθの事前分布をg(θ) =exp(-θ) 0≦θ＜∞とした時、
θの事後分布を求めよ。」という問題があるのですが、
これって求めることが可能ですか？

664 ：１３２人目の素数さん：2005/06/08(水) 16:36:19

可能です。

665 ：１３２人目の素数さん：2005/06/08(水) 17:49:11

>>664
事後分布の分母が求められないのですが。
ちなみにいくらですか？

666 ：１３２人目の素数さん：2005/06/08(水) 19:01:59

>>664
すみません。求められました。
失礼しました。

667 ：１３２人目の素数さん：2005/06/09(木) 00:56:40

検出力を算出する方法が書いてあるサイトや本があったら教えて下さい。

668 ：１３２人目の素数さん：2005/06/10(金) 22:45:01

>>667
統計学　ttp://aoki2.si.gunma-u.ac.jp/

669 ：１３２人目の素数さん：2005/06/10(金) 23:22:16

調べてみたんですが、分からないのでおすえて。すごい初歩的なんだろうけど。。。

データに対応がある場合のt検定と対応がない場合のt検定というのがよく
解説されていますが、対応するデータどうしの差の平均は、結局は
対応を考えない場合の各条件の平均の差と同じになりますよね？
対応がある場合のt検定というのをあえて選ぶ理由がわからないんですが、
エラーに強いとか何か利点があるんでしょうか？
結果が一緒？な割には必ず統計ソフトでもpairedのオプションがありますし。

参考にしているのは（ウェブ以外は）：
「ユーザーのための　教育・心理統計と実験計画法」
（田中・山際著　教育出版）
です。

670 ：１３２人目の素数さん：2005/06/11(土) 17:18:35

671 ：１３２人目の素数さん：2005/06/11(土) 17:42:31

なるほどデータforきっず
ttp://www.stat.go.jp/kids/

ハンバーガー統計学にようこそ！
ハンバーガーショップで学ぶ楽しい統計学 ──平均から分散分析まで──
ttp://kogolab.jp/elearn/hamburger/

アイスクリーム統計学にようこそ！
ttp://kogolab.jp/elearn/icecream/index.html

放課後の数学入門統計学
ttp://www.kwansei.ac.jp/hs/z90010/sugakuc/toukei/toukeihy.htm

ビジネス統計入門
ttp://www.mbanavi.com/school/stat00.htm

統計学講義＜目　次＞
ttp://www2.tba.t-com.ne.jp/morisaki/stat1.htm

統計学
ttp://aoki2.si.gunma-u.ac.jp/Mokuji/index2.html#part2　

WWWで統計を学習しよう
ttp://www.ec.kagawa-u.ac.jp/~hori/statedu.htm

統計学自習ノート
ttp://aoki2.si.gunma-u.ac.jp/lecture/index.html

統計ソフト・統計学習用データ
ttp://www.ec.kagawa-u.ac.jp/~hori/stat.html

672 ：１３２人目の素数さん：2005/06/11(土) 17:44:37

総務省統計局 - How to 統計 - 高校生用学習サイト。統計調査の行い方、データの集計と分析、統計データの使い方事例集。
ttp://www.stat.go.jp/howto/

An introduction to Statistics for psychologists and educators
心理・教育のための統計の初歩
ttp://grace.ceser.hyogo-u.ac.jp/sta/index.html

心理統計における注意点，その他階層線形モデルなどの手法について
ttp://www4.ocn.ne.jp/~murakou/statistics.htm

交互作用が出たとき
ttp://www.juen.ac.jp/psych/nakayama/anova.html

673 ：１３２人目の素数さん：2005/06/11(土) 18:00:56

過去のデータが未来に影響しているから統計が成り立つけど、
株式市場なんかデルタ関数の世界だからデリベテイブもあてにはならない。

674 ：１３２人目の素数さん：2005/06/12(日) 13:38:51

>>673 効率市場仮説が成立しない現実では、そうともいいきれない。

675 ：１３２人目の素数さん：2005/06/12(日) 18:21:58

歪度のところで質問なんですが
E{(X-μ)^3}=E(X^3)-3μE(X^2)+2μ^3
をどう示せばいいか教えてください。
よろしくお願いします。

676 ：１３２人目の素数さん：2005/06/12(日) 19:54:30

>>668
Excelの表示計算値は、信用ならないらしい。
Excelは，コンピュータ・ソフトウェアの三種の神器のように
なっていますが，とんでもないこともあるというお話
ttp://aoki2.si.gunma-u.ac.jp/Hanasi/excel/index.html

677 ：１３２人目の素数さん：2005/06/12(日) 21:42:42

>>676
>Excelは，コンピュータ・ソフトウェアの三種の神器のようになっていますが
マイクロソフトの製品にろくなものはない。
OutlookとかPowerPointとか使用禁止という会社もけっこうある。

678 ：１３２人目の素数さん：2005/06/13(月) 10:53:52

ポアソン分布の歪度ってどう求めれば良いのでしょうか？
教えて下さい。

679 ：１３２人目の素数さん：2005/06/13(月) 11:23:06

>>678
E[X(X-1)(X-2)]を求めて、後は代入。

680 ：１３２人目の素数さん：2005/06/14(火) 15:41:02

全くの初心者なんですが、統計学の良い入門書を教えてください。
ある２つの母集団における割合を比較して、有意差があるかという
（皆さんにとっては簡単な）作業を決められた締め切りまでに仕上げないといけないのです。
過去ログを読め、と言われそうですがその時間も惜しい状況なので、
お勧めがあったら教えてください。

statview ver5.0 for windowsは手に入れました。
大学教養部程度の数学はうろ覚えで、怪しいです。

681 ：１３２人目の素数さん：2005/06/14(火) 16:50:28

>>680
http://aoki2.si.gunma-u.ac.jp/lecture/Hiritu/McNemar-test.html
で良いんじゃない？

SAS JMPというソフトにはMcNemarの検定が入っていなかった。

682 ：１３２人目の素数さん：2005/06/14(火) 23:31:41

統計って任意抽出ではなく無作為抽出からが基本だよね？
商品でよくアンケート葉書があって、業者はアンケート葉書集計して統計的に傾向をみてかなり重要視するとききます。
でもこれって客が任意に投稿したものだから、統計学的に信用できないと思うのだが
なんで重要視にするんだ？

683 ：１３２人目の素数さん：2005/06/15(水) 09:23:13

>>682
それ以外に利用できるものがないから。
電話かけても良いけど、固定電話持っている人が減っているし、
電話だと本音が聞けない。
Netでアンケートしたら、祭りとか言われたら、グチャグチャになって
しまう。

684 ：１３２人目の素数さん：2005/06/15(水) 18:28:24

χ二乗検定みたいなことをしたいんですけど、
y=f(x)という理論曲線にどれだけ近いかという検定をするとき、
使用するデータでy_iにはΔy_iの誤差が、
x_iにはΔx_iの誤差があるとします。
通常のχ二乗検定だとΔy_iしか使用しませんが、
Δx_iも含めて検定したい場合にはどうするんでしょうか。

685 ：１３２人目の素数さん：2005/06/17(金) 12:46:23

ある生データがあって、これがカイ2乗分布に従っているかを確かめたいのですが、
どのようにすれば可能でしょうか？
SPSS等のソフトを使う必要があるのでしょうか？

686 ：１３２人目の素数さん：2005/06/17(金) 20:12:29

>>685
Rを使えば、
http://aoki2.si.gunma-u.ac.jp/lecture/GoodnessOfFitness/nominalscale.html
とか
1標本コルモゴルフ-スミルノフ検定
ks.test(x, y, ..., alternative = c("two.sided", "less", "greater"), exact = NULL)
でしょうか。

ks.testはカイ二乗分布に対応していないみたい…
データがカイ二乗に従うのはどんな場合でしょうか？
あまり聞いたことがありません。
差し支えなければ、教えてください。

687 ：１３２人目の素数さん：2005/06/18(土) 16:49:38

３年分の年次のデータ（閏年調整済み）があります。
この時Arimaモデルで、
arima(0,365,0)モデルで２年先を予測する時、
この予測値は過去３年の同月同日の平均値を採用しているといった感じでしょうか？
アドバイスよろしくお願いします。

688 ：１３２人目の素数さん：2005/06/19(日) 09:59:15

687です。年次のデータではなく日次のデータでした。

689 ：分からない：2005/06/19(日) 22:00:41

ガンマ関数の特性関数の求め方を途中の式も含めて誰か教えてくださ～い（＞＜）

690 ：１３２人目の素数さん：2005/06/20(月) 08:23:04

古いログに、以下のよううな書き込みを見つけたのですが、
「パワースペクトルとＦＦＴを使ってます．」とは
具体的にはどういう方法なのでしょうか？
サイトや論文（日本語or英語）でも結構ですので、教えてください。

7 ：名無しさん＠１周年：2001/07/31(火) 12:22
共分散行列をコレスキー分解して，下三角行列に
一様乱数ベクトルを掛ければ任意の相関性を持つ
乱数が作れます．
ただこの方法は行列のサイズがでかくなると
ちょっと厳しいんじゃないかな？
んで，自分はパワースペクトルとＦＦＴを使ってます．

8 ：名無しさん＠１周年：2001/08/01(水) 12:37
>>7
一様乱数じゃなくて標準正規乱数だよ

9 ：7：2001/08/02(木) 12:23
>>8
その通りです。
烏都陀刺脳。

691 ：素人：2005/06/20(月) 23:36:06

あまり統計学に詳しくないのですが、Joint regressionというのはどの様なものなのか御教授願えませんでしょうか？

692 ：１３２人目の素数さん：2005/06/23(木) 23:49:11

Unique Medianとはどういう意味ですか？
Uniqueじゃないメディアンってあるのでしょうか？

693 ：１３２人目の素数さん：2005/06/24(金) 06:59:52

>>692

データ数が偶数の時のmedianの決め方に
関連しているんじゃないのかな？

694 ：ど素人：2005/06/24(金) 14:13:05

normdist,norminv,normsdist,normsinv,lognormdist
これらを使わずにEXCELで正規分布表と
標準正規分布の密度関数・累積分布関数のグラフの作成の仕方を教えてください。

695 ：１３２人目の素数さん：2005/06/24(金) 16:00:09

>>694
宿題の臭いがぷんぷんするな

696 ：１３２人目の素数さん：2005/06/24(金) 16:18:06

>>694
テキスト巻末の正規分布表をひたすら打ち込め。

697 ：１３２人目の素数さん：2005/06/24(金) 20:42:36

>>694
excel自体の計算が計算誤差含んでいるのに
他の公式を使って計算させようなんて、ひどい
宿題です。

http://aoki2.si.gunma-u.ac.jp/Hanasi/excel/
を印刷して、Rという統計ソフトを使って、宿題
提出したら、先生の顔、丸つぶれ？

698 ：１３２人目の素数さん：2005/06/24(金) 22:15:02

>>694
ここはお前のような奴が来るところではない。

699 ：１３２人目の素数さん：2005/06/24(金) 23:45:00

>>693
偶数の場合でも、
(Sample)MedianはUniqueじゃないですか？

700 ：１３２人目の素数さん：2005/06/25(土) 04:35:41

>>692
medianの定義によるよ。分布のmedianは
F(m-)≦1/2、F(m)≧1/2
を満たすmとして定義（50パーセンタイルの定義だね）するが、これは必ずしもユニークにはならない。

標本medianは当然点推定量にしたいわけだから、標本が偶数個だろうが奇数個だろうが>>699のいうように一つに決めるのが普通。

701 ：ど素人：2005/06/25(土) 23:04:17

もちろん宿題ですよ。
宿題以外でこんなこと考えないでしょ。
それでもいいて人の協力お願いします。

702 ：１３２人目の素数さん：2005/06/25(土) 23:39:48

ﾎﾟｶｰﾝ

703 ：１３２人目の素数さん：2005/06/26(日) 18:12:37

標本分散の分散が良く分かりません。
なんで(1/n)(μ4-((n-4)/(n-2))σ^2) なんて妙な形になるんでしょうか？

704 ：703：2005/06/26(日) 18:40:07

すみません　別すれで聞くことにします。

705 ：１３２人目の素数さん：2005/06/27(月) 23:53:54

>>700
例えばどういう場合ですか？

706 ：MCMC：2005/06/28(火) 03:25:14

Sample Median はその定義により常にunique (奇数なら中間値、偶数なら２つの中間値の平均）。

連続分布では、Median は常にunique。これは、仮定法で証明できます。
Medianがuniqueではないと仮定する（aと bがMedian）。
しかし、連続分布の場合、P（a< X <b）> 0 なので、Medianの定義と矛盾します。

離散分布の場合、Median は必ずしもuniqueではありません。例えば、
P（X＝１）＝.5
P（X＝５０)＝.5
の離散分布では、１から５０までの実数が全てMedianになります。

707 ：１３２人目の素数さん：2005/06/28(火) 03:45:18

>>706
質問！

１．仮定法で証明
これは数学の教科書にないです。定義を教えてください。

２．例えば、
F(x)=0, (x<0), =x, (x<=1/3), =1/3, (1/3<x<=2/3), =2x-1, (2/3<x<=1), =1, (x>1)
は連続分布か離散分布のいずれになるのでしょうか？

708 ：MCMC：2005/06/28(火) 05:11:20

>>707
１. ゴメン、これはとんだ間違い。本当は背理法です。仮定法は英語の教科書にしょか載ってませんね、すいません。

２. これは、連続です。　離散分布の確率分布F（x）は階段のような非連続のグラフになります。離散の場合、Point of discontinuity (跳躍点）にProbability Mass (確率)があります。
連続分布の定義は、確率分布F（x）が連続であることですので、どの実数aをとってもP（X＝a)＝０が成り立てば連続分布ということになります。
この例では、確率密度関数が、f（x）＝０（x＜０、１／３＜x＜＝２／３）、１（０＜＝x＜＝１／３）、２（２／３＜x＜＝１）ですので、一様分布に似た密度関数になります。
一般的に、確率点（x）がcountable(finite or infinite) であれば離散、 uncountable　（bounded or unbounded interval) であれば連続になります。

　

709 ：１３２人目の素数さん：2005/06/28(火) 05:33:14

>>MCMC
mixtureという概念は無いのですか？

710 ：MCMC：2005/06/28(火) 06:13:58

＞＞７０９
あります。例えば、F（x）＝０（x＜０）、x（x＜＝１／３）、１／３（１／３＜x＜１／２）、２／３（１／２＜＝x＜２／３）、x（２／３＜＝x＜＝１）。
この確率分布だと、P（X＝１／２）＝１／３なので、F（x）に pointo of discontinuity (at x=1/2) が有るので、連続と離散のmixtureになります。

711 ：31：2005/06/28(火) 09:16:44

>>MCMC

706では2つの場合分けしかしていなく、これで充分ですか？
mixtureとかあるわけだし、一般的に証明したら？
または凡例出したら？

712 ：１３２人目の素数さん：2005/06/30(木) 00:33:05

１．２つの量的変数間の関連をみるには、普通、積率相関係数や回帰分析が用いられる。
　　この場合、積率相関係数は、回帰方程式における標準化された回帰係数に等しい。

２．名義尺度同士の関連をみるのに、しばしばクロス表分析が用いられる。しかし、
　　クロス表分析では、３つ以上の名義尺度間の関連を検討することはできない。

３．従属変数が量的変数で独立変数が質的変数の場合に、変数間の関連をみるのに相関
　　比や分散分析を用いることができる。相関比は、最大値が１、最小値が－１である。

４．量的変数を従属変数、２つ以上の量的変数を独立変数とする回帰分析を、重回帰分析
　　という。重回帰方程式の標準化された回帰変数は、重相関係数に等しい。

５．順序尺度は、量的変数であるので、積率相関係数を計算したり回帰分析に投入したりして
　　構わない。

これの答えってどれですか？
できれば間違いの理由も教えて欲しいです・・・。

713 ：１３２人目の素数さん：2005/06/30(木) 12:28:44

>>712
１番は正解。
２番は３つ以上できないわけがない。
３番は相関比は０以上１以下になる。
４番はググればすぐわかる。
５番はまず文言的におかしい。あとは調べてみて。

補足あったらヨロ！

714 ：１３２人目の素数さん：2005/06/30(木) 22:36:35

最尤法とは確率分布が解らないと（前提にしないと）使えない手法なのでしょうか？

715 ：１３２人目の素数さん：2005/06/30(木) 22:57:16

>>714
確率分布を表現するパラメータを知るのにその確率分布をしていしないでどうやって
となります。

716 ：１３２人目の素数さん：2005/07/02(土) 14:57:13

大学一年で統計学を学んでいるのですが
t分布　F分布　カイ2乗分布　　t検定 F検定　
などごっちゃになってしまっていまいち「使い分け」？？ができません。
根本的にまったく別物なのでしょうか？すいませんが分かりやすく識別の説明を教えていただけないでしょうか？

教科書無しの板書のみなのでおすすめの統計学入門書も教えていただきたいです。
お願いいたします。

717 ：１３２人目の素数さん：2005/07/03(日) 11:20:01

5個の測定データを正規確率紙にプロットしたところほぼ直線になりました
5個のデータで正規分布に従っていると仮定してもいいんですか。最低これ
以上は必要というデータ数があれば教えてください。お願いします。

718 ：１３２人目の素数さん：2005/07/03(日) 17:54:11

エクセルで例えば１０から１５の間というように、ある区間の乱数を発生させたいのですが
エクセルの関数では０から１の間の乱数しか発生することができません。
方法があれば教えてください

719 ：１３２人目の素数さん：2005/07/03(日) 18:15:36

>>718
=rand()*5+10

720 ：１３２人目の素数さん：2005/07/03(日) 19:54:09

>>717
それは貴方の一存できまります、サンプルとは別に正規分布だとはっきり分る理由があるなら、
たまたま並んだ数字がでても、正規分布と思わない理由はないと思います。
例えば正規分布を生成する乱数表を使ってサンプルを抽出しているのに、
たまたま偏ったサンプルを得ても、これは正規分布ではないと思う理由はないと思います。
たとえば、正規分布と一様分布のどちらかが生成されているとする、何個くらいサンプル拾ったら、正規分布と仮定できますか？
というのは意味があるかも知れません、どちらの確率が大きいかで判断して、その信頼性で最低限必要な個数を決める事になると思います。
詳しくは検定を勉強してみてください。

721 ：１３２人目の素数さん：2005/07/03(日) 20:00:23

>>716
教科書みながらでもいいので、サンプルを作って手を動かして計算してみましょう、
統計学は、数学面していますが実は数学じゃないです、習うより馴れろです。

722 ：１３２人目の素数さん：2005/07/03(日) 22:31:02

すみません初心者なのですが、
http://kogolab.jp/elearn/hamburger/chap3/sec2.html
このページにかいてある確率密度というものはいったいどういうものなのでしょうか？

723 ：１３２人目の素数さん：2005/07/03(日) 23:33:55

ATMは週末に渡る顧客の引き出しを確保するに十分な現金をストックしてなく
てはならない。しかし、銀行は、必要以上にATMに現金をストックさせると、
貸し出しによって利子を稼げる機会を無駄にする。ある特定の支店のATMでは
週末期間中の顧客の取引一回あたりの予想平均引き出し金額は160ドル、
予想標準偏差は30ドルである。

1．対立仮説と帰無仮説を述べなさい。
2．もし36個の無作為抽出のATMの、預金引き出しの標本平均が172ドルだったら、
母集団平均がもはや160ドルではないevidenceになるだろうか？優位水準は0.05を使いなさい。
3．P値を計算しなさい。またその意味はどう解釈されるだろうか？
4．問題2で優位水準が0.01だったら答えはどうなるか考えてみよう

という問題なんですがお願いします。m(- -)m

724 ：723：2005/07/03(日) 23:42:20

自分なりの答えです。。。

1.対立仮説→支店によって引き出し金額は変わらない
　帰無仮説→引き出し金額は支店に関係しない
2.α＝0.05は20回に一回の頻度で起こり得るので160ドルではないとは
言い切れない。
3.

？？解りません（泣　

725 ：722：2005/07/04(月) 00:39:01

自己可決しました

726 ：１３２人目の素数さん：2005/07/04(月) 00:50:28

幾何学と統計学って関係ある？

727 ：１３２人目の素数さん：2005/07/05(火) 01:38:24

>>723-724 わからないにもほどがある。

728 ：１３２人目の素数さん：2005/07/05(火) 07:01:42

>727
1,2,4は自力で解けました。。でもＰ－valueが解りません！！
どなたか式だけでも教えていただけないでしょうか？？

729 ：１３２人目の素数さん：2005/07/05(火) 09:08:13

>>728を見て思ったんだけど、P-value派とp-value派はどちらが多いの？
p-valueとデフォで入力できないM$アプリのせい？

730 ：１３２人目の素数さん：2005/07/05(火) 12:45:05

>>716
t分布　F分布　カイ2乗分布　　t検定 F検定　
などごっちゃになってしまっていまいち「使い分け」？？ができません。

大雑把にいうとxが正規分布に従うならば、x^2はカイ2乗分布に従います。
x,yがカイ2乗分布に従うならば、x/yはF分布に従います。
xが正規分布、yがカイ2乗分布に従うならばx/yはt分布に従います。

731 ：１３２人目の素数さん：2005/07/05(火) 22:05:50

どの分布にもあてはまらないという分布もあっても良さそうなのに
なぜそのような反例が報告されないのでしょうか？

732 ：１３２人目の素数さん：2005/07/06(水) 00:44:38

>>731
なんですかそりゃぁいったい？

733 ：１３２人目の素数さん：2005/07/06(水) 07:30:01

>>731
言ってる意味がよくわからんけど
統計量がこういった分布になるものしかあつかっていないから
てきとーな量はもちろんこうした分布に従わない

734 ：１３２人目の素数さん：2005/07/06(水) 20:36:49

規則性のないデータの羅列はノイズと呼びます。
どの分布にもあてはまらない分布であって、
規則性があるなら、新しい分布としてあなたが命名すればよろしい。

735 ：１３２人目の素数さん：2005/07/06(水) 21:39:36

>>734 （　ﾟдﾟ）ﾎﾟｶｰﾝ

736 ：１３２人目の素数さん：2005/07/06(水) 21:55:55

早くもこのスレは夏休みモードですか

737 ：１３２人目の素数さん：2005/07/06(水) 23:56:09

ランダムという規則がある。
不可逆という規則がある。
カオスという規則がある。

これらの規則を分布則として定義化し、既知の分布群と同程度の知名度にまで昇華させたい。

738 ：１３２人目の素数さん：2005/07/07(木) 02:24:03

>>737
ほいじゃよ、分布関数が収束しない確率変数って奴はどうするよ？
たとえばこんなんじゃ
1,0,1,1,0,0,1,1,1,0,0,0 と後ろに行くほど連続する奴とか

739 ：１３２人目の素数さん：2005/07/07(木) 02:34:36

統計学で言う（1次、2次････n次）モーメントというのは、
力学でいうモーメントとどういう関係があるのでしょうか。
名前が同じなので、何か対応があると思うのですが。

740 ：１３２人目の素数さん：2005/07/07(木) 07:46:52

>>739
なんの関係もありません

741 ：１３２人目の素数さん：2005/07/07(木) 08:12:15

>>739
確率密度が物質の密度(比重)に対応するとすると、統計のモーメントと力学の
モーメントは基本的に同じ定義になります。
力学での重心は統計の1次のモーメントに相当し、
力学での慣性モーメントは、統計の2次モーメントに相当します。
密度に重み(もしくは距離)をかけて積分するのが「モーメント」ってことですかね。

742 ：：2005/07/07(木) 08:42:52

>>738
それ確率変数じゃなくてただの数列だって。
ほんとは、確率変数とか確率分布のことよく知らないの？

743 ：：2005/07/07(木) 08:59:58

＞＞７３７
ランダムは規則がないからランダムて言うんだよ。　しかも、正規分布でもポアソン分布でも、無作為に標本とったりできるんだから、確率分布全てがランダムナンバーの分布族に成り得るんだって。
カオス自体は規則性あるから確率分布でその性質を表すのおかしいって。
あまり知らないのに知った振りしてるの？それとも、ただの釣り師？

744 ：１３２人目の素数さん：2005/07/07(木) 09:00:25

>>742
なんじゃそりゃ？

745 ：１３２人目の素数さん：2005/07/07(木) 09:02:50

>>743
たとえば0以外出現しない確率変数はどうなるんだ？

746 ：１３２人目の素数さん：2005/07/07(木) 09:06:55

>>742-743
まぁなんだな、キミは確率と確率変数の違いを理解することだな

747 ：：2005/07/07(木) 09:14:19

＞＞７４４
１、０、１、１、０、０、１、１、１、０、０、０、
これのどこが確率変数なの？どこまでいっても、次の数字がなんだかわかるじゃん。こんなことわかんないの？

748 ：：2005/07/07(木) 09:16:33

＞＞７４５
そういうの、定数っていうんだよ。釣ってるの？

749 ：：2005/07/07(木) 09:21:09

＞＞７４６
もっと勉強がんばってね。

750 ：１３２人目の素数さん：2005/07/07(木) 09:25:53

なんだかな、数列だと思う件については、まっ、難しいのでよしとして・・・
お前平均の計算一つしたことないだろ、定数の確率変数を入れないと式変形なんてまともにできんよ。
例えば六面全部1と書いているサイコロの目の出現確率の分布を考えてみろ。

751 ：：2005/07/07(木) 09:52:20

＞＞７５０
だって、確率変数は関数なんだから、あんたの例では、X：Sー＞{０、１}てかくべきだよね。
１、０、１、１、０、０、１、１、１、０、０、０、ってただ特定の結果だよん。
これのどこが確率変数？

さいころの事だけど、それは、便宜上退化した確率分布っていってるだけで、実際
定数のことだよ。平均のことは、大数の法則のことかな？これって、確率変数が定数に収束することだよね、もしくは、定数嫌いのために便宜上、退化した確率分布に収束ともいうけど、結局、これ定数です。

752 ：１３２人目の素数さん：2005/07/07(木) 09:58:13

>>751
おまえ確率やら統計やら以外の数学は知っていそうだが、こっちゃら方面は全くの無知なんだなw
そうそう、統計と確率の違いもしらないだろw

753 ：１３２人目の素数さん：2005/07/07(木) 10:03:08

>>751
もしどうしても規則性というのが気に食わないのなら、相関係数という概念を考えてみようw
さらに自己の系列に対する自己相関という概念も考えてみようw
これらが考えられるものは確率変数ではない!
と断言されますか？そうですか・・・

754 ：：2005/07/07(木) 10:11:15

>>752
そーかな、意外と知ってるよ。
統計って、統計量のこと？　統計量がある確率分布にしたがって、その分布
をもとに特定の統計量の値の確率をもとめられるんだけど、何か？

755 ：１３２人目の素数さん：2005/07/07(木) 10:16:06

>>754
統計が扱う母集団は確率とは全くの無関係なんだよ、だから統計は数学とはいい難いんだ。

756 ：：2005/07/07(木) 10:35:50

＞＞７５５
＞＞統計が扱う母集団は確率とは全くの無関係なんだよ

あんた本当に知らんね。
母集団の確率分布が統計量の確率分布をきめるんだけど、、、
まあ、母集団の分布知らなくても、サンプルおおかったら、
正規分布に収束する統計量（平均など）も有るけど。
ともかく、もう少しガンガレ

757 ：：2005/07/07(木) 10:39:55

＞＞７５３
？？
そんなこといってないし、

758 ：１３２人目の素数さん：2005/07/07(木) 13:31:53

自分のそんな頃があって恥ずかしこそばゆいな・・・
見ているこっちが恥ずかしくなるからヤメレ

759 ：１３２人目の素数さん：2005/07/07(木) 15:49:11

クロス集計表（分割表）の検定と平均値の差の検定ってどう違うの？

760 ：１３２人目の素数さん：2005/07/09(土) 22:20:37

>>759 二つの帰無仮説は理解できたのか？

761 ：１３２人目の素数さん：2005/07/10(日) 10:00:02

統計学についてのレポートを書かないといけないんですが、良いサイトを紹介していただけないですか？
テーマは統計の方法と理論についてです！

762 ：学生：2005/07/10(日) 12:15:28

次の数字は一様乱数として使えますか？またその理由を教えて下さい。
(1)円周率の1000桁目か1250桁目まで
(2)乗用車のナンバー4桁数字
(3)電話帳

763 ：１３２人目の素数さん：2005/07/10(日) 12:49:15

宿題丸投げですか？丸投げならそうする理由を教えて下さい。

764 ：学生：2005/07/10(日) 13:02:01

明日課題の締め切りなんです(T-T)
この問題よく意味分からないし。
しかも締め切りに間に合わないと単位落としちゃうんです。

765 ：１３２人目の素数さん：2005/07/10(日) 15:06:51

一様乱数というのは、全部の目が同程度に出るサイコロのような物の事

(1)円周率の1000桁目か1250桁目まで
　ウエブ上で1-9までの数字がほぼ同程度にあることが書いているページがあると思われる、それを理由に使えるとしてみればよい。
(2)乗用車のナンバー4桁数字
　まず、どうやって使うのか分らないな、分らないものは使えないな。
　ナンバープレートなら、自動車から引っぺがして、表と裏でどっちがでるかやってみれば良いが、違法だから使えない。
(3)電話帳
　これはいけるんじゃないか？、はさみで丁寧に切って、セロテープで巻いてサイコロ作って、表面に数字書いて転がせ。

766 ：学生：2005/07/10(日) 15:34:00

返事ありがとうございました。

767 ：学生：2005/07/10(日) 15:39:28

ちなみにそのサイトを教えてもらっていいですか？

768 ：１３２人目の素数さん：2005/07/10(日) 15:44:38

(2)乗用車のナンバー4桁数字
名探偵コナンであるひらがな、番号は使われていないだからＮＧ

769 ：学生：2005/07/10(日) 15:51:34

≫768意味が分からないのですが・・・

770 ：１３２人目の素数さん：2005/07/10(日) 15:54:48

>>762
(1)たしかに１０万桁ぐらいまでみると、ほぼかたよりなくでるらしい
　けど２５０桁ではすくないかも。
(2)電話番号の局番の最初の桁は2-9しかつかわれない。
　でも下ひと桁、下ふた桁はいけそうな稀ガス。
(3)つかわれない数字もあるし、今は希望の番号がえらべるから
　きっとランダムじゃ無いと思われ。

771 ：１３２人目の素数さん：2005/07/10(日) 15:56:04

>>770
(2)と(3)が逆。

772 ：学生：2005/07/10(日) 16:01:22

わかりました。
ありがとうございました。

773 ：１３２人目の素数さん：2005/07/10(日) 19:14:23

教えて君ですいません
SPSSでROC曲線がうまく書けません
何冊か本は読んだんですがROC曲線についての記述が無く、
参考になるサイトなどありましたら教えて下さい

774 ：学生21：2005/07/10(日) 20:46:59

問題の答えの文章をどう書いたらいいのか
分からないんですけど教えてもらえませんか？
次のような場合に標本を取り出すために(近似的な)
無作為抽出計画を立てるにはどうしたらいいであろうか。
(ａ)森林の立木
(ｂ)1台のトラックに積まれている袋入りのジャガイモ
っている問題なんですけど・・・

775 ：１３２人目の素数さん：2005/07/10(日) 21:01:40

すみません、χって言うのは何ですか？
χ２乗分布と、χ２乗検定とかあってよくわかりません

776 ：１３２人目の素数さん：2005/07/10(日) 23:10:41

ここもすっかり宿題駆け込み寺になってしまった

777 ：１３２人目の素数さん：2005/07/10(日) 23:25:07

>>775
カイってなんですか？って言われてもな
確率変数を用いて統計量の計算をし、それがカイ2乗分布に従っている検定をカイ2乗検定という

ところで誰かカイ2乗の名前の由来知ってる？

778 ：１３２人目の素数さん：2005/07/10(日) 23:49:32

統計学入門
蓑谷千凰彦 (著)

この本は初心者が読めますでしょうか？

779 ：775：2005/07/10(日) 23:52:51

>>777
ためになりそうなので、是非教えてください。

780 ：１３２人目の素数さん：2005/07/11(月) 09:20:29

>ところで誰かカイ2乗の名前の由来知ってる？
ttp://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc019/295.html
あおきせんせーも知らんそーだ

781 ：１３２人目の素数さん：2005/07/11(月) 13:54:38

>>777です

>>780
thx
t分布とかF分布は有名で知っていたが、カイ2乗だけ聞かないんだよな
青木先生が知らないとなるとｼｮﾎﾞｰﾝ

782 ：１３２人目の素数さん：2005/07/11(月) 14:09:11

>>780
岩波理工系の数学入門コース7 薩摩順吉確率・統計によると
「もともと統計学者は、$\chi^2=X_1^2+X_2^2+\cdots+X_n^2$を、正規母集団
からの標本分散に関係した量としてよく用いていたので、このような名前がつ
けられるようになった。」
とありました。ギリシャ語アルファベットで\chiの大文字はXだから、ってところですかね。

783 ：１３２人目の素数さん：2005/07/11(月) 17:37:18

修士課程の問題なのですが、教えて下さい。
(1),(2)はなんとなく分かるのですが、（3）（4）はさっぱりでして・・・

ある装置Aには2つの部品AX、AYが使われている。それぞれの部品が故障するまでの時間を
確率変数X、Yであらわす。（X、Y）が同時確率密度関数
　　　　　　　　　
　　　　　　　　　exp{-(x+y)}, x≧0
ｆXY（ｘ、ｙ）＝｛
　　　　　　　　　 0 otherwise

を持つとする。

(1)Xの周辺分布fX(x)を求めよ。
(2)X,Yが独立であることを示せ。
(3)部品AXの方が部品AYより先に故障する確率を求めよ。
(4)装置Aは2つの部品のどちらかが故障すると動かなくなる。装置Aが動かなくなるまでの時間を確率変数Zとすると、
　　Z=min(X、Y)　と表せる。Zの確率密度関数　fZ(z)を求めよ。
　　ここで、minは次のように定義された関数である。

　　　　　　　　　x1, x1 < x2
min(x1,x2)={
　　　　　　　　　x2, x1 ≧ x2

784 ：784：2005/07/11(月) 19:09:23

√(784) = 28

785 ：１３２人目の素数さん：2005/07/11(月) 19:24:46

>>783
大阪の方の大学院かな？
このくらい出来ないダメです。

786 ：１３２人目の素数さん：2005/07/11(月) 20:26:22

なんで正規分布の式に、πが含まれているのか教えてください

787 ：１３２人目の素数さん：2005/07/11(月) 21:32:41

それがねーと積分して1にならねーからじゃねーの

788 ：１３２人目の素数さん：2005/07/11(月) 21:55:49

>>785
答えｶﾓﾝ_(._.)_

789 ：１３２人目の素数さん：2005/07/11(月) 22:18:44

>>783
二次元の図を描いて味噌、積分範囲がどこになるか考えたらOK
後は定積分でゴー
だとおもう、オレ高卒なんであんまり信用しないでね～

790 ：１３２人目の素数さん：2005/07/11(月) 23:53:30

>>786
酔っ払いモードで帰ってきた高卒クンが勢いでといてみます、うろ覚えなので合っているかどうかチェックもこめてやりま～す。
∫e^( -x^2 / 2 ) dx を -∞ ～ ∞ を積分して √(2π) を証明します。

f(x) = ∫(範囲-∞ ～ ∞) e^( -x^2 / 2 ) dx

f(x) の積分はできたものじゃないので、f(x)^2 をにして
積分範囲は、正の部分( 0 ～ t )だけ計算します、対称なので lim t -> ∞ とした後、二倍にすれば答えになります。

f(t)^2 = ∫(範囲0～t) e^( x^2 / 2 ) dx * ∫(範囲0～t) e^( y^2 / 2 ) dy
f(t)^2 = ∬(xy共に0～t) e^( x^2 / 2 ) * e^( y^2 / 2 ) dx dy
f(t)^2 = ∬(xy共に0～t) e^{ (x^2 + y^2) / 2 } dx dy

とりあえずここまで計算したところで、これはほうって置いて
中の式 e^{ (x^2 + y^2) / 2 } を極座標で表現します。

791 ：１３２人目の素数さん：2005/07/11(月) 23:54:01

x = r * cos(θ)
y = r * sin(θ)
として
ここで、r を 0 ～ π/2 まで、 θ を 0 ～ r まで積分します、積分範囲は省略
g(r) = ∬ e^{ -(x^2 + y^2) / 2 } dxdy
g(r) = ∬ e^{ -(x^2 + y^2) / 2 } * ( ∂x/∂r*∂y/∂θ-∂y/∂r*∂x/∂θ ) drdθ
g(r) = ∬ e^{ -(x^2 + y^2) / 2 } * ( cos(θ)*{r * cos(θ)}-sin(θ)*{-r * sin(θ)}) drdθ
g(r) = ∬ e^{ -(x^2 + y^2) / 2 } * r * { cos(θ)^2+sin(θ)^2} drdθ
g(r) = ∬ e^[ -{ ( r * cos(θ) )^2 + ( r * sin(θ) )^2 }/ 2 ] * r drdθ
g(r) = ∬ e^[ -r^2 * { cos(θ)^2 + sin(θ)^2 }/ 2 ] * r drdθ
g(r) = ∫ e^( -r^2 / 2 ) * r dr * ∫dθ
g(r) = [ -e^(r^2/2) ](範囲0 ～ r) * π/2
g(r) = ( 1 - e^(r^2/2) ) * π/2

ここで
　g(t)の積分範囲 ⊆ f(t)^2の積分範囲 ⊆ g(t*√2)の積分範囲
なので
　g(t) ≦ f(t)^2 ≦ g(t*√2)
となり、挟み撃ち法で
lim t -> ∞ で　π ≦ f(t)^2 ≦ π
したがって f(t) = √(π/2)

範囲-∞ ～ ∞だったので二倍にして √(2π)
∫(範囲-∞ ～ ∞) e^( -x^2 / 2 ) dx = √(2π)
分布関数にするために面積を1にするようにするためには 1 / √(2π) で割れば良いとなる。

ところで、多次元正規分布の場合が良く分かりません、重積分が全然解けないです。
重積分が自在に計算できるようなコツとかないでしょうか・・・・

792 ：786：2005/07/12(火) 02:43:54

ありがとうございます。
けっこう複雑な計算が必要なんですね。
参考になりました。

793 ：１３２人目の素数さん：2005/07/12(火) 07:36:12

>けっこう複雑な計算が必要なんですね。
791さんが丁寧に書いているのでそう見えるだけです。

794 ：１３２人目の素数さん：2005/07/12(火) 09:04:22

783の問題教えてください。

795 ：31：2005/07/12(火) 10:13:47

>>784
783の問題

ある装置Aには2つの部品AX、AYが使われている。それぞれの部品が故障するまでの時間を
確率変数X、Yであらわす。（X、Y）が同時確率密度関数
　　　　　　　　　
　　　　　　　　　exp{-(x+y)}, x≧0
ｆXY（ｘ、ｙ）＝｛
　　　　　　　　　 0 otherwise

を持つとする。

(1)Xの周辺分布fX(x)を求めよ。
(2)X,Yが独立であることを示せ。
(3)部品AXの方が部品AYより先に故障する確率を求めよ。
(4)装置Aは2つの部品のどちらかが故障すると動かなくなる。装置Aが動かなくなるまでの時間を確率変数Zとすると、
　　Z=min(X、Y)　と表せる。Zの確率密度関数　fZ(z)を求めよ。
　　ここで、minは次のように定義された関数である。

　　　　　　　　　x1, x1 < x2
min(x1,x2)={
　　　　　　　　　x2, x1 ≧ x2

796 ：１３２人目の素数さん：2005/07/12(火) 11:36:52

優しく教えて貰えたのにすみません。
問題だけでなく答えのほうをよろしくお願いします。

797 ：１３２人目の素数さん：2005/07/12(火) 13:40:52

>>783
(1) fxy(x,y) を y で積分する。fx(x)=exp(-x)
(2) fxy(x,y)=fx(x)*fy(y) を示す。
(3) 答えだけ。1/2
(4) 面倒。
以上、文系人間の解答です。添削よろ。

798 ：31：2005/07/12(火) 16:08:35

>>783
(4)
P(min(X,Y)<=t)=1-P(min(X,Y)>t)
とすれば分かるでしょ。

799 ：１３２人目の素数さん：2005/07/12(火) 23:00:00

>それぞれの部品が故障するまでの時間を確率変数X、Yであらわす。
>ｆXY（ｘ、ｙ）＝exp{-(x+y)}, x≧0
時刻０で故障する確率が最大ってことになっておかしんじゃぁ？
なんか勘違いしてる？

800 ：１３２人目の素数さん：2005/07/13(水) 00:24:08

>>799
指数分布をお勉強しませう～
飛行機事故は、間隔をあけて起こるより、連続して起こる確率の方が高いって話を聞いたことがないですか～

801 ：１３２人目の素数さん：2005/07/13(水) 00:47:29

>>800
> 飛行機事故は、間隔をあけて起こるより、連続して起こる確率の方が高いって話を聞いたことがないですか～
それ、関係ないでしょ。
10時間故障がなく動作した後にはじめて故障する確率と、
100万時間故障がなく動作した後にはじめて故障する確率と、
どっちが大きいか、が直感的に理解できれば799の誤解はとけるはず。

802 ：１３２人目の素数さん：2005/07/13(水) 00:52:45

>>800
横レスなんだけど､これから統計学を勉強する輩に良いサイトor本はありますか？
ぐぐったりアマゾン行ってみたけど､何がなんだか･･･

803 ：１３２人目の素数さん：2005/07/13(水) 01:58:33

池沼発見（藁

586 ：マドモアゼル名無しさん：2005/07/12(火) 23:09:55 ID:2Z4mTxJA
サンプルは少なくても、的中率が１００パーセントだとさすがに信憑性は
あると思うのだが、いかがかな？現実世界で出会う人物で研究対象となるほど
距離が近づける人はさすがにサンプルをしては数が限られてくるが、
量よりも質を重視している。

587 ：マドモアゼル名無しさん：2005/07/12(火) 23:11:44 ID:2Z4mTxJA
最低でも誕生日を聞き出すなり、調べ上げるなりしなきゃいけないから、当然、
サンプルの数を問われれば、少ないと言わざるをえないがな。
だけど、信憑性はあると確信している。

804 ：１３２人目の素数さん：2005/07/13(水) 03:51:01

>>803
前後を見ていないのでなんとも言えないがある意味真実だよ、
統計量から統計学の各種結果を使った推定は所詮は仮定の上の物。
実践的な統計では、まずサンプルをとったら検定などせず、その実物を目視確認
予定している仮定を設定しても良いかどうかは、その後決めるというのは基本中の基本。

とりあえず、その晒し趣味はすかん、死ね

805 ：１３２人目の素数さん：2005/07/13(水) 05:58:33

>>799
fXY(x,y)は確率密度でしょ。
故障率という概念も勉強しましょう。
バスタブ曲線とかも調べるといいね。これは信頼性理論の方かな。

806 ：799：2005/07/13(水) 10:21:48

いや確率密度ってことはわかってるけど製品として出荷するにあたり、
出荷検査なりで初期不良品は除かれているという思い込みがあり、
なんか違和感を感じた。
とにかく答えてくれた方thanks

807 ：１３２人目の素数さん：2005/07/13(水) 21:42:13

>>802
いい本知らないです、あったら教えて欲しいくらいです。
これは買ってはいけないという本なら紹介できます(汗

>>806
その違和感は大事だと思うけどな～
指数分布というのは、適当な時間の期間中に一様に故障時間となるポイントを配置したときの間隔の分布だから、
製品の内部要因によって破損するというよりも、外部要因による不慮の事故のモデルだと思う。
製品の内部要因が原因でおこるとすれば、例えば n 回破損が生じたとかをモデリングすると、これはガンマー分布という別の分布になるし、
最弱の部品が壊れるとき製品が壊れるとモデリングすればワイブル分布を想定しないといけないと思う。

808 ：１３２人目の素数さん：2005/07/13(水) 22:53:59

>>807
>いい本知らないです、あったら教えて欲しいくらいです。
>これは買ってはいけないという本なら紹介できます(汗

そうっすか
残念

指数分布探してみます｡

809 ：１３２人目の素数さん：2005/07/13(水) 23:05:37

783 ちょっと解いてみました、合っているかどうかは不明で～す

(1)Xの周辺分布fX(x)を求めよ。

　fX(x) = ∫(範囲0～∞以下略) fXY(x,y) } dy
　fX(x) = ∫ exp(-x) * exp(-y) dy
　fX(x) = exp(-x) * ∫ exp(-y) dy
　fX(x) = exp(-x) * { -exp(-∞) - {-exp(0)} }
　fX(x) = exp(-x)

(2)X,Yが独立であることを示せ。

　(1) と同様にして fY(y) = exp(-y)
　fX(x)*fY(y) == fXY(x,y)
　exp(-x)*exp(-y) == exp{-(x+y)}

(3)部品AXの方が部品AYより先に故障する確率を求めよ。

　= P( X < Y )
　= ∬(範囲X<Y<∞) fXY(x,y) dxdy
　= ∫(0～∞以下略) fY(y) * { ∫(0～y以下略)fX(x) dx } dy
　= ∫fY(y) * { ∫exp(-x) dx } dy
　= ∫fY(y) * { -exp(-y) - (-1) } dy
　= ∫fY(y) * { 1 - exp(-y) } dy
　= ∫exp(-y) * { 1 - exp(-y) } dy
　= ∫exp(-y) - exp(-y)*exp(-y) } dy
　= ∫exp(-y)dy - ∫exp(-2y) dy
　= 1 - 1/2
　= 1/2

810 ：１３２人目の素数さん：2005/07/13(水) 23:06:46

(4)装置Aは2つの部品のどちらかが故障すると動かなくなる。装置Aが動かなくなるまでの時間を確率変数Zとすると、
　　Z=min(X、Y)　と表せる。Zの確率密度関数　fZ(z)を求めよ。

　まず fZ の累積確率分布 FZ を計算する
　FZ( z ) = ∬(範囲x,y<z) fXY(x,y) dxdy
　FZ( z ) = ∬ exp(-x)*exp(-y) dxdy
　FZ( z ) = ∫ exp(-x) ∫exp(-y) dy dx
　FZ( z ) = ∫ exp(-x) * ( 1 - exp(-z) ) dx
　FZ( z ) = ∫ exp(-x) dx * ( 1 - exp(-z) )
　FZ( z ) = ( 1 - exp(-z) )^2

　微分して確率分布を求める。
　d FZ / dz = ( 1 - exp(-z) )^2
　d FZ / dz = 2( 1 - exp(-z) ) * exp(-z)
　fZ( z ) = 2( 1 - exp(-z) ) * exp(-z)

811 ：１３２人目の素数さん：2005/07/14(木) 01:02:05

>>810
maxじゃないぞ。

812 ：１３２人目の素数さん：2005/07/14(木) 04:37:32

>>810
798にある
P(min(X,Y)<=t)=1-P(min(X,Y)>t)
から展開するのが普通でしょ。
min(X,,Y)>tは、(X>t)かつ(Y>t)と同値。

P(min(X,Y)<=t)=1-P(min(X,Y)>t)
=1-exp(-t)*exp(-t)

微分すれば密度関数。

813 ：１３２人目の素数さん：2005/07/14(木) 10:53:10

大学で統計をやっているのですが、
まったくわかりません。
なにかわかりやすい教科書とかありましたら
教えていただけると幸いです。
マンガでわかる統計学とかどうなんでしょか？

814 ：１３２人目の素数さん：2005/07/14(木) 13:39:29

>>813
まったくわかんないんなら、
マンガから入って徐々に基本テキストへと
進んでいけばいいんじゃないの。

815 ：１３２人目の素数さん：2005/07/14(木) 22:18:42

あひゃっ、積分範囲を間違ってる、自分で二次元の図を描いて味噌、
積分範囲がどこになるか考るといいよ～とか言っておきながら、
図を描かずに横着を下挙句間違っていれば世話はないですね……(汗
>>810 の修正しておきます

まず積分範囲 S を計算する
　S(z) = { (x,y) | x < z ∨ x < z , x ∈ R , y ∈ R }
　
　S(z) = Sa(z) + Sb(z) + Sc(z)
　　Sa(z) = { (x,y) | x < z ∧ y < z , x ∈ R , y ∈ R }
　　Sb(z) = { (x,y) | x >= z ∧ y < z , x ∈ R , y ∈ R }
　　Sc(z) = { (x,y) | x < z ∧ y >= z , x ∈ R , y ∈ R }

fZ の累積確率分布 FZ を計算する

　FZ( z ) = ∬( 範囲 S(z) ) fXY(x,y) dxdy
　FZ( z ) = ∬( 範囲 Sa(z) ) fXY(x,y) dxdy + ∬( 範囲 Sb(z) ) exp(-x)*exp(-y) dxdy + ∬( 範囲 Sc(z) ) exp(-x)*exp(-y) dxdy
　FZ( z ) = ∬( 範囲 Sa(z) ) fXY(x,y) dxdy + 2∬(範囲 Sb(z) ) exp(-x)*exp(-y) dxdy
　FZ( z ) = ∬( 範囲 Sa(z) ) fXY(x,y) dxdy + 2∫(範囲 x>=z ) exp(-x) { ∫(範囲 y<z )exp(-y) dy } dx
　FZ( z ) = ∬( 範囲 Sa(z) ) fXY(x,y) dxdy + 2∫(範囲 x>=z ) exp(-x) { 1 - exp(-z ) } dx
　FZ( z ) = ∬( 範囲 Sa(z) ) fXY(x,y) dxdy + 2*{ 1 - exp(-z ) }*∫(範囲 x>=z ) exp(-x) dx
　FZ( z ) = ∬( 範囲 x,y<z) fXY(x,y) dxdy + 2*{ 1 - exp(-z ) }*{ exp(-z) }
　FZ( z ) = ( 1 - exp(-z) )^2 + 2*{ 1 - exp(-z ) }*{ exp(-z) }
　FZ( z ) = 1 - exp(-z )^2

微分して確率分布を求める。
　d FZ / dz = d { 1 - exp(-z )^2 } / dz = fZ( z )
　fZ( z ) = -2*exp(-z ) * ( -exp(-z ) )
　fZ( z ) = 2 * exp( -2 * z )

816 ：１３２人目の素数さん：2005/07/15(金) 01:15:21

古いネタだが、yahoo投票の捏造疑惑
ttp://hitode.org/archives/000061.php

グラフが直線的すぎるを根拠にスクリプトだと言い張る。
中には統計学を使ったよ的なものがあるが、どうでしょう？

817 ：816：2005/07/15(金) 01:20:32

統計を使ってるとか数学的裏づけとか言ってるが、使い方が素人くさい。
最近では大学入試に数学を課してない文系にも統計学を教えてる。
その授業というものはひどいもので、相関係数とか回帰分析とかのやり方だけしめして、
あとはエクセル使ってやってみましょうってやつ。

そんなやつも混じってるだろうし、統計とか数学とか言われても説得力がない。
とはいえ俺自信も統計は齧った程度しかやってないので、
ここの皆さんに検証していただきたい。

818 ：816：2005/07/15(金) 01:22:16

彼らの根拠としているデータはこれ。
http://hitode.org/archives/000066.php
15:09 自由民主党 20% 494 票公明党 7% 182 票民主党 59% 1455 票日本共産党 4% 112 票
15:15 自由民主党 20% 535 票公明党 7% 193 票民主党 60% 1585 票日本共産党 4% 119 票
15:35 自由民主党 20% 661 票公明党 7% 236 票民主党 60% 1978 票日本共産党 4% 139 票
15:46 自由民主党 20% 719 票公明党 7% 257 票民主党 60% 2174 票日本共産党 4% 158 票
16:03 自由民主党 19% 821 票公明党 7% 295 票民主党 60% 2507 票日本共産党 4% 178 票
16:09 自由民主党 19% 849 票公明党 7% 304 票民主党 61% 2608 票日本共産党 4% 185 票
16:32 自由民主党 19% 982 票公明党 7% 359 票民主党 61% 3030 票日本共産党 4% 215 票
16:41 自由民主党 19%1032 票公明党 7% 377 票民主党 61% 3166 票日本共産党 4% 227 票
17:00 自由民主党 19%1127 票公明党 7% 410 票民主党 61% 3478 票日本共産党 4% 254 票
17:14 自由民主党 19%1206 票公明党 7% 439 票民主党 61% 3710 票日本共産党 4% 267 票
17:17 自由民主党 20%1232 票公明党 7% 448 票民主党 61% 3769 票日本共産党 4% 272 票

819 ：816：2005/07/15(金) 01:25:03

448 ：隣の名無しさん：03/10/11 21:00 ID:j0L0UsvD
散レスで申し訳ないのですが、>>248さんご提供の資料でちょっと単純な回帰分析してみました。

民主党投票数＝α　+　β×自民党投票数

結果、
Ｒ＾２が0.999を超えましたｗ。状況証拠だけで言えば明らかな作為が見られます。

526 ：隣の名無しさん：03/10/11 21:10 ID:Wu5y+MhF
>>498
ずれた
　　　　　　　　自由民主党　　　公明党　　　　民主党　日本共産党
自由民主党　　　　　　　　1
公明党　　　0.999624978 　　　　　　　　1
民主党　　　0.999820319　0.999398175 　　　　　　　1
日本共産党 0.998534081　0.99899655 　0.998344414 　　　　　　　1

604 ：448 ：03/10/11 21:18 ID:j0L0UsvD
もう必要ないかもしれないけど、一応係数載せておきます。

係数標準誤差t
切片-101.087705718.24615845-5.540218561
X 値 13.1654550390.020005071158.2326296

つまり、自民1回の投票に対し、民主は3.165回投票された計算になります。
しかも前述の通りＲ^２は0.999を超えてます。

820 ：31：2005/07/15(金) 09:42:50

X_1,X_2,...,X_nはある分布F(x)に従っている。F(x)の形は
連続、離散を限定しない。
このとき、2番目とn-2番目の確率分布を求めよ。
お願いします。

821 ：１３２人目の素数さん：2005/07/15(金) 13:25:25

>>820
意味の分らない問題だな、二番目とn-2番目が X_2 と X_(n-2) の事で
X すべての分布がF(x) なら、F(x) に決まってんじゃねぇの

822 ：１３２人目の素数さん：2005/07/15(金) 14:26:43

>>820
順序統計量の2番目とn-2番目の同時分布という意味ですね。

823 ：132人目の素数さん：2005/07/15(金) 19:24:18

①P(|z|>a)=0.2を満たす実数aの値を求めよ
一応、自分の計算した途中までの結果も書いときます。

z>aとz<-aの時に場合わけ。z≧aならばI(z≧a)=0.5-I(a)z≦-aならばI(z≦a)=0.5-I(a)。
ここまでわかりました。これからどうすればいいのかわかりません。

②xに対するyへの回帰直線の方程式って

(y-yの平均値)=共分散(x-xの平均値)/xの分散ですよね？

だとしたらこれが一応、y=-0.692x+37.44になったんですが、
問題：x=10の時のyの推定値を求めよ。

これは、ただ単にxに代入すればいいのでしょうか？

お願いします。

824 ：１３２人目の素数さん：2005/07/15(金) 22:51:53

もうちょっと問題しっかりかかないと、問題として完成してないよ～ん、

①あまりにミカン星人です、理解でけません。
　I の定義とか z の分布とかが判らないとだめ。
　問題文確認すべーし。

②xに対するyへの回帰直線の方程式って
>(y-yの平均値)=共分散(x-xの平均値)/xの分散ですよね？
　定義しだいだけれど、特に断ってなければコレの型が多いですね、結果だけ使いたい人たち向けの本にはこれしか書いてないことも多いです。
　x に値ぶち込んで y を求めればOKです。

825 ：１３２人目の素数さん：2005/07/15(金) 22:56:36

>>824
問題は
確率変数Zが正規分布N(0,1)に従うとき、P(|z|>a)=0.2をみたす実数aの値を求めよ。

です。

②についてですがありがとうございます！

826 ：１３２人目の素数さん：2005/07/15(金) 23:05:01

>>825
①P(|z|>a)=0.2を満たす実数aの値を求めよ
これはちょっと本がないと説明難しいね、本の巻末に正規分布の累積分布の数表があると思うんだけど、それを使うんですよ。
それで、その数表の見方がわからないともうお手上げですね、説明書をよく読んでみてください。
んで、範囲ですが、多分数表には右半分か左半分しか書いてないと思うんですよ。
正規分布は左右対称なので、0.2の半分0.1を満たす位置を探せばよいのですが、さてさて・・・・

827 ：１３２人目の素数さん：2005/07/15(金) 23:30:04

>>826
見方はわかりますよ。正規分布のグラフではz>a,z<-aのとこですよね？

828 ：１３２人目の素数さん：2005/07/16(土) 00:09:04

>>827
見方がわれぱ、この問題計算不要というか読んだ時点で終わりっすよ～
というか、この問題は読み方の練習問題なんだとおもいます～

829 ：１３２人目の素数さん：2005/07/16(土) 01:41:13

中心極限定理のことで少しご教授ください。
ある検査の項目に対する回答が正規分布しない場合でも検査の合計点は
必ず正規分布に近似する理由がわからないです。
標本度数が無限に近づくことで正規分布するということでしょうか？
または、定理に関係なく検査に正規分布するような項目を設定する為なんでしょうか？

830 ：829：2005/07/16(土) 01:42:25

ageてしまって、申し訳ありません。
以後気をつけます…

831 ：１３２人目の素数さん：2005/07/16(土) 09:32:02

>>828
ありがとうございました！

832 ：１３２人目の素数さん：2005/07/16(土) 10:03:47

>>829
中心極限定理の簡単な証明を読んでみた？
和の分布の特性関数が正規分布と一致するとかそんな方法だったような

833 ：１３２人目の素数さん：2005/07/16(土) 10:46:09

１７個のデータを用いて母分散の検定を行うとき、有意水準１％に対するχ^2分布の右側棄却域を求めよ。

これってどうやるんですか？

834 ：１３２人目の素数さん：2005/07/16(土) 11:11:05

ある都市の工業団地で１２０企業を無作為に選び、１ヶ月間の工業用水の使用量を調べたら平均値756m^3、標準偏差125m^3という結果を得た。
工業用水の使用量は正規分布するものとする。

(1)この工業団地で１ヶ月間の工業用水使用量が600m^3以上800^3以下の範囲にある企業数。
↑わかりました。
(2)この工業団地で１ヶ月間の工業用水使用量が1000m^3以上の企業数。
これは、一応不安なので式書きます。
z=X-μ/δ μ：平均値　δ:標準偏差　より
z=1000-756/125=1.952　正規分布表を見ると、I(1.95)=0.47441
よってP(z≧1.95)=0.500-0.474=0.026　
企業数は　120×0.026　より3.12 よって企業数は３。

これで合ってますか？

(3)使用量の多いものから順に２０起業を選ぶとき、上から２０番目の起業はどのくらいの水を使っているか？
これは全くわかりませんでした。
よろしくお願いします。

835 ：１３２人目の素数さん：2005/07/16(土) 11:28:40

>>833
巻末の表を見るんです

836 ：１３２人目の素数さん：2005/07/16(土) 15:42:27

>>829
さいころを使って実際にやってみるっす、コインの両面を1,0としてやってみてもいいです。
さらに、さいころの数字を各面すき放題つけてもそうなるのでやってみてください。
分散1、平均0になるように正規化すれば、正規分布にどんどん近づくのが分かります。
最後に、コーシー分布というのがあるのですが、これについてやってみるといいです。
これは中心極限定理が成立しない分布です、だだしこれはコンピュータ使えないとメンドクサイかも。
これは実際に見ると分布関数がいつまでたっても収束せずにフラフラと漂います。
平均は、いつでも定義できる万能の計算ではないと分かります、当然、二乗の平均である分散も同様となります。
一通り実物を見終わったら証明を見てみるべし、もう書かれていますがモーメント母関数を使います。

837 ：31：2005/07/16(土) 17:41:53

>>829
シミュレーションするならRが便利。
http://cran.md.tsukuba.ac.jp/
http://www.okada.jp.org/RWiki/

2個のサイコロを100回振ったときの話。
rep<- 1000
x<- numeric(0)
s<- 2
for (i in 1:rep){
u<-sample(6,size=s,replace=T)
wa<-sum(u)
x<-c(x,wa)}
par(mfrow=c(1,3))
hist(x)
boxplot(x)
qqnorm(x)
qqline(x)
par(mfrow=c(1,1))

838 ：１３２人目の素数さん：2005/07/16(土) 17:54:22

ちょっと教えてください。

N個の異なる実数A1,A2,・・,Anから、重複を許さずに無作為にn個を取り出すことによって標本（X1,X2, ・・,Xn）が得られる。この無作為抽出によって定義される確率変数
X1,X2,・・・,Xnについて次の各門に答えよ。ただしN>nであるとする。

(i,j)の各組について、Xi,Xjの共分散COV（Xi,Xj）をNと分散σ^2を用いて表せ。ただし、確率変数X１,X2,・・・,Xnは全て同一の分散を持つので、これをσ^2とせよ。

839 ：１３２人目の素数さん：2005/07/16(土) 18:04:29

>>828
すいません。ちょっと疑問に思ったのですが

範囲はz>a,z<-aですよね？で、それをグラフに書きます。そうすると、
例えばP(z>a)=0.1となるわけですよね？となると、aの時の面積をI(a)
とするとP(z>a)=0.5-I(a)となりますよね？ということは
0.5-I(a)=0.1よりI(a)=0.4となります。この0.4を満たす実数を正規分布表
からみつけるんじゃないんでしょうか？

840 ：１３２人目の素数さん：2005/07/16(土) 20:02:00

>>818
回帰分析って…使い方間違ってないか？

841 ：１３２人目の素数さん：2005/07/16(土) 20:18:59

どなたか834お願いします。

842 ：１３２人目の素数さん：2005/07/16(土) 21:26:52

>>841
宿題は自分でやりましょう、余りに露骨なのはどうかと思います

843 ：829：2005/07/16(土) 21:32:43

返信ありがとうございました。
サイコロで考えてみると少しだけイメージがわいてきました。
サイコロは１～６の目の各目が出る確率が全て1/6で項目内では正規分布しませんが
仮に2回投げて出た目の総和を考えた時に合計点が正規分布するということでしょうか？
この場合の最小値2と最大12の出る確率はそれぞれ1/36で、7が出る確率は6/36ですよね。
これにより度数が増加することで正規性が増すと理解してもよろしいでしょうか？

しかし、質問紙検査などの結果においてこれは本当に証明されるのでしょうか？
具体例を探しているのですが適当な検査などありましたら教えて頂けないでしょうか？

844 ：１３２人目の素数さん：2005/07/16(土) 21:38:53

>>843
証明はできません、正しい結果であると仮定しても矛盾しないとこが示されるだけです、
したがって、結論できたからといって正しいという事にはなりません。
正しい結果を証明する方法は只一つ全数検査のみです。

845 ：１３２人目の素数さん：2005/07/16(土) 22:10:26

>>842
宿題じゃないんですが・・・。テスト勉強の不明点です。

846 ：１３２人目の素数さん：2005/07/16(土) 22:22:52

この夏休みの真っ只中にか？
うそっぺーーー

847 ：１３２人目の素数さん：2005/07/16(土) 22:57:19

>>846
ってか、まだ夏休みじゃないんですが・・・。

848 ：１３２人目の素数さん：2005/07/17(日) 01:01:15

平均値に関して質問。
２乗平均とか３乗平均とかあるが、これらn乗平均とはどんな時に使うものなのでしょう？

849 ：１３２人目の素数さん：2005/07/17(日) 01:08:05

>>848
広がり具合とか、ひねくれ具合とか、とんがり具合とか、ぐにゃぐにゃ具合とかを調べる。

850 ：１３２人目の素数さん：2005/07/17(日) 06:11:20

今，私は，専門ではないのですが，クラスター分析について勉強しています．
で，とある文献に「導類似性行列と階層的樹形図が作られるもとの類似性行列の対応する要素の間の
（ピアソンの）積率相関係数を計算することでこれらの行列の要素間の相関を調べることができる」
とあり，「この用途に用いられる積率相関係数のことを特にコーフェン相関係数と呼ぶ」
とあったのですが，この文章から，ピアソンの積率相関係数とコーフェン相関係数は
名前が違うだけで実際は同じものであるということは分かりました．
そこで，コーフェン相関係数について別の文献で調べたところ，

　　　　　　　　　　　　　　　　　Σｘｙ－(1/ｎ)(Σｘ)(Σｙ)
ｒ(X,Y)　＝　---------------------------------------------------------------
　　　　　　　{Σｘ^2－(1/ｎ)(Σｘ)^2}^(1/2) * {Σｙ^2－(1/ｎ)(Σｙ)^2}^(1/2)

↑がコーフェン相関係数であるとありました．
しかし，これはピアソンの積率相関係数である（XとYの共分散）/（Xの標準偏差＊ Yの標準偏差）
の式とは形が異なります．
ですが，実際に任意の２つの行列で値を当てはめて試したところ，どちらも全く同一の値を返してくるので
ピアソンの積率相関係数の式を変形したら，上記したコーフェン相関係数の式になるのだと思って式変形を
試みているのですが，どうもうまく同じ式になりません．
どなたか，ピアソンの式からコーフェンの式に変形できる方はいらっしゃいませんか？
いらっしゃいましたら，どうか変形の過程をご教授下さい　m(_ _)m
長々とすみません．

851 ：１３２人目の素数さん：2005/07/17(日) 06:26:09

>>850
分子に出てくる共分散=(1/n)Σ(Xi－(1/n)(ΣXj))(Yi(1/n)－(1/n)(ΣYj))
=(1/n)Σ{XiYj－Xi(1/n)(ΣYj)-Yi(1/n)(ΣXj)+(1/n)(ΣXj)(1/n)(ΣYj)
=(1/n)ΣXiYj－(1/n)ΣXi(1/n)(ΣYj)-(1/n)ΣYi(1/n)(ΣXj)+n(1/n)(1/n)(ΣXj)(1/n)(ΣYj)
=(1/n)ΣXiYj－(1/n)(1/n)(ΣXjΣYj)
分母に出てくるXの分散=(1/n)Σ(Xi－(1/n)(ΣXj))^2
=(1/n)Σ{Xi^2－2Xi(1/n)(ΣXj)+(1/n)^2(ΣXj)^2
=(1/n)ΣXi^2－2(1/n)ΣXi(1/n)(ΣXj)+n(1/n)(1/n)^2(ΣXj)^2
=(1/n)ΣXi^2－2(1/n)ΣXi(1/n)(ΣXj)+n(1/n)(1/n)^2(ΣXj)^2
=(1/n)ΣXi^2－{(1/n)(ΣXj)}^2
Xの二乗の平均から平均の二乗を引いたものになります。
分母に出てくるYの分散=(1/n)Σ(Yi－(1/n)(ΣYj))^2
=(1/n)ΣYi^2－{(1/n)(ΣYj)}^2
後は代入してください。

コーフェン相関係数ってあまり聞かないですね。

852 ：850：2005/07/17(日) 06:44:25

>>851
早速の回答ありがとうございます　m(_ _)m
本当に助かりました．

＞コーフェン相関係数ってあまり聞かないですね。
そうですね，ぐぐっても３，４件ぐらいしか出てきませんでしたし，
やっとの思いで見つけた文献にも数行しか書かれていなかったという始末；

853 ：１３２人目の素数さん：2005/07/17(日) 09:57:39

１７個のデータを用いて母分散の検定を行うとき、有意水準１％に対するχ^2分布の右側棄却域を求めよ。

これってどうやるんですか？

854 ：１３２人目の素数さん：2005/07/17(日) 09:58:51

833 名前：１３２人目の素数さん[sage] 投稿日：2005/07/16(土) 10:46:09
１７個のデータを用いて母分散の検定を行うとき、有意水準１％に対するχ^2分布の右側棄却域を求めよ。

これってどうやるんですか？

855 ：１３２人目の素数さん：2005/07/17(日) 10:14:45

>>854
わからないから聞いてるんですけど？

856 ：１３２人目の素数さん：2005/07/17(日) 13:42:46

>>853
17個の標本が正規分布に従っていると仮定する。

[分散未知の時]
このとき、帰無仮説H_0：σ^2=σ_0^2の下で統計量
Σ(X_i-Xbar)^2/σ_0
は自由度n-1のカイ二乗分布に従う。

[分散既知μの時]
このとき、帰無仮説H_0：σ^2=σ_0^2の下で統計量
Σ(X_i-μ)^2/σ_0
は自由度nのカイ二乗分布に従う。

ということを使います。
後は教科書の巻末のカイ二乗分布表を見てください。

857 ：１３２人目の素数さん：2005/07/17(日) 13:43:55

>>856で
統計量の分母に二乗忘れました。

858 ：１３２人目の素数さん：2005/07/17(日) 22:17:46

Y=1 Y=2 Y=3
X=1 0.2 0.2 0.2
X=2 0.3 0.2 0.1
Xの周辺分布、Yの周辺分布、Xの平均、Yの平均、XとYの共分散
の求め方を教えてください。教科書を見たりネットで調べたけど分かりませんでした。お願いします。

859 ：１３２人目の素数さん：2005/07/17(日) 22:20:16

　　　Y=1 Y=2 Y=3
X=1 　0.2 　0.2 　0.2
X=2 　0.3 　0.2 　0.1
表がうまくかけませんでした。ごめんなさい。理解していただけるでしょうか？

860 ：１３２人目の素数さん：2005/07/17(日) 23:30:53

>>858
>教科書を見たりネットで調べたけど分かりませんでした。
たちの悪い冗談はやめてください。

861 ：１３２人目の素数さん：2005/07/18(月) 01:18:14

>>860
くだらない冗談を書くほど暇人ではないんです。真剣です。
あと、表は書き間違えてました。X=2,Y=1のところは0.1です。
まず、「Xの周辺分布を求めよ」って言われたときに何を出せば良いのか分からないんです。
P(X=1),P(X=2)をそれぞれ出すのでしょうか？
もしそうであれば、P(X=1)=0.2+0.2+0.2=0.6,P(X=2)=0.1+0.2+0.1=0.4で合ってますか？
あと、「Xの平均」は1*0.6+2*0.4=1.4で良いんでしょうか？
教科書とかネットの書き方が私にとったら分かりづらくて、
これは私なりに考えた結果なんで、合ってるかどうかだけでも教えていただきたいです。
親切な方、お願いします。

862 ：１３２人目の素数さん：2005/07/18(月) 05:52:58

>>861
書き込みしたところまでは合っています。

863 ：１３２人目の素数さん：2005/07/18(月) 07:25:48

>>861
はじめからそう書けばいいんだって

864 ：１３２人目の素数さん：2005/07/18(月) 10:12:21

X件法Ｙ項目の検査の各項に対する回答がせいき分布に従わなくても、
検査の合計点がせいき分布にきんじするのはなじぇ？

865 ：１３２人目の素数さん：2005/07/18(月) 12:25:37

>>864

チリが積もって山となっているのです。

866 ：１３２人目の素数さん：2005/07/18(月) 12:38:47

>>862-863
すいません、ありがとうございました。

867 ：１３２人目の素数さん：2005/07/18(月) 17:10:39

868 ：１３２人目の素数さん：2005/07/18(月) 19:12:35

>>867
なんで(2)が分かって(3)が分からないのか
分からない…

(2)で企業数が３と言っているから、それを20にして話を
逆に辿れば(3)の答えが出るんじゃない？

正規確率表の横軸から見るのと横軸からみる問題ですね。

う～～ん、試験問題に出しますか。

869 ：１３２人目の素数さん：2005/07/18(月) 21:44:09

>>868
レスありがとうございます。ちょっと計算してみたんですが、これってはっきり例えば750m^3みたいな答えはでませんよね？例えば600～700みたいな感じですか？

870 ：１３２人目の素数さん：2005/07/18(月) 23:32:01

人種Ａの頭蓋骨の長さは、平均190mm,標準偏差8mmの正規分布に従い、人種B
の頭蓋骨の長さは、平均196mm,標準偏差8mmの正規分布に従う。いま新しい発掘
の結果１２個の頭蓋骨が発見され、それらはある理由から人種Ａに属するらしいと考え
られた。標本平均はXバー＝194mmであった。標本の頭蓋骨が人種Aに属するという反説
を有意水準５％で片側検定せよ。この場合、対立仮説は、標本の頭蓋骨が人種Bに
属するとして考えよ。
これ、どうやってとけばいいんでしょうか？

871 ：１３２人目の素数さん：2005/07/19(火) 09:38:14

>>869
876.9277という値が出てきました。
877社じゃない？

872 ：１３２人目の素数さん：2005/07/19(火) 18:58:07

統計の問題でつまずいています。
どうか手助けを･･･

日本の成年男子の身長　ｍ=165 σ=6　
標準的な鴨居の高さを177とする
日本の青年男子の中で鴨居に頭をぶつける可能性のある人は何％か？

私の回答
177≦Z　Z＝(177-165)/36＝0.33
正規分布表よりP＝0.3707　　　よって37%
となりましたが37％もいるはずないのは明らかです。
どこを間違えたのか教えてください。

873 ：１３２人目の素数さん：2005/07/19(火) 19:17:08

>>872
Z=(177-165)/6ですね。
P=0.02275013なので2.2%位ですね。

874 ：１３２人目の素数さん：2005/07/19(火) 19:24:38

>>873
σで割るんですね！どうもありがとうございます

875 ：１３２人目の素数さん：2005/07/19(火) 19:37:21

A君とB君がじゃんけんをした。
Aの勝敗が5勝1敗のときA君の方がB君よりじゃんけんが強いといえるか？
この解き方も教えてください。お願いします。
　　　

876 ：１３２人目の素数さん：2005/07/19(火) 20:24:49

片側検定でも両側検定でもZcalの公式は変わりませんよね？

877 ：１３２人目の素数さん：2005/07/19(火) 20:30:08

876ですが
というよりもZcalを使う母分散既知の検定に
片側検定もありますか？

878 ：１３２人目の素数さん：2005/07/19(火) 20:47:55

健常成人男子白血球数の標準正常値は5100±1100(標準偏差)である。
従業員135人の白血球数の平均は4900であった。
従業員の白血球数は標準値に比べて低いか。

この場合の帰無仮説は何て立てればよいでしょうか？
H。：標準値より低い　　でいいのですか？
お願いします、教えてください

879 ：１３２人目の素数さん：2005/07/19(火) 22:26:48

帰無仮説
文字通り無に帰してほしい仮設。つまり欲しい結果の否定

880 ：１３２人目の素数さん：2005/07/20(水) 00:21:36

>>878
キム仮説は
「標準値と等しい」
「標準値と等しいか標準値より高い」
のどちらかでよいとおもいますが。

881 ：１３２人目の素数さん：2005/07/20(水) 01:05:21

ある市役所では、これまで、数年間銘柄Ａの電球を購入していたが、銘柄Ｂの電球の
ほうが価格が安いのでＢへの切り替えを検討中である。
銘柄Ｂのセールスマンは、銘柄Ｂの電球は銘柄Ａの電球と同じ品質であると主張している。
さて、数年間の経験によれば、銘柄Ａの平均寿命は１１８０時間で、標準偏差は９０時間
であった。無作為標本として、銘柄Ｂの電球を購入して試験すると、
標本平均は、Ｘバー＝１１４０、標本標準偏差はｓ＝８０であった。
銘柄Ｂの電球の平均寿命が銘柄Ａの電球の平均寿命に等しいという仮説が正しいかどうか検定せよ。
対立仮説は、銘柄Ｂの電球の平均寿命が銘柄Ａの電球の平均寿命よりも短いとせよ。
有意水準５％で片側検定を行え。
って問題なんですけど
これ、銘柄Ａ、Ｂのサイズがわからないので標本平均の差の分布の公式が使えないのですが
どうやって計算すればいいのでしょうか？

882 ：132人目の素数さん：2005/07/20(水) 10:26:50

>>871
俺の計算

20÷120=0.166666・・・・
で、I(z)=0.5-0.167=0.333

X-756/125=0.96よりXは876になった。
どう？

883 ：１３２人目の素数さん：2005/07/20(水) 22:05:32

>>882
871の計算はRというソフト使っています。
精度の話ですね。
正規確率表使っているなら８７６で良いんじゃない。

どうして(X-756)/125と括弧入れないの？
何か変な感じがします。

884 ：132人目の素数さん：2005/07/20(水) 22:18:46

すいません・・。括弧つけてなかったです、、。レスありがとうございました。

885 ：１３２人目の素数さん：2005/07/21(木) 13:35:17

>>878
帰無仮説：標準値と同じである。
対立仮説：標準値より低い。
です。

886 ：１３２人目の素数さん：2005/07/21(木) 13:38:27

>>881
その前に分散が等しいかどうかの検定しなきゃ。
90時間と80時間を同じと見なすのは危険ですね。
でも、標本数が無いので検定できません。
何か移し間違えでは？

887 ：881：2005/07/21(木) 14:06:55

>>886
標本のサイズが大きい場合ならσ二乗＝ｓ二乗で置き換えてもいいけど
標本のサイズが小さい場合は差が大きすぎてできないってことですよね？
９０時間、８０時間と差は結構離れてるので標本サイズは小さい感じかな
この問題は、大学の講義資料として配られたプリントに書いてある問題なんですが
一字一句間違えずに移しました。
もしかしたら先生の問題作成ミスかもしれません
標準偏差と標本標準偏差が両方記されてるので、もしかしたら
別の公式かなにかで、それらを使って標本サイズを求めるとか
いきなり標準誤差を出すとかできるのかなあと思ったんですが。。

888 ：１３２人目の素数さん：2005/07/21(木) 23:21:28

普遍分散と普通の分散ってどのように使い分けて、覚えていますか？というか何が違うのですか？
n-1で割るのか nかの違いとか微妙でいまいち解っていません。

クソな質問ですがアドバイスください。お願いします。

889 ：１３２人目の素数さん：2005/07/22(金) 06:02:55

>>888
正規母集団からの標本を使って分散を計算するとき

平均が既知の場合はnで割る。

平均が未知の時は未知のものを標本平均で置き換えるので
n-1で割る。
このとき計算される標本分散に(n-1)/σ^2を掛けると
自由度n-1のカイ二乗分布に従う。
よって、σ^2の不偏推定量となる。

890 ：１３２人目の素数さん：2005/07/22(金) 18:16:29

>>888
平均が既知でないときもnで割ります。
これは不偏分散にならないので、推定・検定では
用いられません。
でも、標本分散を計算しなさい、と言われたら
困ってしまいますね。
nで割ったものとn-1で割ったものをちゃんと
分けて丁寧に書けば、×を付けられることないです。

891 ：１３２人目の素数さん：2005/07/23(土) 17:31:15

質問です。
階級代表値って何のことを指してるのですか？
155-165
165-175
175-185
ってかんじなのですが・・・

892 ：891：2005/07/23(土) 17:36:39

真ん中ってことなんでしょうか？
それしかないかなーとは思うんですが。。

893 ：確立統計難：2005/07/23(土) 23:07:54

教えてください。
確立変数X,Yが標準正規分布に従うときZ=X-Yの従う分布をZの積率母関数
求めることによって求める問題なんですが、どうすればいいでしょうか？？とりあえず、X,Yの積率
母関数ｍ＝exp(t^2/2)は求めたんですが・・・・

894 ：１３２人目の素数さん：2005/07/24(日) 06:59:32

>>893
m_{X-Y}(t)=E(exp(t(X-Y)))
=E(exp(tX))E(exp(-tY)) (XとYが独立なので)
=exp(t^2/2)exp(t^2/2)
=exp((√2t)^2/2)

895 ：１３２人目の素数さん：2005/07/24(日) 07:46:11

>>893
894は独立性を仮定しています。
独立性の無い場合ですから、
(X,Y)の積率母関数を計算。
それからX-Yの積率母関数を計算。
です。

896 ：１３２人目の素数さん：2005/07/24(日) 08:07:47

小学校、中学校、高校受験をする人がそれぞれどの位居るかわかりますか？

897 ：確立統計難：2005/07/24(日) 14:04:11

答えていただいた方、本当に助かりました！！また質問すると思うので是非よろしくお願いします。。

898 ：１３２人目の素数さん：2005/07/24(日) 14:59:15

どなたか、「分割表における独立性」を説明しろと出たら、どう書けばよいのか教えて下さい。お願いします。

899 ：１３２人目の素数さん：2005/07/24(日) 23:01:29

どなたかこの問題解いてもらえないでしょうか？＞＜
俺の頭じゃ解けなくて。。ちなみに明日は統計のテストなんです。。
できれば解き方も教えてくれると助かります。

□問題□
ある年の国税調査によれば、核家族世帯を次の４つの累計にわけるとき、
その割合は、
【夫婦だけ】　【夫婦と子供】　【父親と子供】　【女親と子供】
　　20.7　　　　　69.8　　　　　　　1.4　　　　　　　8.1　　(%)
であるという。次のデータは、ある地域に住む核家族世帯の内訳である。
全国的な標準にあっているか、帰無仮説、対立仮説を明示して検討しなさい。
【夫婦だけ】　【夫婦と子供】　【父親と子供】　【女親と子供】
　　201 　　　　　　294 　　　　　　5 　　　　　　　20　(世帯）
ただし、ｘ二乗表より、
x^2(4, 0.05)=9.49
x^2(3, 0.05)=7.81である。

900 ：１３２人目の素数さん：2005/07/27(水) 03:37:32

「統計の誤用の原因と誤用を防ぐ手段について述べよ」

これどのように解答すればよいのでしょうか…？

901 ：１３２人目の素数さん：2005/07/27(水) 06:25:39

>>900
http://www.okayama-u.ac.jp/user/le/psycho/member/hase/articles/1994/9407Hasegawa/9407Hasegawa.html
とか
統計でウソをつく法
とか

902 ：１３２人目の素数さん：2005/07/27(水) 21:31:44

>>891
>階級代表値って何のこと．．．
どこの教科書に出てたんだ？ふつうには真ん中の値だろう。
代表値ってのは、文字通り分布を代表する値の総称。具体的には
平均値、中央値、最頻値、最小値、最大値の総称。前３者の総称が
中心値。

903 ：１３２人目の素数さん：2005/07/27(水) 21:39:24

某板よりｗ

ある機械部品の外径寸法の規格が28.00±0.75mmで
与えられている。
切削工程での寸法の分布は平均28.27mm、標準偏差0.294mm、
の正規分布にしたがっている。

これの不良率はどうすれば求められるんでしょう

904 ：１３２人目の素数さん：2005/07/28(木) 09:28:36

>>902
階級代表値はclass markの訳
代表値はcharacteristicsの訳。
だから、本によっては特性値とかもある。

ところで、中心値の英語は何？

中心の尺度とか、中心傾向とかは聞くけど、
中心値は初めて聞きました。

教えてください。

905 ：１３２人目の素数さん：2005/07/29(金) 12:57:20

すいません、なんで無作為標本って互いに独立で同じ確率分布に従うのですか。例えば母集団がnの数から構成されているとすると
１回目の抜き出しは母集団分布そのままだと思うのですが２回目は母集団がn-1
の大きさだから２回目の確率分布は母集団分布と異なるのではないでしょうか？

906 ：１３２人目の素数さん：2005/07/29(金) 13:54:11

587 ：名無しさん＠３周年：2005/07/29(金) 12:12:49 ID:2VhBYmtN
東洋占いと風水はいっておくけど統計学だぞ。だから、確率論。

西洋風水は迷信とかまじないレベルだが

http://life7.2ch.net/test/read.cgi/psy/1113117911/587

----
これマジですか？

907 ：１３２人目の素数さん：2005/07/29(金) 13:58:16

どなたかファンヒーレの学習水準理論について解説してください。

908 ：GSX774R：2005/07/30(土) 01:39:25

Rについてですが、試行数30、成功確率0.3の二項分布を標準化して正規近似することによって、成功数がｘ回以下となる確率の近似値を求め、それを図示しろという問題なんですがよくわかりません。誰か教えてください。

909 ：１３２人目の素数さん：2005/07/30(土) 10:00:58

>>908
x<- 0:30
plot(x,pbinom(x,30,0.3),type="l")
で二項分布の累積確率分布が書けます。
これに
lines(x,pnorm(z),col="red")
で正規分布の累積確率分布を重ね合わせます。
zについては考えてちょ。

910 ：１３２人目の素数さん：2005/07/30(土) 21:49:23

概収束と確率収束の違いの
イメージを教えていただけないでしょうか。

911 ：GSX774R：2005/07/31(日) 01:56:51

>>909
なるほど下側確率の意味を考えるとそれはいいですね。参考にします。

912 ：909：2005/07/31(日) 03:03:28

>>911
「成功数がｘ回以下となる確率の近似値」と言っているから
下側確率を求めています。

913 ：１３２人目の素数さん：2005/07/31(日) 11:05:25

すみません。Excelの近似曲線の選択方法について教えて下さい。
線形近似・対数近似・多項式近似・累乗近似・指数近似といろいろありますが、
どういった場合にどの近似曲線を選べばよいのか、よく分かりません。
とりあえず全部試してみて、R-2条値が最も良いものを選択すれば良いのでしょうか？

914 ：913：2005/07/31(日) 11:17:45

横軸に入院日数を、縦軸に入院単価をとり、入院日数と入院単価の関係を
グラフにしようとしています。
入院日数が長くなると入院基本料というものが下がるので、右肩下がりになる
のは初めから分かっています。

915 ：１３２人目の素数さん：2005/07/31(日) 12:15:42

>>910
おれっちは
概収束は、確率空間の零集合以外ですべて収束する
ようするに、確率空間について考えている物
確率収束は確率変数間の差の絶対値が0以外の確率となる確率が0
ようするに、確率変数について考えている物
とか理解しています～

916 ：１３２人目の素数さん：2005/07/31(日) 13:59:58

新公認会計士試験を受けるものです。選択科目に新たに統計学が加わり、
数学のエキスパートの皆さんにお聞きしたいのですが、
初学者向きの統計の参考書について教えてください。
他の文系受験生と差をつけたいんです。
良かったらサンプル問題も見てください。

917 ：１３２人目の素数さん：2005/07/31(日) 18:00:36

600世帯を調べて、視聴率が10％である場合
全国の平均視聴率Pは信頼度95％で
P＝10％±1.96√(0.1*0.9)/600　となり
7.6％～12.4％と推定されるわけですが（ビデオリサーチ社より）

各目が1/6であるサイコロを600回振った場合
1の目が出る回数ｍ’は信頼度95％で
ｍ’＝100±1.96√(600*1/6*5/6)　となり
78.5回～121.5回という推定で合っていますか？
（1/7.64～1/4.93　母平均＝1/6.00）

これ、結局
標本平均から母平均を推定する場合も
母平均から標本平均を推定する場合も
同じ式を使うということなんでしょうか？

918 ：１３２人目の素数さん：2005/07/31(日) 18:08:07

サイコロを振ったときの分布は二項分布に従う（１の目が出るor出ない）
その二項分布の分散σは√ｎ*P*(1-P)
σ＝√600*1/6*5/6　＝　11.0（回）
正規分布に近似することにより、平均回数ｍ’は
ｍ’＝100回±1.96σ

そんな安直に正規分布に近似していいのだろうか・・・
他にもｔ分布とかF分布とかあるけどよく分からないし

919 ：913：2005/07/31(日) 18:19:25

最初のうちは単価が大幅に減り、その後は緩やかに減少することが予想されるのですが、
対数近似でよろしいでしょうか？

920 ：913：2005/07/31(日) 18:29:14

また、入院日数の値ひとつに対して入院単価の値が複数存在します。
入院日数が20日の時の入院単価のデータが複数ある、といった具合です。

921 ：１３２人目の素数さん：2005/07/31(日) 18:46:06

>>918
中心極限定理が関係してるんじゃ？

922 ：913：2005/07/31(日) 18:55:35

関数を使った方がいいんでしょうか？

923 ：１３２人目の素数さん：2005/07/31(日) 20:15:01

「日本の男性は平均171cm、分散8cmの正規分布に従い
日本の女性は平均160cm、分散6cmの正規分布に従うとします。
このとき男性、女性おのおの一人ずつを任意に選んだとき
男性のほうが大きい確率を求めよ。」
という問題について質問します。

ぼくなりの解法は以下の通りです。
男性の分布の式をf(x)、女性の分布の式をg(x)とする。
男性を任意に一人選んだときその人の身長がtcmである確率は
f(t) * △t。
また選んだ女性の身長がtcmを超えている確率は
∫（tから∞まで）g(x) dx。
これをtについて-∞から+∞まで積分すれば求めたい確率が出る。
よって答えは
「∫(-∞から+∞まで)　f(x)*{∫(ｔから+∞まで)g(x)dx}　dt」
となる。

でもこれだと手計算だと出来ないですよね。
（∵fやgの不定積分が出来ない。）
このあたり何か簡潔な計算の方法ってあるのですか？

そしてもうひとつ。
このような問題について解説の載っているサイとって無いですか？

ちょっと込み入っていますがよろしくお願いします。

924 ：１３２人目の素数さん：2005/07/31(日) 22:43:36

>>913
ちゃんとやるならモデル選択の勉強が必要。でも、そもそも何をしたいのか・・・
減少傾向を示したいだけなら直線あてはめで十分と思われ。
最初のうちは入院単価が急激に減少して途中から減少がゆるやかになる、という曲線傾向を示したい
のなら、二次関数とか指数関数なんかをあてはめてみては？

>>917, >>918は同一人物？
>そんな安直に正規分布に近似していいのだろうか・・・
n=600、p(true)=1/6なら、カナーリ正規分布に近似と思われ。

>>924
単に（男子-女子）の分布を求めて、０にかかっているか検定するだけちゃう？
正規分布の結合法則は知っているよな？

925 ：924：2005/07/31(日) 22:45:08

>>924
それは問題なかろ・・・といってもグラフを見ないとわからんが。

926 ：925：2005/07/31(日) 22:49:23

>>920　ね。

927 ：913：2005/07/31(日) 23:31:15

急性期の病床の入院基本料（病院にとっては収益）が段階的に引き下げられる
のに対して、亜急性期病床の入院基本料は一定です。
亜急性期の入院基本料の方が高いのですが、急性期の病床では診療にかかった
費用として請求できるものでも
亜急性期の病床では入院基本料に含まれていて請求できないものがかなりある
ため、入院初期は急性期の病床の方が収益が高くなります。
私が知りたいのは、急性期の病床の収益が亜急性期の病床の収益を下回るのは
何日目あたりか、ということです。

928 ：913：2005/08/01(月) 00:01:34

経験曲線ってありますよね？
あんな感じになると思うのですが・・・。

929 ：923：2005/08/01(月) 00:06:32

>>924
二つの「山」の重なっている部分が答えと言うことでいいのですね
そういわれればそうです
どうもありがとうございました

（「正規分布の結合法則」についてはよく分かっていません
ググって見てもイマイチよく分からないので
明日あたり図書館に行って調べてきます）

930 ：924：2005/08/01(月) 00:21:30

>>905
普通の標本理論では無限母集団を仮定しているから、
1回目と2回目は同じ母集団に従うとみなす。有限母集団を
仮定する場合もあるけど、その場合はもちろん貴方のいうとおり。

>>928
うー。よくわからんですけど、その分野(経済学？）でよく使われている曲線であてはめるのが
いいんじゃないでしょうか。これは統計学が答えられる問題じゃないように思います。

931 ：913：2005/08/01(月) 00:55:47

>>924
そうしてみます。
私には難しい問題ですが、頑張って答えを出してみます。
親切にありがとうございました。

932 ：１３２人目の素数さん：2005/08/01(月) 01:50:09

600世帯を調べて、視聴率が10％である場合
全国の平均視聴率Pは信頼度95％で
P＝10％±1.96√(0.1*0.9)/600　と思っていましたが

標本から母分散を推定する場合は
標本分散ではなく普遍分散を使って
P＝10％±1.96√(0.1*0.9)/(600-1)　なんじゃないですか？

ビデオリサーチ社が間違ってるのか、私が間違ってるのか
もしくは、599≒600と近似してるのか、どれでしょうか？

933 ：１３２人目の素数さん：2005/08/01(月) 02:02:20

>>915

言葉をヒントに考えてみます。
ついでに、分布収束、covergence in mean, convergence in mean square
のイメージも教えていただけないでしょうか。

934 ：924：2005/08/01(月) 13:36:15

>>929
結合法則、という言葉が悪かったかも。スマソ
X　～　N(171,8)
Y ～ N(160,6)
のとき
X-Y ～ N( ?, ?)
はどうなるか、ということ。かなり基本。

935 ：923：2005/08/01(月) 15:48:59

>>934
あ～なるほど～
X-YはN(171-160,8+6)なのでN(11,14)ですよね。
これが0よりも小さい部分は正規分布の表によると22％です。
よって女性の方が高い確率は22％というわけですね。

結合法則ではなく「再生性」と教わっていたので混乱してしまいました。
あらためてありがとうございました。

936 ：923：2005/08/01(月) 15:51:46

改めて>>924をみ直してみると「（男子-女子）の分布」を
「男子マイナス女子の分布」ではなく「男子ハイフン女子の分布」読み違えていたので
男子の物と女子の物とを別々に作る物と勘違いしていました

937 ：１３２人目の素数さん：2005/08/01(月) 20:52:01

自己解決しました。誰も答えてくれないので・・・

600世帯の視聴率を調べて、標本平均が10％である場合
標本分散ｓは　600*10％*90％
不偏分散μは　600*10％*90％　*　600/599

標本の不偏分散は母分散の不偏推定値であるので
母分散σ＝不偏分散μ　となる

全国の平均視聴率Pは自由度599のｔ分布に従うので
P＝10％±ｔ√(10％*90％)/599　となる
自由度599の場合、ほとんど正規分布と等しいと近似できるので
ｔ分布表より信頼度95％のとき、ｔ＝1.96　となり
P＝10％±1.96√(10％*90％)/599　が導かれる

938 ：１３２人目の素数さん：2005/08/01(月) 21:12:04

>>933
分布収束はそのまんまですよ～
分布が一致しているという事です。

covergence in mean, convergence in mean square
英語苦手・・・所詮高卒が背伸びしているので、間違ってたらすんません
辞書引いてみたら、平均とか収束とか書いてあるのできっとそれに違いないという所でk乗ノルム収束って事にしときます。
これは幾何的に考えたほうが分りやすいかも。
確率変数の実現値の無限次元ベクトル、なんとなくわかりにくいので 2 個とりだして 2 次元として
{ Y(ω1) , Y(ω2) }
てな物を作って確率変数 Xi が、これに収束するところを考えればいいのだから、とどのつまり k 乗平均収束は
0 = lim( i→∞ )( | Xi(ω1) - Y(ω1) |^k + | Xi(ω2) - Y(ω1) |^k )^(1/k)
二乗の場合は
lim( i→∞ )√( | Xi(ω1) - Y(ω1) |^2 + | Xi(ω2) - Y(ω1) |^2 )
ようするにユーグリッド距離です、地点A から地点B までの普通の距離です、「確率変数の列」と「収束先の確率変数」の距離の何乗かが0に収束しますという事です。
これがそのまま無限次元までどかーんと伸びる訳です。
注意しないといけないのは、無限次元まで増えると、有限個程度なら一致していない確率変数があっても一致しているという事になってしまいます。

939 ：１３２人目の素数さん：2005/08/01(月) 21:22:11

940 ：１３２人目の素数さん：2005/08/01(月) 21:48:51

>>938
{X_n}：確率変数の列
{X_n}が分布関数Fに収束するとは
Fの連続点xに対して
lim(n→∞)P{X_n<=x}=P{X<=x}
が成立することです。
（不連続点は収束しなくてもいい）

二乗収束は
E(X_n-X)^2→0 as n→∞
です。

P. Billingsley
Convergence in Probability Measure
とか、読むといいよ。

941 ：１３２人目の素数さん：2005/08/01(月) 21:54:12

>>940
あっどもです、平均収束の定義は違ってたんだ・・・
参考になりました。

942 ：１３２人目の素数さん：2005/08/01(月) 22:09:43

>>940
すみません、ちょっとだけ確認させてもらってもいいですか？
E(X_n-X)^2→0 as n→∞
は
E( (X_n-X)^2 )
それとも
( E(X_n-X) )^2
どっちでしょうか？

943 ：：2005/08/01(月) 23:09:17

E( (X_n-X)^2 )　の方。

944 ：１３２人目の素数さん：2005/08/02(火) 01:40:24

>>932
もう見ていないかもしれんが・・・

（n-1）にする必要はないでしょう？なぜ（n-1）にするのですか？

二項分布の正規近似に関しては「ラプラスの定理」でぐぐってみれ。
小針[isbn:4000051571]の5章には証明がある。厳密な証明は意外と複雑。

945 ：１３２人目の素数さん：2005/08/02(火) 01:44:57

>>944
>>937に書いたスチューデントのｔ分布は合っていますか？

946 ：１３２人目の素数さん：2005/08/02(火) 10:15:51

>>945
つ　www.kwansei.ac.jp/hs/z90010/sugakuc/toukei/nikou/nikou.htm

947 ：１３２人目の素数さん：2005/08/03(水) 01:45:17

すみません。どなたか教えてください。

サンプルを抽出する際に、母集団の大きさがどれだけであれ、25個抽出すれば
90%以上の信頼性（母集団を代表する点で）を得られると聞いたのですが、これは
統計学の世界ででそう言えるのでしょうか？？　どこを勉強すればよいか教えて
いただければ、それを目標に統計学の勉強をしたいです。

948 ：１３２人目の素数さん：2005/08/03(水) 02:02:05

ｔ分布の自由度の意味を取り違えてました。
６００世帯をサンプリングしたなら標本数ｎ＝６００というだけで
自由度は１
東京で６００世帯、大阪で６００世帯、名古屋で６００世帯を調査したなら
自由度は３
そういうことですね？

949 ：１３２人目の素数さん：2005/08/03(水) 12:33:18

ケッケッケ、演繹的に行こうぜ

950 ：１３２人目の素数さん：2005/08/03(水) 13:52:37

>>947
普通に統計学入門をやればゴールはそういうのを考える内容になってるよ、いわゆる推定・検定って奴です。
ちなみに、その問題は母集団の分布次第です。
例えば、宝くじの様な物を考えて、当たりくじ一本、ただし、とてつもなく大きい賞金で平均が0よりかなり上になるような分布を考えると・・・・
この場合25本程度では何も推定できなかったりしたりします。

951 ：１３２人目の素数さん：2005/08/03(水) 15:14:30

test

952 ：１３２人目の素数さん：2005/08/03(水) 15:16:25

数量化１類というのは英語の論文でもよく使われてるのでしょうか？
使う場合、どういう英語名になるんでしょうか？

953 ：１３２人目の素数さん：2005/08/03(水) 20:49:51

>>950

丁寧な回答ありがとうございました。安心して入門書を買って勉強できます。
母集団の分布次第というご指摘も念頭において進めますね。重ね重ねありがとう
ございました。

954 ：１３２人目の素数さん：2005/08/03(水) 21:13:32

>>947
平均値のことですか？
中心極限定理のとこかな。

>>948
二項分布の母比率の推定・検定にt分布は使いません。
だから自由度を考える必要もありません。

>>952
数量化○類というのは日本ローカルな分け方だったような・・・
ちょっとくどいけど「独立変数が全部ダミー変数な重回帰」といえば確実かも。

955 ：１３２人目の素数さん：2005/08/04(木) 00:38:45

統計を使うのではなくて
統計を作る方で最新の理論が公表されているサイトをお教え下さいな

956 ：１３２人目の素数さん：2005/08/04(木) 01:16:39

やっと謎が解けました
結論：ビデオリサーチ社は間違っている

あらかじめ全国の全世帯を調査して母比率Pが10%と分かっている状況で
そこから600世帯の標本を取り出したのなら、標本平均P’は信頼度95%で
P’⊆10%±1.96√10%*90%/600　以内の数値になることが期待できるが

母比率も母分散も何も分からない状況で600世帯の標本を取り出し
標本平均P’が10%になったからといって、母比率Pの取りうる範囲を
P⊆10%±1.96√10%*90%/600　と推定することはできない

そもそも
標本平均から母平均を推定する式　と
母平均から標本平均を推定する式　が同じになるはずがない

957 ：１３２人目の素数さん：2005/08/04(木) 01:46:26

>>955
統計は場当たりだよ、一にも二にも現場主義
実験、医療、相場、保険と現場で使われている最新の論文とって来い
もしくは自分で作る

958 ：１３２人目の素数さん：2005/08/04(木) 01:49:39

スチューデントtもビール工場発ですね

959 ：１３２人目の素数さん：2005/08/04(木) 05:50:31

２変量正規分布の持つ共分散はどういった意味があるのでしょう？
１変量の場合はイメージできたのですが、２変量になってイメージができなくなりました。
どなたか、御教授願います。

960 ：：2005/08/04(木) 06:38:01

>>959
二変量に限らず、多変量での共分散は、二つの確率変数（X、Y）がどちらの方向（＋、ー）に線形関係（Y=aX+b）を持っているかを数値化したものです。
二つの確率変数に線形関係がなければ、共分散は０。＋の線形関係だと、
共分散は正、ーの線形関係だと、共分散は負となります。
ただ、共分散の数値から線形関係がどれだけ強いかということは判断できませんが、その場合、相関係数で線形関係の強弱はわかります。

イメージとしては、X（たとえば、体重）とY（身長）をグラフにするとき、
平均体重を上回る人が同じく平均身長を上回る傾向が強ければ、グラフは右肩上がりになり、共分散は正になります。

もう一つ、二つの確率変数が独立の場合、共分散は常に０。しかし、
XとYとの間に相関関係（線形関係）がなくても必ずしもXとYが独立であるとは
言えません　（例外：正規分布）。

961 ：１３２人目の素数さん：2005/08/05(金) 09:50:04

全くの初心者です。

問．2群における製造量の差を検定する場合、帰無仮説H0と対立仮説H1の組み合わせに関して
正しいものはどれか。

a.H0:群間に差がない、H1:群間に差がある
b.H0:群間に差がある、H1:群間に差がない
c.どちらでもよい

「無に帰したい」方を帰無仮説にするわけですよね？
ただ単に差の有無を見たいときってどっちをH0にしてもいいんですか？

962 ：１３２人目の素数さん：2005/08/05(金) 11:37:38

aかな…
bだったら棄却域の定め方がわからんのですが…

963 ：１３２人目の素数さん：2005/08/05(金) 11:53:39

>>961
aだよ。
「H0が正しいときにH0を正しくないと判断する確率」
を小さい値（1%とか5%とか）に固定して（これを有意水準という）、
「H0が正しくないときにH0を正しいと判断する確率」
をなるべく小さくする、というのが検定のスタンス。

前者は固定した値にするから、値が計算できなきゃいけない。
群間の差の値によって確率は変わるわけだから、H1のように群間の差が固定されていない仮説は帰無仮説にはできないんだね。

H0:群間に差がない、H1:群間の差が1である
なんて場合はどちらを帰無仮説にしても検定はできる。少し性質は異なってくるけどね。

964 ：961：2005/08/05(金) 19:52:01

>>962-963
ありがとうございます。勉強になりました。

965 ：１３２人目の素数さん：2005/08/06(土) 01:55:24

二項分布からの近似に必要な条件をシミュレートしてみました

二項分布→ポアソン分布
　条件：Pが十分に小さいこと、1/30以下

二項分布→正規分布
　条件：N*Pがある程度大きいこと、30以上

大体合っていますか？

966 ：１３２人目の素数さん：2005/08/06(土) 10:46:49

　小針本には「(二項分布を正規分布に）近似するときのメドは、普通’Np≧5, N(1-p)≧5’ぐらいであると
いわれている・・・しかし’Np≧4, N(1-p)≧4’でよいという人もいる・・・」
と書かれています。
　しかし上の記述は手計算を楽にする意味で書かれたもので、パソコンが普及した今では
近似せずに直接計算しても大した手間はかからないですね。

967 ：１３２人目の素数さん：2005/08/06(土) 12:44:14

ポアソン分布は自然対数eの定義からも
Pが十分小さくないと近似できないことは想像できます。

正規分布はNP≧5ということは
大体、確率分母の5倍以上のサンプル数が必要ということですね。
これは中心極限定理で証明するんでしょうか？

968 ：１３２人目の素数さん：2005/08/06(土) 13:46:00

>>967
「大体、確率分母の5倍以上のサンプル数が必要ということですね。」
どういう意味か分かりません。

二項分布を直接展開して、Stirlingの公式を使えば、
正規分布との近似が評価できます。

中心極限定理とか言うと、Berry-Esseenの定理とか
使って、証明するのでしょうが、こちらの方が精度
悪そうですね。単に、直感ですが。

969 ：１３２人目の素数さん：2005/08/06(土) 14:17:33

偏回帰係数の標準偏差について
・何を表すか
・どんな性質があるか

　数学苦手なのでよくわかりません・・・　
模範解答としてはどのようなものが考えられますか？

970 ：１３２人目の素数さん：2005/08/06(土) 19:00:47

>>960
>XとYとの間に相関関係（線形関係）がなくても必ずしもXとYが独立であるとは
>言えません．．．．
独立と言えないって、どういう時なんですか。XとYに関係無し==必ず独立では？

971 ：１３２人目の素数さん：2005/08/06(土) 19:19:18

>>935
>正規分布の．．結合法則ではなく「再生性」と教わっていた．．．．
俺は、加成性と習ったが。教科書によって、用語が違うのか？

972 ：969：2005/08/06(土) 20:27:00

問題の全文は
最小二乗法によって求められる偏回帰係数の標準偏差が何を表し、どのような性質をもつのか。
また、自室的な多重共線関係の意味を偏回帰係数の標準偏差と関係付けて説明しなさい。

です。

973 ：１３２人目の素数さん：2005/08/07(日) 19:37:36

三百日。

974 ：：2005/08/08(月) 08:27:10

＞＞９７０
XとYに何も関係がなければ、独立。
XとYに相関関係がない（共分散＝０）は必ずしも独立ではない、と言う事です。
相関関係は単に線形関係のみです。

975 ：１３２人目の素数さん：2005/08/08(月) 14:33:02

別版でも書き込んでみましたが、統計の可能性もあるのでこちらにも書きます。
正規分布で近似とかもうサッパリ分かりません。
http://risk.kan.ynu.ac.jp/masunaga/kennkouriskkadai.htm
（３）以降はテキストを見ながらやれると思うのですが、そもそもの(１)（２）の
解答方法が分からないので、お願いします；；

976 ：?：2005/08/08(月) 15:06:14

他所に誤爆をしてしまってこちらの板を教えていただきました。
両板またがってお読みの方にはお目汚し申し訳ありませんが、どなたかお力拝借させて
いただければと思います。

実験を二回繰り返して平均を取り、グラフにしたところ、ボスにエラーバーもつけなさいと
いわれました。n=2でエラーバーをつけるには、どうしたらよいのでしょうか？
nの数はもう増やせませんし、ボスには今日中にやってねといわれ、途方に暮れております。

977 ：１３２人目の素数さん：2005/08/08(月) 19:01:05

>>976
独立な観測でn個のサンプル X[1], X[2],…,X[n] が得られた場合、分散は
{(X[1]^2 + X[2]^2 + … + X[n]^2)/(n-1)} - {(X[1] + X[2] + … + X[n])^2/(n(n-1))}
で推定できる

標準偏差の推定値は上の平方根を取ればよい

978 ：?：2005/08/08(月) 20:06:29

＞９７７

おお、どうもありがとうございました。

979 ：１３２人目の素数さん：2005/08/10(水) 10:48:43

基本的な問題だと思いますが、よろしくお願いします…正誤問題です

1.標準正規分布をする確率変数が1.96を超える確率は0.05より小さい
2.カイ2乗分布は、比率の標本分布として用いられれることが多い
3．母平均がμの９５％信頼区間とは、確率変数であるμが、その区間に含まれる確率が
　　0.95である区間のことである
4．内閣支持率が60％±5%と出た。これは母比率がほぼ55％から65％の間にあることを示している

980 ：１３２人目の素数さん：2005/08/10(水) 11:11:45

>>979
1.○
2.×？（「比率」の意味するところがあいまいだから悪問だけど、普通は×と思う）
3.×
4.○？（「60％±5%」がサンプルから得られた信頼区間を意味する表現であるなら○）

981 ：１３２人目の素数さん：2005/08/10(水) 14:23:44

ある複数の変数が多変量正規分布に従っているかを検定したいのですが
どうすればよいのでしょうか？

982 ：979：2005/08/10(水) 19:01:32

>>980
ありがとうございます。
おかげさまで助かりました。

983 ：１３２人目の素数さん：2005/08/10(水) 19:37:55

三百三日。

984 ：１３２人目の素数さん：2005/08/10(水) 22:36:37

「どれも悪問ですね」と先生に言ってやんなさい。
1　1.96を（正の方向に）越える確率は0.05/2で0.025。しかし、0.025は0.05より小さいので、これは○ということになる。ダブルのひっかけ問題ですね。
2は二項分布のことだろうか？
3　文意が不明確
4　解なし　±の表現はいろいろな意味で用いられる。内閣支持率の表記方法の慣例を問う問題ならアリだと思うが。

985 ：979：2005/08/10(水) 23:50:12

>>984
ありがとうございます。どれも悪問なんですね…

986 ：１３２人目の素数さん：2005/08/11(木) 10:46:05

分からないので分かる方どうかお願いします！
期待値μ＞0の指数分布に従う確率変数Xを考える。分布関数はF(x)=1-exp(-x/μ),x＞0である。信頼係数を0＜β＜1として、(0,ax)という形のμの信頼区間を求めよ。
Pr{μ∈(0,aX)}=βを満たす実数aをβを使って表せばよい

987 ：１３２人目の素数さん：2005/08/11(木) 11:55:54

確率論は詳しくないですが一応解答します。信頼区間とか知りませんが
問題文の誘導にのって

μ∈(0,aX) ⇔ μ/a < X …(1)
よって(1)の確率は 1 - F(μ/a) = exp(-1/a)
ゆえに exp(-1/a) = b より a= -1/log(b)

違ってたらごめんなさい。

988 ：１３２人目の素数さん：2005/08/11(木) 11:56:44

>>987 訂正
bをβに変えてください。

989 ：１３２人目の素数さん：2005/08/11(木) 17:08:54

>>988
ありがとうございました！助かりました！

990 ：１３２人目の素数さん：2005/08/11(木) 18:43:42

統計を勉強中なのですが、わかりません。
できれば計算式もお願いします。

A校の男子生徒と女子生徒の身長は、男子の平均は170cm、標準偏差は10cm。
女子の平均は156cm、標準偏差は9.8cmである。
A校から男子生徒と女子生徒を1人ランダムに選んだとき、選ばれた男子生徒の身長が
女子生徒との身長より高い確率はいくらか。

なお、身長はそれぞれ正規分布をし、以下のPrで示した標準正規分布の下側確率を参考にせよ。
Pr(Z<0.7)=0.76,Pr(Z<1.0)=0.84,Pr(Z<1.3)=0.90,Pr(Z<1.4)=0.92

991 ：１３２人目の素数さん：2005/08/11(木) 19:12:26

>>990
>923を見たら。

992 ：１３２人目の素数さん：2005/08/11(木) 19:37:36

三百四日。

993 ：１３２人目の素数さん：2005/08/12(金) 13:06:20

９９３。

994 ：１３２人目の素数さん：2005/08/12(金) 19:25:32

誰か次立てて

995 ：：2005/08/13(土) 00:46:21

誰か、お願い、、、

996 ：１３２人目の素数さん：2005/08/13(土) 06:57:37

ume