1 :
132人目の素数さん :
04/10/11 19:37:36
2 :
132人目の素数さん :04/10/11 19:47:45
2げとずさー
あぼーん
あぼーん
2群の差の検定で、片方の優越性を確かめる時に両側検定をするのって気持ち悪くないですか?
荒らしを統計的に分析できるかな? 例えば、ポワソン回帰。時間、もしくはレスの数がオフセット。 発生要因は何にしようか? 一般的な荒らされ方(帰無仮説)に比べてこのすれの荒らされ方はどうなのかとかを分析できるのだろうか?
8 :
LettersOfLiberty ◆rCz1Zr6hLw :04/10/11 22:57:33
条件付期待値の導入についてだが、どうも私の書いた方法は一般的には通用しないらしい。(前スレ参照。)
9 :
LettersOfLiberty ◆rCz1Zr6hLw :04/10/11 23:00:31
いかんな、さっきまでとんでもないことを大真面目に遣っていたのか。
>>9 条件がσ-fieldとか確率変数とかの場合と勘違いしてたんだろ?
標準偏差と標準誤差の違いって何なのでしょう(どちらもn-1で割るとして)? 標準偏差は 1 母集団が正規分布すると分かっている(何回も測定して) もしくは 2 nが大きい という性質で、この逆が標準誤差でしょうか?
>>11 標本統計量の標準偏差を標準誤差と言ってるだけだよ。
13 :
前スレ966(959) :04/10/12 04:04:43
> 前スレ 964 ご丁寧なレスをどうもありがとうございました。 お礼が遅くなり、申し訳ありません。 カイ二乗に関して、とんだ勘違いをしておりました。 ボンフェローニの調整って、確か、読んだ本に載っていました。 もう一度きちんと勉強しなおします。 あの、最後に基本的な質問があるのですが、 今、やろうと思っている言語学(具体的には社会言語学)の調査は、 言語使用状況(具体的には対話相手のタイプ)が3つあって、 このどこか2者間に有意差がでれば、それで十分で、 全体をまとめて「有意差有り」という結論を出す予定は ありません。 (社会言語学の調査は、 教科書によると、post fact design型というそうで、 言語の使用状況の要因の相関関係がわかればいいので、 結構大雑把でOKだと思うのです。) この辺りが、実験計画の厳しい医学などの分野と 違うところだと思うのですが、 この場合は、カイ二乗3回でもいいのでしょうか。。
14 :
前スレ966(959) :04/10/12 04:09:56
>前スレ970 レスをどうもありがとうございました。 多重比較のHolmの方法って、多重比較の本に載っていました。 もういちど、きちんと勉強します。
15 :
LettersOfLiberty ◆rCz1Zr6hLw :04/10/12 11:38:45
部分σ集合族に関する条件付期待値は、 ラドンニコディム微分を使って定義されるようだが、 ラドンニコディム微分でできる関数はどうやって特定するのだろう?
16 :
964 :04/10/12 12:06:10
前スレ966さんが言っているのは次の2番目のものでしょうか? 1.複数の帰無仮説の内、その中の一つでも有意ならば有意とする。 2.複数の帰無仮説一つ一つが別の検定項目であり、それぞれ有意ならば有意とする。 2番目だったらカイ2乗検定を3回でも問題ありません。 もしくは、相関関係を知りたければ検定以外の方法を使ったほうがいいかもしれません。 「CramerのV統計量」というものがあります。相関関係を見るために相関係数というものがありますが、「CramerのV統計量」は分割表での相関関係を表すものです。 カイ2乗検定は実質的に比率の差があるかどうかを確かめる方法ですが、差がほとんど無くてもデータが多くなれば差があるといってしまいます。 だから、カイ2乗検定の有意確率が小さいからといって"強い"相関関係があるとはいえないんです。 ところで、分野によっては検定方法が甘くてもクレームが付くことが少ないようですね。
17 :
前スレ966 :04/10/13 22:14:59
>964 お礼が遅くなってしまいました。 いつもご丁寧なレスをどうもありがとうございます。 カイ二乗検定3回でもOKとのことで、安心致しました。 CramerのV統計量というのは、初めて聞きましたが、 相関係数がより正確にわかるとのことなので、 本などで調べて、勉強しようと思います. >ところで、分野によっては検定方法が甘くてもクレームが付くことが少ないようですね。 そうなんです。言語学の分野は、最近皆が統計を使い始めた感じなので、 参考書も少なく、経営学や医学分野の参考書を読んでも 具体例が違うので、なかなか理解が深まらずに困っていたところです。 でも、今後は、統計の使い方もどんどん厳しくなっていくと 思うので、頑張って勉強します。 本当にいろいろとご親切に、どうもありがとうございました。
18 :
132人目の素数さん :04/10/13 22:47:06
おまえら 「モンテカルロ方」 が何なのか? 漏れにもわかるよーに説明しなければいけませんよ。!
19 :
132人目の素数さん :04/10/13 22:56:26
スパムフィルタとしても利用されてるベイズの定理ですが これの最新の改良版のような概念はありますか?
21 :
132人目の素数さん :04/10/14 07:34:58
復刊にご協力下さい。
竹内啓,柳井晴夫 多変量解析の基礎 東洋経済新報社
http://www.fukkan.com/vote.php3?no=22328 統計学を専門とする人ではなくとも、
多変量解析を使うときに手元に是非置いておきたい名著。
多変量解析の基礎理論がわかりやすくかつ体系的に厳密に展開されていきます。
多変量解析に関するこれだけの名著は未だに出ていないと思います。
よろしくお願いします。
22 :
132人目の素数さん :04/10/14 13:36:35
ランダムウォークの関数 f(t) = f(t-1) + 正規分布乱数 を作って、これをいくつか纏めて平均します(一週間分まとめて週単位で調べたかった) g(u) = f(u*5+0) + f(u*5+1) + f(u*5+2) + f(u*5+3) + f(u*5+4) そしてこの差分を作って(週単位の差分の性質を調べたかった) h(v) = g(v) - g(v-1) h(v) の自己共分散γ(i)を作ったのですが、 僕は γ(0) 以外は 0 になると推測したのですが、実際にコンピュータで乱数を発生して 作ると、γ(1) にも正の値が出てしまいました、これは乱数がいい加減なのか、 それとも論理的にそうなるのか分る方おられますでしょうか?
冗長性分析について詳しいサイトないですか?
24 :
132人目の素数さん :04/10/14 15:37:44
>22 それは非ゼロになります。 一週間を5日として、vを週を表すインデックスとすると、 h(v)=g(v)-g(v-1) =今週の月曜日の値ー先週の月曜日の値 +今週の火曜日の値ー先週の火曜日の値 +...+今週の金曜日の値ー先週の金曜日の値 ですね。 (今週の月曜日の値ー先週の月曜日の値)は、先週の火曜日から今週 の月曜日の間にf(t)に起きた変化を表します。 (今週の金曜日の値ー先週の金曜日の値)は、今週の月曜日から今週 の金曜日の間にf(t)に起きた変化を表します。 従って、h(v)は今週にf(t)に起きた変化と先週にf(t)に起きた変化の 両方を含んでいて、h(v-1)は先週にf(t)に起きた変化と先々週にf(t) に起きた変化の両方を含んでいます。よって、h(v)とh(v-1)の相関は 非ゼロになります。 式で確かめたかったら、f(t)=f(t-1)+x(t)とおいてh(v)を計算する と、h(v)とh(v-1)が共通する項を含む事がわかるでしょう。 仕事にもどります。後のフォローは他の方よろしくお願いします。
25 :
132人目の素数さん :04/10/14 15:44:21
26 :
132人目の素数さん :04/10/14 15:45:49
>>24 あ、どもですリロード忘れてました、有難うございます。
27 :
132人目の素数さん :04/10/14 17:26:32
体の拡大がイマイチ分らない。簡単(記号じゃなくて)な解説キボンぬ。
28 :
LettersOfLiberty ◆rCz1Zr6hLw :04/10/14 17:29:10
Re:>27 それを何故此処で訊くのか?
29 :
132人目の素数さん :04/10/15 00:54:23
素人の書き込みをお許しください。 学校の授業で消費者のアンケートを取る必要があり、 街頭アンケートを行う予定でいるのですが、どれくらいの 回答数があれば信用度があると言えるのかが分から なくて困っています。 アンケートの内容は、一般的に流通している商品(車とかカメラ) について、イメージする企業またはブランドは何か?といった 内容です。 よくトリビアの泉とかでは2000人を無作為にアンケートすれば 統計学的に信用できるデータである、というようなことを言ってい ますが・・・。 ちなみにアンケートをする際には性別と年代も一緒に答えてもらう 予定です。 スレ違い等であれば無視していただいて構いませんが、ご教授い ただければ幸いです。 よろしくお願いします。
30 :
132人目の素数さん :04/10/15 02:05:08
>12 >19 ありがとうございます。標準偏差も標準誤差も意味は一緒と思ってても そんなに致命的でないと考えて生きていきます
32 :
132人目の素数さん :04/10/16 01:47:18
統計のはなし ↑ てわかりよい? 他にも良い目の奴教えておくれでないかい?
>>30 くだらない質問に答えていただきありがとうございました!
それらを参考にしながら頑張ってみます!
あぼーん
35 :
132人目の素数さん :04/10/16 09:51:46
| 無茶苦茶喰った。臭い物ならなんでもよかった。今は反芻している。 `──────────y──── ___ AA *〜/▼ ■⊂ ゚ ゚ P | ● ●.(_Д) U U ̄ ̄U U
36 :
LettersOfLiberty ◆rCz1Zr6hLw :04/10/16 14:19:54
Re:>34 捏造すんな。
37 :
132人目の素数さん :04/10/21 05:07:22
965
38 :
132人目の素数さん :04/10/21 19:40:44
B市の市長の見解では、B市の所得水準は県全体の平均水準より高い ということである。この見解を検討するためにB市の市民の中から 200人のサンプルを無作為抽出し調査したところ、その標本平均 X(上に線がつく)は435万円であった。県全体の一人当たりの 平均所得は433万円であるとする。市長の見解は統計的に妥当と いえるか、有意水準5%で検定せよ。なお過去の調査から母集団は 正規分布で近似でき、B市全体の所得の標準偏差は20万円である ことがわかっているものとする。 とき方が分かりません。計算方法がわかればいいんですが・・・ お願いします。
39 :
132人目の素数さん :04/10/21 19:43:19
偏差値の概念
ある母集団の標準を偏差値50、75を上位0.6%とし、25を下位0.6%とする。
この観点からいくと、上限は75で下限は25となる。
ただし例外もあり、上位0.6%の平均が80点だとして、
一人だけ100点だったとすると、その者の偏差値は90近くなったりもする。
0.6%のグループの中で抜きん出た者がいない場合、75が上限である。
http://www.o-shinken.co.jp/benkyo/hensati/hensachi.htm まさか偏差値の概念が分からないやつ、こんなにいるとは思わなかったね。
上位0.6%が75程度になるのは必然であって、
上位1%を80以上にする事はないんだぞ?
偏差値の仕組み分かってる?
いろいろなレベルの知識の人が集まるのは当然でしょう。 余計なことは言わずに、 優しく丁寧に教えてあげればいいんですよ。
>>38 B市の平均所得をμとして、
H0:μ=433 を H1:μ>433 に対して有意水準5%で検定する。
検定統計量Zは
Z= (435-433) / (20/sqrt(200)) =sqrt(2)≒1.414
となる。
標準正規分布の5%点は Z(0.05)≒1.64 なので、1.414<1.64
よりH0は受容される。
42 :
132人目の素数さん :04/10/22 16:41:46
グラフ表示のプログラムを作ろうと思っているのですが、 Y軸の目盛りの計算方法が分からず悩んでいます。 エクセルで適当な数値を入力してグラフを表示して、 目盛りの間隔と、目盛りの最大値をどのように変化 していくのか調べてみました。 最小値, 最大値, 差分, 目盛間隔, 目盛Max, 目盛の数 0.01, 0.02, 0.01, 0.005, 0.025, 5 0.01, 0.05, 0.04, 0.01, 0.06, 6 0.01, 0.1, 0.09, 0.02, 0.12, 6 0.01, 0.2, 0.19, 0.05, 0.25, 5 0.01, 0.48, 0.47, 0.1, 0.6, 6 0.01, 0.96, 0.95, 0.2, 1.2, 6 0.01, 1.91, 1.9, 0.5, 2.5, 5 0.01, 4.8, 4.79, 1, 6, 6 0.01, 9.53, 9.52, 2, 12, 6 0.01, 19.1, 19.9, 5, 25, 5 0.01, 48, 47.99, 10, 60, 6 0.01, 95.3, 95.29, 20, 120, 6 0.01, 190.5, 190.49, 50, 250, 5 0.01, 476.2, 476.19, 100, 600, 6 0.01, 952.4, 952.39, 200, 1200, 6 0.01, 1905, 1904.99, 500, 2500, 5 0.01, 4762, 4761.99, 1000, 6000, 6 このサンプルから、目盛りの最大値、目盛りの間隔を求める式が 分かる方、ご教授お願いします。
サンプルと同じにするには難しいから、自分でもっと 適当なものを作るべし。 Excelは目盛り数値のななめ、縦表示も行っているから、 全く同じにするには、結構難しいぜ? 適当に決めていいのならば、例えば以下のようにする。 メモリの最大値はデータの最大値を10%上乗せしたものとかさ。 これをY最大としよう。 データによっって上に間隔をあけるのでもいいし、下に間隔を あけるのでも好きにしていい。 ま、Y軸上に間隔をとったとしよう。 すると、間隔は、例えばY軸の場合、Y最大ー最小値を 割って、でーたの上位桁から順に見ていった間隔が1より大きい ところと、その1つしたのけたの範囲をもとめておく。 それぞれKとLとおこう。 そして、Y軸の場合、フォントの高さ*A(Aは1.5とか2とか 適当にセットする。)。その値と先程のKとLの値を比較して、 小さい方を選ぶ。 すると、Y軸の目盛りはフォントもちゃんと表示できて、 間隔も変な値ではない値が選択できる。 X軸はフォントの幅 * 最大桁数を基準のひとつとして 同様にやる。 これには規則はないから、好きにやってよいが、 プログラムで座標計算を一度もやったことがないと 小一時間かかるかもしれない。 でも、簡単でしょ?
単発質問スレ立てて削除依頼も出さないような香具師は放置でいいのに
45 :
132人目の素数さん :04/10/24 15:10:06
統計学者になれば株で大もうけできますか?
47 :
StatView愛用 :04/10/25 22:54:21
repeated-measures ANOVAで直行対比間の分散が均一ということが 満たされていない場合,2次効果の自由度の補正が必要となりますが,StatView5.0では は球面性の検定から自由度の修正まで行ってくれるのでしょうか?
48 :
132人目の素数さん :04/10/25 23:01:05
投機のほうは人間力が必要だから数学だの金融工学だの 机上の計算だけできてもだめ。
あぼーん
>>47 47さんに3つ聞きたいことがあります。
1.直交対比間とは何?
2.球面性の検定って、どんな検定? 帰無仮説は?
3.自由度の修正って、例えばサタースウェイトとか?
51 :
132人目の素数さん :04/10/26 02:05:19
統計は最初のとこでつまづいてしまって、、 すんません。教えて、、いくら本読んでも、インターネット 調べてもわからん。。俺がバカなのは分かった。 なんで「分散」ってのは、偏差を二乗すんの? 絶対値ではだめなの? 偏差の絶対値を使うデータの散らばりの指標ってないし、、
52 :
132人目の素数さん :04/10/26 02:40:55
>>51 たぶん微分したりするのに便利だとかユークリッドノルムに似ているとか
いろいろ理由はあるんだと思う。
絶対値を使う奴は平均偏差というのがちゃんとあるけどあまり使われない。
絶対値って使いにくいんだよね。場合わけとか。特に微分がアウト。
53 :
LettersOfLiberty ◆rCz1Zr6hLw :04/10/26 12:11:10
Re:>49 早く消えろ。
54 :
132人目の素数さん :04/10/26 12:51:25
>>52 計算機の発達でその点は解消していると思うよ
>>51 微分に限らず、数学的に扱いやすいかどうか、って問題なんだけどね。
簡単に思いつくものでも、XとYが独立ならV(X+Y)=V(X)+V(Y)とか、共分散との整合性とかね。とても理論的な構築がしやすい。
絶対偏差や、下半絶対偏差とか色々概念自体はあるんだけど、どの分野でも理論構築が容易なものが普通は数学的標準となるわな、やっぱり。
57 :
132人目の素数さん :04/10/28 23:58:58
たぶん統計学の問題だと思うけど 誰か詳しく教えてくんさいな。 町内の空き地の有効利用に関する試案Aに対して無作為に 9人の住民を選び、賛成反対を尋ねた。すると賛成2人、 反対7人になった。賛成者と反対者の人数には実質的な差 があるかどうか。 帰無仮説をたてて、それ以降はよく分からなかったデス。 ちなみに心理学の授業で出されますた。
58 :
132人目の素数さん :04/10/29 07:43:17
>>57 賛成確率を1/2として二項分布の正規近似を行えばよい。
60 :
132人目の素数さん :04/10/30 13:14:52
統計ソフトStatViewを使っています.サポートが無いので 使うなと上司に言われているのですが,計算自体の問題点が無いのなら 使いつづけてもいいかと思っているんですが,まずい点があるかどうか ご存知の方教えてください.
そういうことをここで聞かないといけないという点がまずい。
62 :
132人目の素数さん :04/10/31 09:50:39
すみません 統計数学のいい教科書を探しています よろしくお願いします
63 :
132人目の素数さん :04/10/31 14:41:02
>>60 統計ソフトはSPSSが良いね。
値段も16万くらいしかしないし、プログラミングスキルも殆ど必要ないから
使いやすい。
ただし、ノンパラ多重比較ができないのが難点。
64 :
132人目の素数さん :04/10/31 16:29:32
>>63 ビジネスsoft板ではspssは玩具で結論がでていますが?
統計ソフトはRで充分だろ?
66 :
132人目の素数さん :04/10/31 16:45:05
お金があればSAS
Exelで十分だと思われ。 まぁ、マクロを作る能力がなければ別問題だが・・・
68 :
132人目の素数さん :04/10/31 17:11:30
無知を露呈する67
Fortranで十分だと思われ。
ありがとうございます。 今のところ、RやSASの勉強に踏み切れないんで、 StatViewがExcelのいくつかの関数のように 統計学上問題のある手法を含んでいるか 聞きたかったんですが・・・・ R勉強してみるかなあ
71 :
132人目の素数さん :04/10/31 20:41:32
実務家ならRはきついよ。
もう1人逝った |二二二二二二二二二二二二二 | | | | | | | Λ|Λ | | | | ( / ⌒ヽ | | | | | ← 人間のクズ kingのなれの果て | | ∪ 亅| .//| | | | | | // .| ∪∪ | | // .| : | | // .| : | | _______//___.|___________| |_________ \ . ̄~~| ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄'~| ̄ / | |\ ____|__________|__ | | | | \ | | / | | (省略されました・・全てを読むにはここを押してください)
基本的なことだろうとは思うのですが、よく分からなくなってしまったので質問させていただきます。 検定の結果p=0.01となると、5%等ふつうの有意水準の設定では有為な差があると判断されます。 しかし、あくまでp=0.01なので、このような事例が100例ある場合には、その中の一例くらいは本当は偶然の結果だということにならないのでしょうか? お馬鹿な質問で申し訳ありませんが、よろしくお願いします。
>>73 なる。
しかし完璧な事例など無いのだから、どこかで線引きしないといけないじゃん?
75 :
132人目の素数さん :04/11/01 00:43:01
ノンパラ型の2群間比較(プラセボを用いた2重盲検比較試験)についての質問です。 パラ型なら、投与後と投与前の変化量(差)をとり、2群間の差について 対応の無いt検定を行なえば問題ないですが 例えば、投与前と投与後に疾患の程度を5段階のカテゴリカルデータで判定 (5:大いに問題あり 4.問題あり …1.問題なし)して、 実薬がプラセボに対して有効であったかを検定したいのですが、 このようなケースでもパラ型のように変化量(差)をとって ウィルコクソンの順位和検定をしてもいいんでしょうか? @順位尺度データなので差をとることは絶対にNG! (※例えば、5⇒3の変化と3⇒1への変化は必ずしも同じとはいえない) なので、符号検定までにとどめておくべき。 A※が問題にならないともいえないが、ノンパラ検定は頑健性があり 順位尺度データの差をとって検定を行なっても差し支えない。 また、この方式の方が「程度の改善レベル」まで勘案した検定結果になる。 自分の考えではAを支持したいと思いますが詳しい人のご指導お願いしまつ。
>>75 > ウィルコクソンの順位和検定をしてもいいんでしょうか?
よくない。スピアマンかあるいはケンドルを適用しなさい。
77 :
132人目の素数さん :04/11/01 02:52:04
私は数学素人なんですが、 最近、ブラックジャックのカード・カウンティングに 興味をもっていて、カード・カウンティングによって 得られるトゥルー・カウント値(=TC)と、そのTCのときの ブラックジャックのゲームの期待値との間の 関係を調べたいのですが、「マルコフ連鎖モンテカルロ法(=MCMC)」というのは 使えますか?もし使えるのならその基本的な考え方を教えてくれませんか? MCMCが使えない、あるいは使うべきでないならどんな方法を使うべきでしょうか?
78 :
132人目の素数さん :04/11/01 20:37:07
ひとつ質問させてください。 今、二群間の平均値の差をt検定で比較していたのですが、 有意差なしでした。この場合、 「type2error(第二種過誤率)ももとめて、 本当に差がないのか検討しなければならない」 と参考書に書いてありました。 しかし、excel、statviewの画面にそれっぽい値は出ず・・・。 第二種過誤率を計算してくれるソフトまたは簡単な式などないでしょうか? よろしくお願いします。
79 :
132人目の素数さん :04/11/02 20:46:54
>>76 75氏ではないが、何故に差の検定で順位相関係数の話が出てくるの?
80 :
132人目の素数さん :04/11/02 22:52:02
数学板「分からない問題はここに書いてね191」スレから誘導されて来ました。 function generatorから出した信号をAD-DA変換装置を通して量子化しました。 8ビットでの量子化と、4ビットでの量子化を行いました。 入力信号の振幅を0.025ずつ大きくしていったときの量子化値と、実際の振幅との誤差を出していきました。 ここで、8ビットでの量子化誤差と4ビットでの量子化誤差を見比べて8ビットでの量子化の方が精度が良い ことを述べるのには、求めた誤差の値をどう見れば良いのでしょうか? 私は、8ビットの場合の誤差の標準偏差と4ビットの場合のそれとを比較し、 8ビットのものの標準偏差の方が0に近いから、値のばらつきが少なく精度が良い としました。この議論は正しいのでしょうか?よろしくお願いします。
>>80 仮に4bitより8bitの方が0.01だけ精度が良かったとしても、
その差に意味があるのかわからない(たまたま差が出ただけかもしれない)ので、
検定した方がいいと思う。
この場合って繰り返しのない二元配置分散分析法でいいのかな?
あとは図示するのも大事。
検定ばっかりやってると足元すくわれる。
>>81 レスありがとうございます。
やはり検定ですか。
83 :
132人目の素数さん :04/11/04 16:20:32
統計学のargminとか、argmaxというのはどうゆう意味があるのでしょうか?勉強していたら、記号がちょっと分からなくて行き詰まってしまって。もし良かったら教えて下さい。宜しくお願いします。
>>83 私自身はそういう記号は使ったことはありませんので説明が下手ですが、
例えば、argmin( (a,b) , F(a,b) ) は関数Fの値を最小にする
引数(argument)の組である(a,b)のことです。
最小の(a,b)という訳ではありません。
また、例えば、y=f(x)において、argmax Σ_(i={ f(x)=y })^(n) si
などと書かれていたら、sの総和を最も小さくするyのsetの
ことです。
>>84 とても分かりやすく、理解出来たきがします。ありがとうございます!
白色雑音の定義って、どんなのがありますか? 一番きれいなのを教えてください!
すべての確率変数の背後には、 確率分布一定の(複数の)要因があると考えてもよろしいのでしょうか?
>>88 確率変数の概念自体あとづけです。
分布も経験則と整合性を保つという前提の下で作出されたものです。
>>88 えーとですね、質問の意味がよくわからないのです。
「要因がある」というのが、実証分析上での確率変数(説明変数など)
のことなのかなと思います。
確率理論は専門ではないのですが、実証的な統計学でいうと、
例えば、「xを確率変数とする」という記述があるとしたら、
それは、「なんらかの確率によって変動する変数」という
ことになりますから、「なんらかの分布」が背後にあるという
ことになると思います。
>>88 さんの場合には、「要因」という単語を使われていますので、
例えば、説明変数としての確率変数が、ちゃんと説明変数として
妥当な式(例えば回帰式など)を考えているのかどうかという問題にもなると思います。
変な説明で申し訳ないです。
>>89 >>90 お返事ありがとう。
たとえば、サイコロ2つ振ってその合計を出す確立変数 X を考えると、
その確率変数の背後には、サイコロが等確立 1/6 で
一様に目を出すという確立変数があるわけですよね。
この確立分布一定の2つの確率変数の和として X が表現されます。
このことが他の確率的な現象にも適用できるとは言い切れないのだろうか、
というのが質問の内容です。
たとえば、1年に渡る交通事故の発生を表す確立変数 Y を考えた場合、
その背後に確率分布一定の確率変数が複数あって、
その和として Y を記述できないのだろうか、ということです。
あのね、その例だとベルヌーイ分布を仮定して満足すると思うけど それを他の事例にも適用してフィットするかどうかはよく考えないといけないだろうね。 適当な本をみれば 正規分布 χ^2分布 t分布 F分布 ポアソン分布 幾何分布 超幾何分布 指数分布 ワイブル分布 Γ分布 β分布 コーシー分布 対数正規分布 パレート分布 等々 があって、それぞれの特性をうまく利用して個々の確率現象を捉えないといけないと思うよ。
>>92 いつも丁寧な回答ありがとうございます。
適切な確立モデルを選択すべきというのは分かるのですが、
私がお聞きしたかったのは、もっと物理的あるいは哲学的な問いでして、
宇宙に存在するすべての確立的な現象の背後に、
何か統一的な、あるいはアトミックなランダム現象が存在するのではないか、
というような予感から発せられた問いなんです。
もしアトミックなランダム現象が存在するとすれば、
それは数学的にどのようなものであることが予想されるか、ということです。
曖昧な問いかけですいませんが。。。
じゃあ、黒色雑音って? 白体輻射って?
95 :
132人目の素数さん :04/11/07 02:40:56
>>91 サイコロの各目が1/6の確率で出るというのは
1.ラプラス説 サイコロのどの面も一様だから同じ確率になるべきだ
2.頻度説 たくさん振ったら1/6に近づくだろ?
に基づいてるとのこと。
確率は何かということについて上の二つとベイズ統計の立場とかあって
哲学的な論争もあるらしいけど決着はつかないとか。
ではどうしているかというと、数学ではコルモゴロフの公理系と呼ばれる
数学で興味のある部分だけ取り出して、これを満たせば何でも確率といって
論争からは逃亡してしまっている。どの説を採ろうともこれを満たすわけで
建前としては公理系を用いて、本音では実際の問題を考えるときに
その場その場で都合のいい説を持ってくればいいわけ。
>>93 の話になると科学哲学の話で数学じゃないかもしれない。
まあここで話しちゃいけないとはいわないけど、期待した答えが
返ってくるかどうかはわからない。
>>93 えー、なかなか回答が難しい質問ですね。(^^;
>>95 さんのおっしゃるとおりなんですが、私も昔、そのような
普遍的なものを考えたことがあります。
私はもちろん、理論物理や素粒子理論なんてわからないのですが、
>>93 さんのお考えになっていることは、おそらくエルゴート仮説に
近いものかなと思いました。
もとはLiouville(リューヴィル)の正準方程式に関する保存定理ですが、
運動方程式(一階微分方程式)の時間的性質が位相空間上に測度として
保存されると言うことです。これがLiouvilleの定理です。
そして、それから派生したのがエルゴート仮説であり、統計力学で
生まれた用語らしいです。
これもLiouvilleの定理に似ていて時間平均は集合の平均が位相平均
に等しいというものです。
これを時間軸から空間軸に延長してやると、時空間にわたる、大数の
法則のような感じになって、時間も空間も結局同じことが言える、
(=同じ性質を持つ)ということらしいです。
またまた下手な説明で申し訳ありませんが、調べてみて下さい。
もしかすると21世紀に残された宇宙論の大問題、暗黒空間を
解明できるかもですよ!
97 :
132人目の素数さん :04/11/07 22:00:10
経済モデルなどを実証分析するとき、データを対数変換する意味って 何なんですか?初心者ですいません。
ひょっとしたら全然スレ違いかも知れないんですけど助けてください・・・ 授業でSAS(のやり方自体)をやっているのですが、データを作って読み込んでも 20行作ったうちの10オブザベーションしか読み込まれません。 おかしいなと思いつつ上半分下半分にデータをわけて2つ読み込むと 今度は5オブザベーションしか・・・ エラーはまったく出てません。 変数は5しかないので容量の問題とも思えないのですが どうしたらいいでしょう。どなたか教えてください
99 :
132人目の素数さん :04/11/08 19:41:14
昔から気になっている事がある。 TV等でやっているベストテンを決める類のもについてだが、 例えば「一番感動した歌のベストテン」番組の企画があったとする。 不特定多数にアンケートをとると、若い連中は、 高々聴いてきた曲数が限られており、どうしても最近の曲に集中する。 また、古い曲は忘れられる率も高い。 しかもTVだと視聴率も気になるから、若者に迎合した結果を当然歓迎する。 それだはイカンと思う訳である。 回答者の年齢による重みとか、古い曲に対する重みを付けないと不公平だと考える。 そこで、そういう重み付きアンケート集計の基礎理論というものがあるのか、 教えを乞う次第である。
100 :
132人目の素数さん :04/11/08 23:06:05
回帰分析の課題が出ているのですが、 どこかお勧めのデータがあるサイトはありませんか? いろいろと探しているのですが、うまく見つけることが出来ません。 どなたか教えてください。
102 :
98 :04/11/10 13:39:07
101さんありがとうございます。 このサイトぐぐった時にあったかもしれないけど英語なんでスルーしてました。 プログラム自体は同じものなのでしらみつぶしに見てみます。
103 :
132人目の素数さん :04/11/11 14:40:59
>>98 データを読み込む部分のプログラムを見せてくれたら解決するかも。
104 :
132人目の素数さん :04/11/15 18:05:44
197
105 :
132人目の素数さん :04/11/17 11:54:30
「赤」と「青」の特徴を知りたいので、 それぞれを刺激語とした「赤から何を思い浮かべますか?」のような連想検査(アンケート)を実施しました。 その結果の反応語の出現数(観測度数というのですか??)を、 赤 青 強い 111 12 早い 13 11 すごい 20 18 なめらか 2 50 りんご 22 34 あめ 4 1 のような感じで属性を行にした表を作りました。 ここで、どの項目が「赤」と「青」の特徴をあらわしているかを知りたいのですが、 どういった手法をとればよろしいか教えてください。お願いします (カイ2乗値で考えればいいのかなと思ったりしましたが、確信が持てません。)
106 :
132人目の素数さん :04/11/17 20:24:42
すいません素人です。教えて下さい。 「不均等nのhonestly significant difference(テスト?)」 というのは英語で表記する場合、何と書けばよいでしょうか? 検索するとTukey-Kramer testというのがありましたが・・・。
107 :
132人目の素数さん :04/11/19 16:17:11
パチスロの機種の人気を調べるために年齢層別にデータを取っていくのですが、 その場合母集団、母数、母平均μ、母分散σ2乗、母標準偏差σなどは何になりますか? 教えてくださいm(_ _)m
基本的に正規分布
109 :
132人目の素数さん :04/11/20 01:12:06
二項分布の累積確率と、その逆(EXCELのbinomdist,critbinomに相当するもの) を作りたいのですが、アルゴリズムかCなどのソースがあったら教えてください。
110 :
132人目の素数さん :04/11/25 03:04:44
すいません素人です。お願いします。もしかしたらスレ違いかも…m(_ _)m 当初、線形計画か非線形計画かと考えていたら、場合分けをしなければならない状況になりました。 目的関数や制約条件の中に場合分けを含むような問題はどうしたらいいのでしょう? あるいは、このような問題は何というのでしょうか? 漠然としすぎているかもしれませんが、何を書けばいいのかもわかりません。 すいませんがどなたか…、教えてください。お願いします。
111 :
132人目の素数さん :04/11/25 03:45:30
110ですが、訂正です。 目的関数が場合分けを含む問題です。
すいません素人です。お願いします。 課題で多変量解析の手法を用いて実際に分析を行うっていう課題があります。 個人的には因子分析(主成分分析)を使って能力分けのようなものをやろうと思うのですが、 何かよいネタというか、分かりやすいデータみたいなものって何があるでしょうか。 主成分分析や因子分析を用いてプロ野球のデータのようなものをやろうと思ったのですがうまくいかず。 よい意見ありましたら教えていただけるとありがたいです。 スレ違いスマソ
ほっ統計
114 :
132人目の素数さん :04/11/26 16:26:03
誰かbag of wordsを素人の俺にわかりやすく解説してくれませんか? 論文サーベイしているのですが、英語能力皆無の俺には英語の説明ではさっぱりわかりません。 お願いします
115 :
132人目の素数さん :04/11/26 16:58:30
>>114 あんまり自信ないけど、各文書についていろいろな単語の出現の有無もしくは
頻度だけを見て、その文書を単語のベクトルとして表す方法のことなんじゃな
いの?ベクトルとして表現した後で分類したりクラスタリングしたり。
単語がどういう構造の文の中で使われているかとか、単語同士の位置関係とか
構造的な要素をそぎ落してるので "bag" なのかと。
116 :
132人目の素数さん :04/11/27 01:18:53
>>74-75 > 検定の結果p=0.01となると、5%等ふつうの有意水準の設定では有為な差がある判断されます。
> しかし、あくまでp=0.01なので、このような事例が100例ある場合には、その中の一例くらいは本当は偶然の結果だということにならないのでしょうか?
激しく遅レスだが、気になったので答えます。”このような事例”ではなく帰無仮説のもとではそうなります。
>>78 > 今、二群間の平均値の差をt検定で比較していたのですが、
> 有意差なしでした。この場合、
> 「type2error(第二種過誤率)ももとめて、
> 本当に差がないのか検討しなければならない」
> と参考書に書いてありました。
もし第2種の籠を求めるとしても、平均値の差を対立仮説の真の値と家庭しているんだよね?
>>97 > 経済モデルなどを実証分析するとき、データを対数変換する意味って
> 何なんですか?初心者ですいません。
数学で扱いやすくするためです。正規分布っぽくするため。
>>105 > 「赤」と「青」の特徴を知りたいので、
> それぞれを刺激語とした「赤から何を思い浮かべますか?」のような連想検査(アンケート)を実施しました。
赤である割合とその信頼区間を求めましょう!
>>112 Fisherのあやめ はいろんなところに出てくるよ。
↑で検索したらデータが出てくるかも。
121 :
132人目の素数さん :04/11/28 10:50:30
サンプルサイズと検出力の関係を詳しく教えてください 数式を見る限り大きく関わっているという事は漠然と判るのですが
ベイズ推定で、誤差の含まれたデータが与えられた場合、 誤差の分布(正規分布)の分散と、 推定したい値の分布(正規分布)の分散どちらもわからない場合 どうしたらいいんでしょう? エクセルデータで1000個のデータが与えられて、ウアーわからん。
123 :
78 :04/12/01 17:53:40
>>117 質問が難しすぎてそうとかそうじゃないとか答えられない・・・.
すみませんm(_ _)m
124 :
132人目の素数さん :04/12/04 00:30:17
色々な分布の関数とかその逆関数とかを数値計算したいのですが、 まとまった良い本あったら誰か紹介してくださいです。
125 :
132人目の素数さん :04/12/04 10:58:36
株価変動を分析したいのですが、ある特定の要因が株価に与える影響について 考えています。具体的には、日本のボーナスや、アメリカのクリスマス商戦など ですが、その与える影響について分析する時に、ダミー変数を使うように 言われました。 ただ、いまいちその使い方が分かりません。ダミー変数の組み込み方は分かった のですが、そこからどうすればかが分かりません。 教えてください。
126 :
132人目の素数さん :04/12/06 22:04:35
ベクトル空間法を用いて、言語解析を行っているのですが、 クラス分けというものが、どうしてもつかめません。 クラス分けを行って、それをセマンティックウェブのオントロジと組み合わせて 意味的に類似度をとるというものなので、クラス分けを避けて通れません。 統計、線形台数に関して本当に素人なので、誰か教えてください。 素人ですみません。教えて君ですみません。
127 :
132人目の素数さん :04/12/11 08:30:12
今、研究で数量化理論1類使ってるんだけど カテゴリー評点って有為差検定かけたほうがいいのかな? 自分が調べた限りでは数量化理論に有為差検定かけてないと思うんだけど。。 だれか詳しい方アドバイスください。。。。卒業が(´Д⊂グスン
128 :
132人目の素数さん :04/12/13 20:18:39
実験結果について有意差検定を行わなければならないのですが まったく分かりません。 統計用のソフトに任せればそれまでなのですが やっぱりなんかモヤモヤします。 まったく0から統計学(といってもこの程度)が分かる入門書のようなものは ないでしょうか? ちなみに生物系研究室です。
129 :
132人目の素数さん :04/12/19 12:00:21
130 :
132人目の素数さん :04/12/19 12:18:01
専門が生物系と決まってるのなら 統計に無駄に時間をかける必要はないよ。 ソフトを使えれば十分。 ANOVAを本当に理解するには少なくとも1,2年は費やすから。
131 :
132人目の素数さん :04/12/19 17:57:02
ここには相応しくないぐらいの初学者申し訳ないんですが テキストに、縦軸に度数(人数)、横軸に級限界値(身長)をとっている度数分布図があるのですが 同じくテキストに「度数分布をグラフに描くときは級感覚が均一になっているかどうかに注意する必要がある。 連続量の度数分布図では面積が度数を表すので、級感覚の不同な度数分布を描く時は その感覚に応じて柱の高さを加減しなければならない」とあります。 ここで、度数というものはあくまで縦軸のものであり 面積で表されるものは、度数と該当する値をかけたものだと思うのですが ご教授お願いいたします
132 :
132人目の素数さん :04/12/25 01:13:16
質問があります.『回帰分析で「曲面を表わす式」を推測する方法』 について知りたいのですが,詳しい本やその中で見るべき項目をお教えください. 調べた範囲では,該当すると確信出来る方法が分からず, 行き詰ってしまいました.よろしくお願いします.
133 :
132人目の素数さん :04/12/25 02:25:20
379
135 :
ど素人 :04/12/27 23:29:05
こんばんは。 大変お詳しそうな方々が多いので、質問をさせてもらっても、いいですか? すいません、統計学習いたててなもので、もうすぐ試験を迎える学生です。 レンジを用いて標準偏差が求まるのが何故なのか、合点がいかないのです。 問 一般にN個の個体からなるランダム標本を考え、その標本のレンジをaと表すことにする。 N=10と100の2つの場合に、このランダム標本の標準偏差を計算した結果の概算値として 妥当な組み合わせを選べ。 1、a/10とa/100 2、a/3 とa/5 3、a とa/2 4、a と2a 5、−a/2と−a
136 :
ど素人 :04/12/27 23:30:19
すいませんでした。 質問はここに書いてね、というスレッドがありました。 そちらに書きます。
137 :
132人目の素数さん :04/12/28 01:19:08
なんどもすいません。 質問はここにかいてね板では、 完全にしかとされてたね・・・・。 誰か教えてあげてくんさい。
レンジって何? 標本が0〜aの間に均等に分布してるってこと?
139 :
132人目の素数さん :04/12/28 09:52:59
いえ、その標本の(最大値−最小値)がaであると。
140 :
132人目の素数さん :04/12/28 16:35:45
レンジって、横軸の数値のこと? あれなんていうの。 横軸って、平均をさすの?
>>135 もちろんレンジだけから標準偏差は決まらない。
それは直感的な理解を試す問題だと思うので、
一般的な値として妥当だなーと思う選択肢を選べばいい。
ただし範囲は a/(N√2) < σ < a/2 とか絞られて、「3,4,5」は消えるかも
142 :
ありがとうございます。 :04/12/28 22:56:28
実はこれは、公務員試験の過去問なんです。 自分は、来年の5月に受験します。 直感的な理解・・・・。 それは、どこの基礎的な内容を書いたものでしょう? 母平均の推定ではないですよね。
>>135 順序統計量の確率の式を使って、正規分布N(0、1)の標本のレンジをZとおいてE(Z)を求めれば
よいのだが、とのこと。
標本数nごとにZが求められており10の時約3、100のとき約5とのこと。
>標本のレンジをZとおいてE(Z)を求めれば よいのだが、とのこと。 E(Z)を求めればよいのだが、二重積分を外さなければならず計算は面倒とのこと。
>>142 > 直感的な理解・・・・。
σ=a/10 N=10 でレンジ a を実現してたら
10個のうち2つが5σの値を取ったという事だから、
なんか偏ってる気がしないかな。実際にそういうデータを作ったら、
一カ所に固まったデータたち+異常値という形になるよ。だめ?
146 :
ありがとうございます。 :04/12/29 00:03:02
う〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜む・・・・・・・・・・・。?☆○@ すいません、皆さんからのアドバイスをもとに 考えて、また明日お返事します。 夕方頃になるかもです。 皆さんありがとうございます。
>>146 以上のことはホーエル「入門数理統計学」10章P271〜272に書いてあるので立ち読みでもしたまえ
>>143 あれれ、よくわかってないのですが、標本数nが増えたら標準偏差はsqrt(n)に反比
例して小さくなりますよね?
「10の時約3、100のとき約5」って言うことは、偏差が小さくなるとレ
ンジは反対に大きくなる、という理解でいいんでしょうか?
逆(偏差小のときレンジも小)のような気もするんですが。
統計の基礎を忘れてしまったんですが、 a組2人、b組4人の中からくじで代表を決める場合、少なくとも一人はa組から 選ばれる確立ってどうやって求めるんでしたっけ? (2/6)*(1/5)=1/15 ッて考えたんですけど、正解は 3/5 だそうです。
>>149 くじで2人の代表を決める場合ですよね?
aからひとりも選ばれない場合を考えて、それを1から引けばいいので
1 - (4/6 * 3/5) = 3/5
ということでどうでしょう。
ありがとうございます。パッとわかっちゃうんでね。きっと。 (二人の代表を決める。てのが抜けてました。すんません。) なるほど。といきたいところなのですが、 回答聞いてもわかりませ〜〜〜ん! a組から一人も選ばれない場合を、なんで1から引くんでしたっけ? ^^;? 149のようにやってしまうと、なんでいけないのかが分からないんです。 149で駄目な理由としては、同じ式でb組から二人選ばれるのと同じとなる。 って考えられるんですけど、 150サンの式でもb組のアル二人が選ばれない確率と同じになると思うんですが・・ なんか根本の根本がわかっていなくて申し訳ない。。。
>>151 > a組から一人も選ばれない場合を、なんで1から引くんでしたっけ? ^^;?
すべての場合を考えると、代表に
1) a組がだけ含まれる場合、
2) aとbと両方が含まれる場合 (つまり、aひとりかつbひとり)
3) b組がだけ含まれる場合、
の3通りがあることがわかります。逆に3通りしかあり得ません。
よってこれらすべてを合わせれば、確率は1になります(それ以外の可能性はないので)。
(1) + (2) + (3) = 1
求めたいのはaが少なくともひとりは含まれる場合の確率なので、(1)と(2)の確率の和
すなわち 1 - (3)の確率 ということになります。
ちなみに(1)の確率は 2/6 * 1/5 = 1/15 で簡単ですが(2)の計算がちょっとだ
けややこしいので、ストレートに(1)+(2)を考えずに、1-(3)を計算するわけです。
153 :
132人目の素数さん :04/12/29 15:36:21
age
お! 分かりやすいです。ありがとうございます。 そうか、1って100%てことか。 そう考えれば、なんでもありえる確率100%-b組だけ選ばれる確率で、デル!っと。 ちなみに (2)を一所懸命考えたのですが、ハテーナはてーな? さぱーりワカリマセンでした。。。。
>>148 >標本数nが増えたら標準偏差は…
n個の平均の標準偏差はsqrt(n)に反比例するけど、かんけいない。
143は、正規分布を仮定してN回試行したときの
レンジの期待値E(Z)を求めろといってる。Nが同じならσとE(Z)は比例する。
143ではσを固定してるから、Nが大きい方がレンジが広がる。
たくさん試行すれば大きな値が出るって事だよ。
156 :
ありがとうございます。 :04/12/29 19:05:07
う! 追加的な書き込みが沢山増えてる。 読まなきゃ!
157 :
今読んでいる途中です。 :04/12/29 19:10:08
半分まで読みました!!
>>148 標本数nのレンジをRとおくと
レンジがRである確率g(R)=n(n−1)/2*∫[*∞〜ー∞]f(m)f(m+R){F(m+R)−F(m)}^(n-2)dmとなる。
従ってレンジの平均E(R)=∫[∞〜0]R*g(R)dRとなる。
これのf(*)、F(*)に正規分布N(0、1)の密度関数、分布関数を代入してE(R)を求めればよいが、計算が面倒。
既に数値計算した結果によればnが10のとき3、100のとき5とのこと。
この説明がわからないなら前述の本で勉強してくれ。
>>155 followサンクス。
159 :
ありがとうございます。 :04/12/29 22:49:30
>>157 まだ読めてないです(笑)
レンジに関して、詳しい本が無いのです。
ご紹介頂いたホーエルが、新宿の紀伊国屋に行ったけど、売り切れで。
更にちょっと勉強します。
くそっ(><)
レンジめ〜
教えてください。 三つのチョコと二つのアメを横一列に並べるとき、 二つのアメが隣同士になるのは何通りなんでしょうか? 解は、48通り コレって 5c2とかって書いて、 5*4+2*1って計算するヤツでしたっけ? 名前が分からないので、検索のしようがありませんです。。
>>160 > 5*4+2*1って計算するヤツでしたっけ?
5P2(=5*4)が順列、5C2(=5*4/(2*1))が組み合わせです。
この問題はそれぞれのチョコととアメを別々のものと見る(チョコ1、チョコ2、
チョコ3)か同じ(チョコはどれも同じチョコで判別がつかない)と見るかで答え
が違ってきます。48通りということは、個々のチョコやアメは別々のものとみ
なすはずですね。
>161さん 助かります。 ホムペを探してみました。 でも、組合せの問題なのに、5C2(=5*4/(2*1))=10通り で答えが出ないのもへんですね。。。?? もう一ググリしてきます。
わかったので、整理します。 161さんの指摘もあったので、男の子3人と女の子2人にします。 (当然別人。実はホムペーで説明がこうなってた) まず、女の子は隣り合ってるので、1人として考える。 男の子3人+女の子1人の全組合せ = 4!=4*3*2*1 = 24通り コレに女の子2人の組合せ = 2! = 2*1 = 2通り 従って、女の子が隣り合う場合は、24*2=48通り
>>163 > 男の子3人+女の子1人の全組合せ = 4!=4*3*2*1 = 24通り
> コレに女の子2人の組合せ = 2! = 2*1 = 2通り
正解。
ただし、こういう場合(選び出したものの「位置」が問題になる場合)は組み合
わせではなく順列といいます。
へえ。そうなんですか。覚えておきます。 位置が問題となる組合せは順列。 てことは、4p1 * 2p1 = 48 でいいですか?
ちがった。 こうだ。4p4 * 2p2 = 48
>>134 ありがとうございます。
大変参考になりました。
ある速配便の会社は平均して6時間以内で小包を配達すると主張している。そこで配達時間を測ったところ、つぎのデータを得た。 7, 3, 4, 6, 10, 5, 6, 4, 3, 8 (単位:時間) a. この主張は正しいか、有意水準5%で検定せよ。 b. 平均配達時間の99%信頼区間を作成せよ。 c. a., bの問題を解くためには母集団についてどのような仮定が必要か。 a,bは解けたのですがcがよく分かりません。
冬まっさかりで、すっかり宿題スレになってるな・・・しかも統計関係ないし
>>168 a,bをどう解いたのかを詳しく
170 :
132人目の素数さん :04/12/31 04:00:47
残差平方和の自由度を求める方法としてテキストに zの分散V[z]と期待値の間には V[z] =E[(z-μz)^2] =E[z^2]-μz^2 の関係があって、 期待値μzが0ならば V[z]=E[z^2] となる。 と書いてあるんですが、 E[(z-μz)^2] =E[z^2]-μz^2 ここの部分がなぜイコールになるかわかりません。 わかる方いましたらどうか教えて頂けないでしょうか。
171 :
132人目の素数さん :04/12/31 04:01:31
残差平方和の自由度を求める方法としてテキストに zの分散V[z]と期待値の間には V[z] =E[(z-μz)^2] =E[z^2]-μz^2 の関係があって、 期待値μzが0ならば V[z]=E[z^2] となる。 と書いてあるんですが、 E[(z-μz)^2] =E[z^2]-μz^2 ここの部分がなぜイコールになるかわかりません。 わかる方いましたらどうか教えて頂けないでしょうか。
172 :
132人目の素数さん :04/12/31 04:20:42
続きです。 さらに、残差eiの期待値E[ei]が0であることから、 E[ei^2]=V[ei]=(1-1/n)σx^2となるって書いてあるんですが、 残差eiの期待値E[ei]が0じゃなきゃ駄目なのでしょうか? 0じゃなくてもE[ei^2]=V[ei]=(1-1/n)σx^2は成り立つのに 「0であることから」ってつける必要性がわかりません。 これについても教えて頂きたいです。
173 :
とろい :04/12/31 04:46:27
正則ってなんですか? せいそく 0 【正則】 (1)正しい規則。 (2)規則どおりであること。正規。 ⇔変則 「―の教育を受けなかつたために/明暗(漱石)」 (3)外国語を学ぶ際、外国人から発音と意味を同時に学ぶこと。 ⇔変則 [ヘボン] (4)〔数〕 (ア)複素関数が微分可能であること。 (イ)行列が逆行列をもつこと。 (ウ)曲線が到る所で接線をもち、かつそれが連続的に変化すること。 とのことらしいですが モデル選択やモデルの検定において、統計学において信じられてきたのは 「データ→最尤推定量→経験損失→情報処理」 だったわけです(フィッシャーの夢)。 が、この方法は、最尤推定量が頼りになる場合(統計的正則モデル) でなければ意味がありません。 というところの統計的正則という意味がわかりません わかるかたがいらっしゃいましたらおしえてください
>>171-172 E[(z-μz)^2]
= E[z^2-2μz*z+μz^2]
= E[z^2]-2E[μz*z]+μz^2
= E[z^2]-2E[μz]*E[z]+μz^2 (zとμzは独立)
= E[z^2]-2μz*μz+μz^2
= E[z^2]-μz^2
上の式と同様に、一般に
V[ei]=E[ei^2]-(E[ei])^2 が成り立つからE[ei]が0でないと
E[ei^2]=V[ei] とはならない。
175 :
132人目の素数さん :05/01/01 15:12:22
V(X1+X2) = V(X1) + V(X2) + 2Cov(X1,X2) という公式がありますが、 分散は普遍分散で、今日分散は母分散ですよね? なんか違和感を感じるのですが、この違和感を解決してくれる方はいませんか?
>>175 あんた不偏分散って何なのか何も分かってないんじゃないの?
この式自体は、両辺が不偏分散であろうと普通分散であろうと成り立つと思うけど。
あと2chといえどもここは学問板なのだから不偏分散とか共分散とか用語は正確に書いてください。
不偏分散と普通の分散の違いを詳しく教えてください。 本よんでもいまいちわからなくて。
178 :
132人目の素数さん :05/01/05 22:25:07
質問させてください。以下のようなデータがあります(ある行動の単位時間あたりの生起回数)。 A群 0 0 0 0 0 0 B群 0 0 0 0 0 0 C群 1.2 1.1 0.5 0 0 0 群間に生起回数に差があるかどうかを検定するにはどの方法が良いのでしょうか? クラスカル・ウォリス検定? マン・ホイットニーのU検定? それともそもそもこのデータでは検定が無理ですか?
>>177 母分散σ^2を推定するのに標本数nのX1・・Xnを取って標本分散を求めるんだけど、標本分散を求める
基準の標本平均ΣXi/n自体がσ^2/nの分散が生じてしまうため、標本分散を求めるのに普通にnで割ると
標本分散の期待値がσ^2(n-1)/nとなってしまうのでn-1で割れば期待値がσ^2に等しくなる(これを不偏推定量と言う)
どの統計学の本にも書いてある基礎事項なので、よく理解しておくこと。
ちなみにt検定で使う分散は不偏分散。
>>178 3群ではU検定は使えないので,クラスカル・ウォリス検定をしてみると有意差はでません。多重比較をしても同様かと・・・
181 :
132人目の素数さん :05/01/08 21:18:51
互いに相関係数が0.5ぐらいある説明変数を用いての重回帰分析に意味があるのでしょうか?
182 :
132人目の素数さん :05/01/08 21:30:32
ポアゾン分布について、P=(X=k+1)と、P(X=k)の関係式(k=1,2,3…)を導き、2項分布と同様なアルゴリズムを作りなさい。 どう書けば、単位がきますか?? 助けてください!!!
183 :
132人目の素数さん :05/01/08 23:06:27
何で中国の人口は一人っ子政策実施中なのに増え続けるんだろう。。。 だれか教えてください
184 :
132人目の素数さん :05/01/10 18:50:52
t検定について質問させてください。
対応のないt検定と対応のあるt検定、やり方がどう違うか教えてください。
まず等分散かどうかを調べ、等分散でなければWelchの方法でやっていたのですが、
このやり方だと対応のある場合は、どのようにやり方を変えたら良いのかわかりません。
>>183 色々と例外があるため。
農家の場合、一人目が女の子だった場合はもう一人生んでも良い。
自分と配偶者が共に一人っ子であれば、その夫婦は二人生んで良い。
政策自体が適用されない少数民族がある。
などなど。
185 :
184 :05/01/10 18:54:06
自己解決できそうですが、やはりわからない点が一つ。 対応のあるt検定では、等分散かどうかを調べる必要がないのでしょうか?
186 :
132人目の素数さん :05/01/10 19:37:20
レイリー分布に添うってどういうことなんでしょうか? x^2検定でなんですが・・・。 わかる方いたらお願いします
>184 対応のあるt検定は、差 d_j=X_i-Y_i について母平均0の検定の一標本問題だから.
>181 独立でなくても、最良線形不偏推定量(BLUE)なので、予測としては意味がある。 各説明変数の効果を考えたかったら共分散構造解析じゃないかな
>178 生起回数よりも、生起するかどうか?でexactにやってみては? 全事象数は2^18 データよりも極端な事象数は6C6*6C6*(6C6+6C5+6C4+6C3) p値は0.0001602173で有意(p1=p2=p3でない) 多重比較するには、 ボンフェローニ使って有意水準を3等分して A群C群のp値は0.01025391 B群C群のp値は0.01025391 A群B群のp値は1 有意水準5%ならA群C群、B群C群は有意 有意水準1%なら、もうちょい調べた方がいい でどうでしょう?
>186
こうらしいですよ。へーへーへー
自由度2のχ分布は
レイリー分布:f(x)=x/σ^2exp(-x^2/2σ2)
自由度3のχ分布は
マクスウェル分布:f(x)=2^(3/2)/σ^3x^2exp(-x^2/2σ2)
と命名されています.
χ2分布は主として統計分野で用いられていますが,χ分布,
とりわけ,レイリー分布は英国のレイリー卿が音響工学との関連でこの分布を発見したことに由来し,
マクスウェル分布は気体分子の速度分布と関係した物理学上の重要な分布関数になっています.
ttp://www.geocities.jp/ikuro_kotaro/koramu/hyoteki.htm
↑”χ2乗分布”の”2乗”抜けてます。汗
↑やっぱ無くていいみたいです。すみません。
平均をλとすると,x番目の階級の期待値は n e^(λ)λ^x /x! 最両端の階級の期待値が小さければ隣に併合していくのですが, この期待値の計算において,200だと200!が出てきます. ここでオーバーフローを起こしてると思われます. まぁ,そんなところは期待値が小さいでしょうし,自分で併合してあげてから, ソフトにかければいいと思います. また,階級を細かく区切りすぎてもまずいです. 各階級が5以上になるのが目安です. 併合しすぎると,”適合しないとは言えない”になり, 細かすぎると,”適合しない”になる. うーん,検定の限界ですな.
195 :
統計ド素人 :05/01/12 02:31:30
ちょっとお聞きしたいんですけど 出生率を統計学で表したいんですが、どの公式を使ったら一番しっくりくるんですかね?
196 :
132人目の素数さん :05/01/12 03:10:58
たぶん小さすぎて0になっているんでしょう. 有意確率とは,そのモデルに従っているとすると, それより極端な結果が出る確率です. つまり, 有意確率が0.001だと,それより極端な結果は1000回に1回しか起こらない んじゃ,そのモデルに従ってないだろうってことになります あと,ポアソン分布は稀現象の大量観察に適用されます. 指数分布,ワイブル分布,ガンマ分布,対数正規分布などに当てはめてみてはどうでしょうか?
198 :
132人目の素数さん :05/01/12 20:35:14
線型モデルにおいて、パラメータ推定に最小二乗法を使えば線型推定量はBLUEが保証され、 さらに誤差が正規分布に従えば、線型推定量に限らず全ての推定量においてBLUEが保証されますよね? この時、線型推定量以外の推定量とは具体的にどんな物なのでしょうか? アドバイスよろしくお願いします。
BLUE(最良線形不偏推定量)って言ってる時点で 線形推定量以外の推定量って変だと思うのですが。。
200 :
132人目の素数さん :05/01/13 00:50:42
すいませんでした。 ×さらに誤差が正規分布に従えば、線型推定量に限らず全ての推定量においてBLUEが保証されますよね? ○さらに誤差が正規分布に従えば、線型推定量に限らず全ての推定量において最良推定量であることが保証されますよね? アドバイスよろしくお願いします。
201 :
132人目の素数さん :05/01/13 15:51:37
統計学の advanced なテキストが読めるサイトとかありませんか? もしあれば、教えていただけると幸いです。
線形モデル Yi=α1+α2 X2i+α3 X3i+...+αk Xki+ui において 最小2乗法によるパラメータの推定量a1^,a2^,...,ak^を用いたYの推定量 a1^+a2^ X2+...+ak^Xk は最小分散線形不偏推定量になる. また,uiが独立でN(0,σ^2)に従うとすると パラメータの最尤推定量b1^,b2^,...,bk^,σ^2^は漸近一致かつ漸近分散最小. また,線形モデルにおけるパラメータの最小2乗推定量と最尤推定量は一致する という話の流れだと思うのですが, 線形推定量に限らず全ての推定量において最良推定量であるの意味がよくわからないです.
203 :
132人目の素数さん :05/01/13 21:16:20
モーメントの定義についてお聞きしたいのですが、 r.v.Xが正規分布や対数正規分布だとして、 E[X^{1/2}] とか、 E[X^{-1}] もモーメントと呼ぶのでしょうか? また、これらの値は発散せず、存在するのでしょうか?
204 :
132人目の素数さん :05/01/13 21:28:44
>>203 そう呼べばそう呼ぶ。
一般にモーメントは発散しないことが保障されていないので、
発散したらしたでいいんでは。
>>204 定義次第と言うことですね。
一般にモーメントは発散しないことが保証されていないということに関してですが、
例えば対数正規分布なら、
m=1,2,3,…
とモーメントの次数が自然数ならその存在が保証されていますが、
m=-2だったり1/2だったりするときには、実際に計算してみるしかないと言うことでしょうか?
>>205 > 実際に計算してみるしかないと言うことでしょうか?
そうです。
208 :
質問 :05/01/14 20:08:53
時系列の教科書に次のようにかいてあります。 弱定常な時系列の観測値 {y_1,...y_N} があるとき、 この時系列の平均値 (弱定常なので定数) は、 次の式により推定される。 m^ = (1/N) 納n=1,N] y_n これがなぜ推定になるのか、よく分かりません。 N→∞ のとき、m^→(実際の平均) となることが証明できるのでしょうか? できるのであれば教えていただけませんか?
>>208 単に推定量という場合、それは実際の統計量に収束しなくてもよい。
データ数が増えたときに実際の統計量に収束する推定量は一致推定量という。
一致推定量ではない推定量でも、よく使われることがある。
210 :
質問 :05/01/17 16:40:23
beta-divergence について知りたいのですが、 どういった文献を読めばいいでしょうか?
211 :
132人目の素数さん :05/01/18 22:01:21
可変応答平滑法について詳しく説明している 書籍、サイトなどありましたら教えて下さい。
214 :
132人目の素数さん :05/01/19 11:36:36
情報幾何に出てくる概念らしいのですが、 carrier measure とは何でしょうか? わかる方いらっしゃいますか?
>>214 初等知識で解釈すれば、
carrier 関数値が0でない要素の集合。
measure 測度〜体積
216 :
132人目の素数さん :05/01/19 23:01:47
217 :
132人目の素数さん :05/01/20 01:16:07
208でも209でもありませんが、 エルゴード性って弱定常性から導出されるものなのでしょうか? それとも、弱定常性にさらにエルゴード性を仮定するでしょうか?
218 :
132人目の素数さん :05/01/20 08:10:09
弱定常性は、時間に依存せずに平均が一定であることを保証している。 当然有界であるのだが。 しかし平均を推定する場合、標本平均は自然な推定量のように思える が、実はそうではないので、標本平均が真のパラメータに収束する様 に仮定しているのが、エルゴード性です。 エルゴード性の仮定を宣言していなくても、特別な場合を除いて仮定 されていると言っていいのでは?
219 :
132人目の素数さん :05/01/20 09:22:56
second-order statistics ってなんのことでしょうか? それと higher-order statistics は?
220 :
132人目の素数さん :05/01/20 15:38:11
highre-order statistics は、具体的にゲノム関連、 マイクロアレイデータの解析などを議論するような 統計ではないのかなあ? それらの関連する論文の中にこの表現があったような 記憶が・・・ second-order statistics わからない。 正規性をベースに議論しているのか?
221 :
132人目の素数さん :05/01/20 17:27:44
ポワゾン分布の確立密度関数で、eについてる−μの計算の しかたがわかりません。教えてください。
222 :
132人目の素数さん :05/01/20 17:28:20
223 :
132人目の素数さん :05/01/20 17:40:45
e=2.71828 μ=0.4として eに−0.4乗がくっついているんですが それをどう計算すればいいのかがわかりません。
>>220 > 正規性をベースに議論しているのか?
たぶん、そうだと思います。
2次以上のモーメントについて研究する統計学ということかな。。。
225 :
132人目の素数さん :05/01/20 18:04:40
sub-gaussian data と super-gaussian data って何か分かりますか?
227 :
132人目の素数さん :05/01/20 18:50:48
>>225 なんだか統計屋さんではなくて情報屋さんが定義したような言葉だな。
228 :
132人目の素数さん :05/01/20 23:10:29
>>215 > carrier 関数値が0でない要素の集合。
測度は分かりますが (ルベーグ積分に出てくるやつですよね)
carrier っていうのがイメージがつかめません。
関数値が0でない要素の集合が、どうして carrier (運ぶもの) なんでしょうか。
それは、解析学でいう台 (supp) と同じ意味ですか?
同じ。
230 :
132人目の素数さん :05/01/22 00:32:30 ID:EvrlJI0k BE:53294786-
マンガでまなぶ統計学ってどうですか?
231 :
132人目の素数さん :05/01/22 01:32:29
nΣxy-ΣxΣy/√[nΣx^2-(Σx)^2][nΣy^2-(Σy)^2] これって何の方程式でしょうか?? テストにこれ出るよって言われたけど、 なにを求めるものか分からなくてとっても困ってます。 お願いします。
232 :
132人目の素数さん :05/01/22 11:49:13
ランダムウォークの平均値がなぜゼロでないのかわかりません。 証明ください。
233 :
132人目の素数さん :05/01/22 16:45:37
すみません。あまりにも馬鹿げたことなので、ここに書いて良いものなのか分かりませんが 一応、統計学のことなので質問させてください。 「正規分布とはいかなるものか。小学生にでも分かるように説明しなさい。」 という課題が出題されたのですが、私もそれほど理解できていないので上手く説明できません。。 どなたか上手く説明出来ないでしょうか? 変な質問ですが、教えていただけませんでしょうか、、? 答えには図でも式でも言葉で説明しても構わないそうです。
234 :
233 :05/01/22 17:10:19
申し訳ございません。 × 答えには図でも式でも言葉で説明しても構わないそうです。 ○ 答えには図でも式でも言葉でも、なにを使って説明しても構わないそうです。 の間違いでした。
X1とX2が独立していて、それぞれλ1λ2のパラメータをもつ指数分布に従うとき、 Z=X1/X2の分布とP[X1>X2]を計算せよとの問題が出たんですが、どうしてもわか りません。。教えてもらえないでしょうか?
>>235 習った事を理解出来ていなければ全く無理。
問題を数式で表現し直せるか?
237 :
132人目の素数さん :05/01/24 18:50:40
X、Yをそれぞれ独立なパラメータx、yのベルヌーイ分布に従う確率変数とする。X−Yの期待値と分散を求めよ。 教えてください
238 :
132人目の素数さん :05/01/24 19:23:29
おまえら質問をする前にどれだけ 自分で勉強をしているんだ?
239 :
132人目の素数さん :05/01/24 20:23:29
multivariate joint normality とはなにか分かるでしょうか?
>239 多変量結合の正規性で良いかな。多種多数の確率変数から成る 多数の変数の結合分布は正規分布と見なせる、事かな。
241 :
132人目の素数さん :05/01/25 14:27:57
中心極限定理は、独立同一分布の和に対してしか成り立たないのではなかったですか?
242 :
132人目の素数さん :05/01/25 15:22:10
とある実験結果があまりにもばらつきすぎて困っています。 (対象が人間なので) 例えば、あるサンプルから求めた平均より、標準偏差が大きい場合は あまりいいサンプルではないと言えるのでしょうか?
ばらつきが大きい分布をもつ現象ならば、 ばらつきが大きいサンプルが得られたとしてもおかしくないよ。
244 :
132人目の素数さん :05/01/25 16:36:12
今研究で数量化3類をやっているんですが、カテゴリースコア、固有値、寄与率の意味がわかりません? カテゴリースコアの散布図がにおいて位置が近ければ傾向が似ているというのはなんとなく分かるんですけど。
245 :
242 :05/01/25 16:50:43
>>243 さん
レスありがとうございます。
そーですよね。
あまり自信が持てなかったもので。。
卒論に載せていいものかどうかと。
246 :
132人目の素数さん :05/01/25 20:45:22
247 :
132人目の素数さん :05/01/25 21:24:20
工場で生産される製品1個あたりの重さは、標準偏差がa=2gである。 製品25個をランダムに取り出して重さを計ったところ、平均9,5g であった。製品1個当たりの重さuを区間推定しよう。ただし製品の重さは 正規分布に従っているものとする。 1、標本平均Xの確率分布の1平均、2標準偏差を示せ 2、95%信頼区間と90%信頼区間を計算し、その区間の違いについて 考察せよ この問題について教えてください お願いします
248 :
132人目の素数さん :05/01/25 22:09:58
Xi (1≦i≦n)はN(μ0,σ^2)からの大きさnのランダム標本。μ0:既知、σ^2:未知。 s^2 = (Xi-μ0)^2 のときに、Var(s^2)ってどう求めればいいんでしょうか? = E[(s^2)^2] + (E[s^2])^2 まではわかるんですけど、E[(s^2)^2]をどうしたらいいやら・・。
2要因の分散分析で等分散性が仮定されなかった場合、どうすればいいんでしょうか?
250 :
132人目の素数さん :05/01/26 11:28:23
>>246 どこまで緩められるのか教えていただけませんか?
251 :
132人目の素数さん :05/01/26 18:15:45
3次キュムラントと4次キュムラントを一言で言えますか? 3次4次キュムラントがどうなったらどういうことを表すんですか? 図書館の本に載ってないぽ。
一次、二次のキュムラントから敷衍類推する。
253 :
132人目の素数さん :05/01/26 18:36:27
>>250 mixing condition でも言えるのでは?
>>252 「敷衍類推」が読めない時点でもうダメぽ…orz
255 :
132人目の素数さん :05/01/26 20:14:41
統計で就職したいんですがどこに就職できますか?
256 :
132人目の素数さん :05/01/26 20:19:44
257 :
全く初心者 :05/01/27 01:28:37
相関係数を求めて、2変数の相関関係を分析しています。 元の2変数とも量的変数であることが条件だということはわかります。 しかし、この2変数はそれぞればらつきがあり、正規性がないのですが、 相関係数⇒回帰曲線と求めていっても良いのでしょうか? それとも正規分布になるように変数変換等が必要?? 是非ご回答お願いしますm(_ _"m)
>>257 データが正規分布に従っている必要はない。
>>254 歪度 (skewness)、尖度 (kurtosis)
260 :
132人目の素数さん :05/01/27 12:07:21
明日統計学のテストでございます、テストはデータの数値が変えた問題が 出ます、どうかこの馬鹿(標準偏差も解らない程度の私に解き方を教えて ください・・) 為替レート(x)と株価(y)の関係を示したデータである。 回帰モデルY=α+βXを適用した時、βの有意性を調べよ。 x 100 110 120 130 140 y 200 220 190 260 330
今日テストだったらもう遅いだろうが、まあ、一応。 やりかた 1.単回帰直線をもとめます 2.決定係数R^2を求めます。 3.R^2が大きい方が当てはまりがいいと言えます。 β = 相関係数 * ((yの標準偏差) / (xの標準偏差)) R^2 = 1 - (残差平方和) / (総平方和) 相関係数、標準偏差、残差平方和、総平方和の出し方はググりましょう。 意味わからないと辛いだけだろうな。
標準偏差が分からないならまず無理だと思う・・・
263 :
全く初心者 :05/01/28 09:20:57
相関分析で相関係数を計算する場合、「元の2変数はどちらも正規分布の必要がある」 と言う方と、「必要なし」という方がいます。 どちらが正解なのでしょうか?;証明などありましたら、ぜひ御教授ください。
264 :
132人目の素数さん :05/01/28 19:50:02
>>263 必要なしだよ。
線形回帰というのは、1つの考え方では、
2つの変数間のモデルを Y=aX+e と仮定する手法だ (e は正規分布に従うノイズ)。
仮定するのだから、実際に X と Y にどういう関係があるのか
なんて知らなくても、手法は適用できる。
そのモデルを当てはめたことの適切さを測るのが
相関係数だと考えればいい。
265 :
132人目の素数さん :05/01/28 19:52:35
次の定理の証明を教えてください。 【定理】 P(t) を m 次多項式とする。 f(t)=exp(P(t)) が特性関数であるなら、m<=2 である。
ド素人の書き込みで申し訳ありません、4622339と103764を使う場合の 相関係数の求め方を教えて下さい。お願いいたします。
宿題課題丸投げのシーズン到来 数学板の風物詩ですな
丸投げではないですが相関係数の求め方がわからないとどうしようもないんです。数字は適当に変えてもらって構わないので、求め方を教えてもらえると嬉しいです。
>>265 f(t) の逆フーリエ変換が密度関数になるので、
実際に計算して P(t) が3次以上の時に、
積分が発散することを示せばよい。
270 :
132人目の素数さん :05/01/29 15:02:24
ポアソン分布のパラメータである「λ」が,1以下の場合ってありえますか? 例えば,0.87という結果が出てしまうとか。
>>270 当然ある。ちなみにポアソン分布応用の歴史的例(ポーランドの統計家ボルト
キーヴィッツが1898年の論文でポアソン分布の適用例として示した有名な例)
では、1875年〜1894年の間に馬に蹴られて死んだプロシアの兵士の軍団ごとの
人数分布の説明に用いられたが、この場合λ=0.7ととると観測値によく合っていた。
272 :
132人目の素数さん :05/01/29 18:47:05
分散が不明な場合の母平均の検定は、 なぜ正規検定ではなくt検定を使わなくてはいけないんですか? 教えてください。よろしくお願いします。
274 :
132人目の素数さん :05/01/29 23:02:41
○×問題です。 (1)相関分析において、母相関係数がゼロであるかの検定H:p=p。(=0) は行うことができるが相関係数がゼロでない値であるかどうかの検定Hp=p。(≠0)はできない。 (2)最小二乗法による単回帰分析において定数項(切片)の推定値はt分布に従う。 − (3)母回帰の推定はx=xで最も推定精度が高くなる。 (4)回帰分析において、実測値と予測値の相関係数の二乗は寄与率と呼ばれる。 (5)重回帰分析の説明変数選択において、目的変数に対して意味のない説明変数を加えると 寄与率が減少する。 (6)主成分分析の出発行列には分散共分散行列と相関係数行列である。 留年がかかってます。 誰かよろしくおねがいします。
季節だなあ… 丸投げするようなヤシは留年させたほうがいいと思ってしまう。
>>272 (X-μ)/σ は正規分布にしたがうが(Xは標本平均、μは母平均、σは母分散)、
定数σを確率変数S(Sは標本分散)でおきかえた (X-μ)/S は正規分布でなくt分布に
したがうから。
二乗じゃないから「分散」を「標準偏差」に訂正
278 :
相変わらず初心者 :05/01/30 21:53:18
質問です。 例えばこんなデータの場合どんな統計手法を使えば・・ 【バスカードの処理機】 30日毎に取るデータで、 その30日間のカード通過枚数と、その期間に詰まった回数の関係を知りたい時 1ヶ月で1000枚通過・その期間の詰まりが5件 などなど これが月毎にばらばらにある時です。(何時詰まったかは分からず、件数のみです) このような場合どんな統計手法を用いればいいでしょうか??
280 :
相変わらず初心者 :05/01/31 00:24:16
やはり二項分布とか、ポアソン分布になりますか・・ 最近、Spearmanの順位相関係数というものを知りました。 故障回数を順序に変換または順序と考えて、 Spearmanの順位相関係数を利用しても問題ないでしょうか・・
281 :
132人目の素数さん :05/01/31 00:42:34
分からない問題スレで一つもレスが付かなかったので、改めてこちらでお願いします。 データの精度水準の中で、「間隔尺度」と言うものがありますが、 温度表示(摂氏、華氏)以外の例で何かありませんか?
丸投げの季節がやってまいりました。
>>281 「間隔尺度」とか「Interval Scale」とかでぐぐれ。
いくらでも例が出てくる。
・・・と書いたけど、例を一つだけ挙げておく。 「テストの点数」
えー!そうなんですか。 テストの点数は比例尺度だと思ってました。 全然理解して無かったです。orz とにかくレス有難うございました。
すごくいい例が見つかった、「西暦」
例えばセンター試験でやった数学のテストの得点が0点だったとしても、 それによって数学能力がゼロだという解釈にならないので、 比例尺度じゃないんですね。
288 :
132人目の素数さん :05/01/31 20:05:45
>>287 センター試験の数学のテストが「数学能力」を測るものだなんて、
いったい誰が定義したのかな?
「数学テストの点数」を測るものかも知れませんよ。
センター試験の数学テストが数学能力を測れるものじゃないからこそ比例尺度なんじゃないかな。
しかも
>>287 は例え話をしていて、定義の話はしてないし。
290 :
132人目の素数さん :05/02/02 21:06:30
時系列のコレログラムについての質問です。 1,2,3,4,5,6,7,8,9,....,20 と時系列があるとします。 この時、自己相関はlag1 , lag2 , lag3 ...とずっと1のままだと思うのですが ソフトウェアに計算させると値が違います。 lag1の自己相関は 1,2,3,4,5,6,7,8,9..19 2,3,4,5,6,7,8,9....20 の相関係数。 だと思っているのですが 根本的に考え方がちがうのでしょうか?
291 :
匿名 :05/02/02 22:53:48
母比率の推定の応用 信頼区間 100(1-α)%を固定し、このときの母比率pの信頼区間を[P1,P2] とするとき、P2-P1=l P1-P2 l<δ (δは、例えば0.05、0.02、…) を満足させるのに必要な標本の大きさnを求めよ。っていう問題なんですけど。 お願いします。すいません。
>>291 母比率の信頼区間の幅の公式 √(x(1-x)/n)を用いればよいが、標本比率を与える
必要があるのでは。
標本の大きさを決めてから調査するわけだから、標本比率を先に与えるのは変か。 nをとめたとき、誤差が最大になるのはx=0.5のときだから、その場合に条件を満足 させれば(十分条件としては)よいと思われ。
294 :
匿名 :05/02/03 01:39:03
ありがとうございます。明日テストなんで、助かりました。
296 :
132人目の素数さん :05/02/03 19:27:24
量子化誤差の平均値とRMSを数式で表すとどうなりますか? 最初の定義式から簡単でもいいのでやり方がわかればいいんですが
297 :
132人目の素数さん :05/02/03 22:39:06
明日テストです・・・助けてください・・・ 宝くじは平均に賭けるのではなく分散に賭けるのだという 解釈がある。これについて簡潔に説明せよ。
>>297 いくらなんでも丸投げ過ぎ。
平均と分散の意味がわかれば一発でわかるぞ。
>>297 「平均に賭ける」というのは、
「1枚宝くじを買うと確率的にこれだけバックが来る」
という発想で賭けること。
「分散に賭ける」というのは、
「宝くじを買うと、ひょっとして1億円あたるかもしれない」
という発想で賭けること。
300 :
132人目の素数さん :05/02/04 20:27:14
301 :
132人目の素数さん :05/02/04 20:59:05
>>300 あなたが考えているコレログラムの定義は?
302 :
301 :05/02/04 21:01:09
平均を考慮しているのか?
303 :
132人目の素数さん :05/02/04 21:20:26
>>300 時系列の観測結果 x1, x2,…, xT が与えられているとき, 差が h (≧0) である2つの時点の値の相関を示す量
で、相関を示す量を「ピアソンの積率相関係数」だと思っています。
だとすると
時系列データ
1,2,3,4,5,6,7,8,9....20
のコレログラムはずっと1だと思うのですがソフトで計算するとそうならないのです。
具体的にはRで
>acf ( 1:20 , plot=FALSE)
0 1 2 3 4 5 6 7 8 9 10
1.000 0.850 0.702 0.556 0.415 0.280 0.153 0.034 -0.074 -0.170 -0.252
11 12 13
-0.319 -0.370 -0.403
となります。アドバイスよろしくお願いします。
304 :
132人目の素数さん :05/02/04 21:32:36
「思うのですが」って自分で実際に計算していないのか?
305 :
132人目の素数さん :05/02/04 21:41:28
計算するまでもなく1
306 :
132人目の素数さん :05/02/05 15:57:38
教えてください! 母集団の分布がN(50.60)であるとき、 n=100の標本分布で 平均値xが49以下となる確率はいくらか。また、n=400の場合はどうか。 という問題です。
>>306 xはN(50,60/n)にしたがう。あとは標準化(xから平均を引いて標準偏差で割る)
して標準正規分布表を使え。
308 :
132人目の素数さん :05/02/05 16:27:57
ありがとうございました!
310 :
132人目の素数さん :05/02/06 14:51:30
時系列データが 1,2,3,4,5,6,7,8,9....20 だとすると。 統計ソフトRのコードで恐縮なのですが、 ρ(0) : cor ( 1:20 , 1:20 ) = 1 ρ(1) : cor ( 2:20 , 1:19 ) = 1 ρ(2) : cor ( 3:20 , 1:18 ) = 1 ... となると思っています。 コレログラムを間違って理解しているのだと思うのですが、 教科書を見る限りそうとも思えないのでアドバイスを求めています。 よろしくお願いします。
311 :
132人目の素数さん :05/02/06 17:56:34
確率変数 x, y があるとき、同時密度関数の特性関数から クロスキュムラント cum(x,y) が定義されることは分かりますが、 クロスしていないキュムラント cum(x,x) は、 確率変数 x を単独で考えた場合の2次キュムラントと一致するのでしょうか? 一般に3次以上キュムラント cum(x,x,x) でも一致するでしょうか? (x, y が独立なときは一致することは明らかですが、 独立でないときも一致するのでしょうか?)
>>310 どの教科書を見ているのかな。
普通、自己相関係数の計算で、分散を出すのに使う「平均値」は
全データ [1,2,...,20} の平均値を使う。Rもそれで計算してる。よくしらないが。
{1,2,...,19} と {2,3,...,20} の相関係数を求めるときは、それぞれに平均値を求める。
これで自己相関を定義している本もあるのかもしれない。
データが多いときはどちらでも大差ないと思うが、
その例はずらすたびに最大値と最小値が消えていくから食い違いがでかい。
いろいろ調べて、標本分散を用いるよりも、母集団標本に近い値を得ることができるというのはわかったのですが、 なぜ、不偏分散の分母がn-1なのでしょうか?n-2じゃだめなのですか? n-1という数字がどのようにして求められたのかをご教授ください。
ごめん。中心極限定理いらんかった。独立だけで計算できたわ。
319 :
132人目の素数さん :05/02/11 10:59:57
>>319 一部は理系コースなら高校数学でも出てくるようなものかな。
あとは大学の基礎教養課程の範囲に収まってる。
会計士さんってこういうこともできないといけない時代なのね。
でもあれだよね。 中途半端な知識持たれると、返って困る。 このレベルなら関係ないけど。
323 :
319 :05/02/11 22:36:49
レスさんくすです。 この問題で教養課程なんですね。当方、統計学初心者です。でも確かに、高校数学の知識で 解けるような問題もちらほらあるみたいですね。 ところで、このサンプル問題が8割ぐらい解けるようになるには、高校の数学Vの知識は 必要なのでしょうか。当方、文系なので数U止まりでした。 質問ばかりですまそ。
特に高校数学を勉強し直さなくても、 基礎からちゃんと説明してある統計学の本を読めばいいとおもう。 統計に関しては社会人向けの簡単な本がたくさんあるから、 独学でも十分に>319の問題は解けるようになるよ。
325 :
132人目の素数さん :05/02/12 20:42:26
検定方法についてアドバイスをください。 10人を対象とした5種類のゲームにかかった時間を採ったデータがある とします。1種類のゲームにつき15回の測定をし、一人当たり75回の 測定をしました。 これをもとにそれそれ1人のサンプルを母集団とし、 検定によってそれぞれ母集団間の『差があるかどうか』を 求めたいのですが、どのような検定をすればいいのでしょうか? なお、ノンパラメトリック検定のクラスカル・ウォリス検定はしましたが、 これでよいのでしょうか?
326 :
132人目の素数さん :05/02/13 03:59:41
帰無仮説は何?
327 :
132人目の素数さん :05/02/13 04:41:00
>325 仮定にもよると思うけど、それぞれのゲームを変量効果とした混合モデルかな。 もしも、10人の中から選んだ重複のない二人の組み合わせのうち、 ひとつでも有意差があることをもって有意とするならば、Tukeyの多重比較 という手もある。帰無仮説によるけど。
328 :
325 :05/02/13 07:58:29
329 :
132人目の素数さん :05/02/13 19:38:33
327です。 > 結局、明確に時間差が出ており、短時間で済むゲームと長時間かかるゲームが > 存在することを見出したいのです。 ということは、どの人とどの人の間に差があるのかじゃなくて、どのゲームとどのゲームの 間に差があるのかをみたいの? それだったら、人を変量効果とした混合モデル。
330 :
325 :05/02/14 04:58:57
331 :
325 :05/02/14 05:01:29
とりあえずやってみます。
332 :
325 :05/02/14 14:22:11
なんとか帰無仮説『差が無い』というのは、棄却されそうです。 要因A:ゲーム別 要因B:人別 二元配置分散解析(混合モデル) ----------------------------------------------------------------- 変動要因平方和自由度平均平方F値P値 要因A83406.86420851.715.1760.002 要因B399437.8944381.9723.041.50E-34 交互作用145014.2364028.1722.0911.50E-34 残差13482197001926.027 全体19760787492638.288 ------------------------------------------------------------------- という形になりました。 もともと分散が大きなデータであったので、なんともいえませんが、 結果は結果として扱おうと思います。
333 :
325 :05/02/14 14:25:16
見づらくて、すいません。 二元配置分散解析(混合モデル) --------------------------------------------------------------------- 変動要因 平方和 自由度 平均平方 F値 P値 要因A 83406.86 4 20851.71 5.176469624 0.00212513 要因B 399437.8 9 44381.97 23.04327509 1.50E-34 交互作用 145014.2 36 4028.172 2.091441086 1.50E-34 残差 1348219 700 1926.027 全体 1976078 749 2638.288 ---------------------------------------------------------------------
334 :
132人目の素数さん :05/02/14 20:22:52
回帰分析において、説明変数に相関関係があったら、 回帰係数を用いて要因分析をするなんて無意味ですよな?? いくら勉強してもどうもここがわからないのです。 平気で要因分析をしているレポートをよくみるのですが・・・・
335 :
132人目の素数さん :05/02/15 01:11:49
336 :
325 :05/02/15 07:01:45
>>335 (
>>327 )さん
たびたびどうもです。
混合モデルでの解析を行う前にその資料にも
目を通したのですが、『似たようなこと言ってるな』程度で
気にしてませんでした。
うーん、混合モデルと言っても違うものなんですね。
わかりました。
ひきつづき、解析してみます。
337 :
132人目の素数さん :05/02/15 21:13:13
>>335 レスありがとうございます。
マーケティング分野での利用を考えています。
どの要因がより効いているかを比較したいのです。
データに相関関係が少しでもあれば、偏回帰係数に意味がないと思うのですが、
レポートなどでは普通に偏回帰係数を比較することで、要因分析をしています。
どうなのでしょうか?
338 :
132人目の素数さん :05/02/16 00:08:52
>>337 335です。
多重共線性のもんだいですね。やっぱり相関関係のあるものは避けたいですね。
でも、まったく相関関係のないものは珍しいから、現実的にはある程度許容せざるを得なく
なるんでしょうね。
それと、多重共線性があるかどうかを調べるのにこんな方法があります。
ある説明変数を目的変数として、その他の全ての説明変数を説明変数として
重回帰分析を行う。そして、そのときの決定係数(寄与率)を調べる。
その寄与率が高いほど多重共線性の度合いが大きくなっているといえるでしょう。
339 :
132人目の素数さん :05/02/16 13:57:26
経済学部の学生です。 計量経済学のプレイス・ウインステン変換で、「定数項なしの最小二乗法」と いうのが出てくるのですが、「定数項なしの最小二乗法」とはどのようにする のか書いてある本がありません。 ご存知の方がいらっしゃったら、ご教授をお願いします。
例えば最小二乗法で線形関数 y = b1 x + b0 をはめるとすると、b0が定数項だわな。 それを落として、y = b1 xだけを使ってやればいいんでそ。
341 :
132人目の素数さん :05/02/16 21:16:35
>>340 > をはめるとすると、b0が定数項だわな。
> それを落として、y = b1 xだけを使ってやればいいんでそ。
そんな乱暴な。単純にy切片を落としちゃだめだよ。
xとyの次元を1だけ拡大して定数1を追加しておいて、b1の対応する次元に定数項b0を
埋め込むんでしょ。
340で合ってると思う。341は、定数項なし→ありへの拡張じゃない? y = b1x1+b2x2 だとしたら 残差の2乗はΣ(y-b1x1- b2x2)^2 これをb1,b2でそれぞれ偏微分したものが0になるとしてやると 正規方程式が出てくるので連立させて解く y = b1x1 だったら、上と同様にして b1=Σ(x1y)/Σ(x1^2) になる
>337 そんなあなたに共分散構造解析(SEM)
344 :
132人目の素数さん :05/02/17 02:46:52
345 :
軟弱マン :05/02/17 03:07:26
誰か教えてください〜!死者数とシードベルトの着用の有無の関連性についての 「ケガした人」と「死亡した人」の帰無仮説と対立仮説はなにかがわかりません! こんなこともわからない私を助けてください。レポートなんです・・・
>>345 「帰無仮説」とは文字通り無に帰して欲しい仮説。
それを考えればおのずと答は出るはず。
347 :
軟弱マン :05/02/17 03:30:50
すいません(・・;) 無に帰してっていうことはどういうことなんでしょう? 0ってことですか?
>>347 日本語の勉強汁
ついでにマルチが判明したので以降スルー
有意検定の際に用いられる要素の一つに有意水準(α=0.05)がありますが、 この値そのものが妥当な値か否かを検証する方法論を教えて下さい。
350 :
132人目の素数さん :05/02/17 17:00:50
初歩的な質問です。 「確率」と「確率密度」の違いについて 素人でも解るように教えてください。 お願いします。 ぐぐっても↓のようなことが書いてあるだけで、さっぱり解りません(涙 確率密度とは確率を求めるため長さ△xに乗じるべき「密度」で f(x)が大きいところには確率が濃くあるということを示している。
>>349 そんな方法あるのかね?
0.05ってのは経験的に導き出された数字だと思ってたけど。
分野によって、0.01とか0.001とか、逆に0.1ってのも見たことあるぞ。
0.05はたぶん経験的。 表裏が0.5で出現するはずのコインが、 3回連続で表なら、まあ、偶然かなと思うけど、 4回(0.0625)、5回(0.02)になると、出現確率の「確からしさ」を疑う必要がある。 もう少し具体的なモデルを挙げると、 いつも同じくらいのテストの点数とっているやつに、 もしも5回連続で勝ったら、 実力に「差がついた」と思うような感じ。
>>352 その数理モデルが知りたいのです。
その例でいうと何故5回連続で勝てば「差がついた」と「結論付けなければならないのか」を。
強調の部分がずれてました 何故「5回連続」で勝てば差がついたと「結論付けなければならないのか」を。
355 :
132人目の素数さん :05/02/18 01:46:54
>>345 軟弱まんさんへ、、これは、シードベルトをしているときの死亡割合と、
シートベルトをしていないときの志望割合が同じかを調べたいんだよね?
それだったら、帰無仮説は双方の割合に差がない。対立仮説は逆。。。。それでカイ二乗検定
ところで、前から帰になっていたんだが、行と列の間に
関係があるかどうかを調べるカイ二乗検定で割合の差の有無を検証していいnだろうか?
誰か、明快な答えをプリーズ。
>>350 これは、連続値のヒストグラムをイメージして、それぞれの棒の範囲を少しずつちじめて行って、
棒一つ当たりの確率が小さくなっていくのを想像したらどうかな。
ほとんど幅が0になるくらいまで狭めていったときの高さが確率密度。だからそのほとんど
0に近い幅をかけると確立になる。ほとんど0だけど。
>353 「差がある」か「差がない」のどちらかを決めたい。 あなたなら、どこを基準にする? まぁ、5%とか1%とかが妥当な値だと思いませんか? 結論付けなければならないのではなくて、 どちらか結論したいけど、そのままじゃどうしようもないから、 仕方なしに有意水準というものを導入しようって感じ。
>>357 なんで5%とか1%とかの数値に決めたの?どうして?その根拠は?
なんとなく?そんなの科学的ではないなぁ
>>358 5% や 1% が科学的かどうかはともかくとして、それらの確率が
何の確率なのか、わかりやすく説明できるかい ?
>>359 棄却率だろ。
だから何度も言うけどその数値で棄却あるいは採択してしまうことの信頼性の
科学的根拠を要求しているんだよ。経験則じゃなくてね。
361 :
132人目の素数さん :05/02/18 14:54:01
>>358 私も科学的でないと思う。
統計学を勉強して、検定をはじめて勉強したときの感想は
「うさんくさい」ですね。「数学的じゃない」とも。
362 :
339 :05/02/18 15:55:41
有意水準の値自体は許容できる標本数との関係から来る経験則だと思う。 値自体は経験則だが、得られた結論はその値の下で科学的 ということではないの?
>>360 君の言う「仮説を棄却または採択することの信頼性」は
棄却率で与えているとおもうんだけど??
>>364 それだと定義を内包しているね。トートロジー。
命題全体の真偽を検証している訳ではないんだよ。
確かに、p値が0.06とかだと棄却されない(有意傾向とか言うけど)が、 本当にそれで正しいのかは疑問ではある。 実は差があるのに差がないと言ってしまったり、 差がないのに差があるといってしまったりする、 その危険に対して一番折り合いのついた場所が、 経験的に3σなんだと思う。
>>367 そう。その「経験的」にを数理モデルで表現したい訳なのですよ。
で、既に理論が存在していますかと問うている。
そもそもこの値は重要で、事実隠蔽も可能であるから、数理上で採用した値の
妥当性を検定の前に事前に証明しておかないことには実は検定そのものが成立しない。
>>368 それはモデルの妥当性の問題。
一般的な理論はないよ。
>>361 君のように考える人が他にもいたから、AICみたいなものが生まれたんじゃないの?
よく知らんけど。
AICじゃダメなの?
371 :
132人目の素数さん :05/02/19 15:46:57
時系列の基礎についてお伺いしたいです。 時系列の自己共分散関数は、 その時系列が弱定常であれば(その定義によって)、 時間差のみの関数となり、時間に依存しません。 では、弱定常な2つの時系列の相互共分散関数は、 時間差のみの関数になると言えるのでしょうか? 手元の教科書では、相互共分散を C_k(i,j) = Cov[ y_n(i), y_(n-k)(j) ] のように定義しています。 これは一般に時間 n に依存するように思うのですが、 左辺の記号では n がなくなっており、時間差 k しか記述がありません。 どうしてこのようなことが許されるのか理解できません。
>>124 遅ればせながら、日本規格協会の「統計数値表―JSA-1972」に
FORTRANのプログラムが載っています。アマゾンで¥26,250 (税込)、
ユーズド価格 : ¥16,000より。図書館の禁帯出図書の所にあると
思うけど。
>>349 ,353,354,357-368
ある確率を非常に小さいとか、大きいという風に判断するのは人間に任されてい
ることではないですか??数理で結論が下せる問題ではないと思います。(確率・
統計の講義でもそのように教えられました。)
例えば、1年間で1万人近くの交通事故死亡者が出ます。日本の人口は約1億
3000万人なので、1年間で交通事故で死亡する確率は、おおよそ1万分の1。つ
まり「万が一」の出来事です。1日あたり27名、1時間あたり1名以上交通事故
で死亡する計算になります。
これを滅多に起きないことと見なすか、ありふれたことと見なすかは、人間の側
の判断に任されていることでしょう。この判断は、ことの性質に依存すると思い
ます。
もしも日本人の飛行機事故の死亡者数が年間1万人だったら、誰も飛行機に乗ら
ないでしょう。(乗る人もいるかも知れないが…)
といことで、いいと思うんですけど…。いかが??
すんません・・・。P値の出し方?がサッパリわかんないんですけど、 親切な方誰か教えてください・・・
>>373 > これを滅多に起きないことと見なすか、ありふれたことと見なすかは、人間の側
> の判断に任されていることでしょう。この判断は、ことの性質に依存すると思い
> ます。
だから有意水準が恣意的に決定されてしまうと検定そのものが意味をなさない可能性を
含むのでそれを排除しない限りは検定自体の信頼性(モデル)を獲得できない。
「昔から今までこのようにしてきた」「そしてこれまで何の問題もなかった」「だから今後も安全ダロウ」
このような論理に依存した検定を改めようということなのです。
事故統計の例でいえばヒューマンエラーを内包した検定結果からは有意な結論は得られないということです。
>373です。 >375 >だから有意水準が恣意的に決定されてしまうと検定そのものが意味をなさない可 >能性を 含むのでそれを排除しない限りは検定自体の信頼性(モデル)を獲得でき >ない。 いや、いや、困ったなや。「100分の1<10分の1」ということは数理的に 言えても、「100分の1」を何の比較対象もなしに小さいとか、大きいとか論 理的、数理的に言えないでしょう。 「万が一」の確率を小さいと考えるか、大きいと考えるかは、それぞれの経験や 対象としている事象の性質によりますよね。いってみれば、それぞれの経験や許 容範囲と比較して、大きいとか小さいとかいっているだけの話です。統計学の入 門書にもそう書いてあると思いますが…。
>373です。 >376の続きです。 たとえば、古い本ですが、大山正、池田央、武藤真介 編「心理測定・統計法」 (有斐閣双書)の103ページから104ページに ・・・・ これらの2つの立場(ある確率を小さいと見なすか、大きい見なすかという立場 のこと:373の筆者注)のうち、どちらの立場をとるべきかということに関して、 論理的な解答は存在しない。…… とあります。 実際の所、有意水準を10%にして、「差がある傾向がある」とか「マージナル (merginal)な差がある」なんてのたもう論文もあります。これも一つの見識かな とも思います。有意差を出すことだけが問題ではないと思うのだけど…。 もしも、論理的に有意水準を決定する対案があるのなら、示してくださいな。私 にはできませんので。
>375 それができないから、多少の恣意性を持ちながらでも何とかできるようにしたのが検定だと思う。 できるんなら教えて下さい。 AICでモデル選択するにしても、真のモデルを選択できてるとはかぎらなくて、 もっともらしいモデルを推測してるだけだし。基準を何にするかは解析者によるし。 統計学って、誤差を含んだ標本から何とかする学問だと思うが。 そこが強みでもあり、弱みでもあり。。 >371 時系列の自己共分散関数は、 その時系列が弱定常であれば(その定義によって)、 時間差(=k)のみの関数となり、時間(=n)に依存しません。
379 :
132人目の素数さん :05/02/20 00:53:16
>>377 数理的に差があるのか無いのかを求めたかったら、370が言っているように
AICを使って判定する方法が考えられるんじゃないかな。
帰無仮説のモデルのAICと対立仮説のAICをみて低いほうを採択していたはず。
ところで、BICを使った判定ってあるのかな?
>>349 は検定力とのバランスを考えろということでは?
これでもピタッと数字を示せるわけじゃないけど。
もうひとつ検定の弱点を。 両側検定の場合、標本を無限に多くすると、 いつかは棄却できてしまう。。。 まぁ、仮説検定なら標本数を事前に計算できるが。 有意性検定なら標本数なんて決まらないし。 統計的有意と、現実的有意を区別しておかないと痛い目に合う典型例。 統計学やってる人で検定が絶対なんて思ってる人はいないと思う。 せめて検定で有意になってくれないと、ぐらいのもんだと思ってるんだが。
>373です。 >378 >381 おっしゃるとおり。
>>379 > ところで、BICを使った判定ってあるのかな?
AICが使えるならBICも使えないことは無いんじゃない?
俺は素人なんで良く分からんけど、例えば重回帰分析のときは
「説明のためのモデルなら変数を多めに取り込むAIC、
予測のためのモデルなら変数を少なめに取り込むBICを使う」
なんてことを聞いた事がある。
>>381 > 統計的有意と、現実的有意を区別しておかないと痛い目に合う典型例。
あー、まさに今俺が業務上で直面してる問題だわ。
統計を知らない人ほど統計的有意差を絶対視してくれちゃうんだよなぁ。
サンプル数が多いから有意になってるだけなのに。
384 :
132人目の素数さん :05/02/20 02:41:25
>>383 379です。
ベイズ流の検定だったらサンプル数が多くても有意にならないものはならないよ。
これは帰無仮説である確率を直接計算してる。
普通の検定だったら検定統計量よりも極端な値になる確率を計算するっている
ちょっとおかしな計算してるでしょ。
計算方法からしてもベイズ流のほうがよさそう。
サンプル数が多ければ多ければ必ず有意になるっているのは明らかにおかしいよね。
>>376 ,377
> もしも、論理的に有意水準を決定する対案があるのなら、示してくださいな。私
> にはできませんので。
あのね、そんな方法論あるのですかと訊ねた方はこちらだったんだけど
勝手にすり替えられても如何なものかと。結局存在し得ないようだね。君の知識内だけによれば。
>>381 > 統計的有意と、現実的有意を区別しておかないと痛い目に合う典型例。
う〜ん、その二つの優位性が同値となるような条件を検定自体で決定できるか否かという問いに対して
現実的有意性とは何かと突き詰めると実際は検定外の要素で検定の信頼性が決定するという事実に帰結し
このことは検定の方法論の意義が成立しないことを意味する。
386 :
132人目の素数さん :05/02/20 07:21:18
>>385 381へのレスが今一つ理解しがたいが、「検定をすること自体に意味が無いのでは。」
と言いたいの?
帰無仮説の立て方によっては、統計的だけじゃなくて現実的にも意味のあるものになるよ。
例えば、男女の身長の間に差があるかどうかを検証するときに、
男性の身長は女性のそれよりも10cm高くない、という帰無仮説を立てるとか。
>385 そんなことはとっくに分かっている。 しかし、他にもっと妥当な(マシな)方法がないから使ってるんだと思うが。 ある手法よりいい手法を提唱しないで、その手法がおかしい、と批判する。 それで?んじゃ、どうするの?全く何もしないの? 問題点に注意しつつできるだけ妥当にその手法を使うべきだと思うが。 だいたい誤差を含む標本から、母集団を完全に特定することは不可能であり、 それを認識したうえで、最も妥当な(マシな)手法を適用するのが統計学の立場。 数学は完全に正しいことを扱う立場で、その立場の違いが、 統計学が理学部数学科に入れてもらえない(入らない)理由のひとつだと思う。
389 :
132人目の素数さん :05/02/20 23:38:29
>>388 事前確率が事前分布を含んだ関数になる場合もあるよ。
でも、確かに388が言うように解析方法の自由度が高いところが難点だよね。
事前確率を決める場合に帰無仮説と対立仮説の確率を何にするのかとか、
客観的な値って決めずらそう。
事前分布はジェフリーズの何とかを使えばデータを以って語らしむることもできそうだが。
390 :
132人目の素数さん :05/02/23 12:55:44
いま論文の翻訳をやっているのですが、 「homogeneous demographical variables」 という部分がうまく訳せず困っています。 おそらく、アンケートなどの、基本的な調査項目(性別、年令 etc...)みたいな 方向性だと思うのですが、できれば専門用語を使いたいのです。 大変お手数かと思いますが、どなたかご教示いただけませんでしょうか・・・ よろしくお願いいたします。
>>390 適切な訳語は思いつかないけれど,「均質的なデモグラフィック変数」
とかじゃだめですか?
392 :
132人目の素数さん :05/02/23 14:49:53
>>387 理学部数学科でも統計学を扱っているところはあるだろ。
基礎研究が華やかだった頃は、カチカチの理論屋さんも
いたが、今になってパワーダウンしまくりで今後数学的
な扱いをされないかもな。情報系の一分野とか・・・
しかし統計界全体がダメポ状態だな。
一番痛いのは、統計学科がないことだ。
>>391 様
おお〜、demographical(demographic)はカタカナが正解だったんですね〜!
まったくの盲点でした (>_<)
「デモグラフィック変数」でググってみたら、100件以上ヒットしましたよ〜。
本当にありがとうございました!
あと、スレ汚しちゃってゴメンナサイ・・・
394 :
132人目の素数さん :05/02/23 17:11:06
*********************************************************** 1.次のデータの平均値と標準偏差を求めよ。 75、89、83、90、93、76 (1)平均値 (2)標準偏差 2.次のデータの平均値と標準偏差の95%信頼区間を求めよ。 83、85、82、88、81 (1) 平均値の95%信頼区間 (2) 標準偏差の95%信頼区間 *********************************************************** 上の問題の2.(2)が解き方が解りませんので教えてください。
395 :
新古典派 :05/02/23 19:11:48
私の職場では結構統計の手法を使う。 生産管理とかの現場でも統計は必要らしい。 金融でも使うらしい。 にもかかわらず、私の職場では統計学を系統的に学んだものがいない。 理系学部卒のやつが、適当に統計の本を読んでデータ処理している。 でも、一番統計を理解しているやつが大学の教育学部で発達心理学を 学んできたやつ(実験で統計を使いまくるらしい)で理系のやつがそい つにいつも質問している。 なんで、日本の大学には統計を系統的に学べる場所がないだろうか? 海外の大学院を修了した大学教員のなかにはDoctor of staticsをもっている 者もいるのに。
>>395 統計は理論より技術が優先されるからと思われ。
>>395 > Doctor of statics
ホントに統計学やってんのかと問いつめたい。
398 :
132人目の素数さん :05/02/23 21:54:09
漸近理論あたりを極めても、現場でデータを出されて 何も議論できないようじゃあ無用の長物になるし・・ 理論もデータも扱える人は少ないね。
数学オンチゆえ、ちと頓珍漢な質問かもしれませんが 現在、世帯視聴率で一般的に使用されている系統抽出法なる手法を使って 選挙の投票者を調査した場合、その結果は実際の選挙結果と誤差の範囲内に おさまるはずですが、統計学に見てこれは正しい見方でいいのでしょうか?
400 :
132人目の素数さん :05/02/27 11:31:33
age
>>399 その書き方だと事前調査のことか事後調査(出口調査)のことだか
わからん.
>401 あっ、すいません。どちらでもないです。 出口調査では必ずしも正直な答えとは限らない人がいるので。 この場合は、機械的にかもしくは他の手段でもいいですが、正確に投票を サンプリングできる と想定した場合についてです
>>402 サンプリングの方法論を抜きにすると,統計学のイロハのイに属する
話なので,統計学の教科書を読んで欲しいのだけど,
結論を言うと,投票を確率抽出した場合(確率抽出というのは,全ての
投票が同確率で抽出される,という意味です),投票結果を「推定」ないし
「推測」(同じ意味)することは出来ます.
具体的に言うと,サンプルでのA候補の得票率がx%のとき,
「95%の確率で,投票結果は(x-α)%以上(x+α)%以下に収まる」
というように推定できます.
404 :
132人目の素数さん :05/03/02 08:36:32
age
405 :
132人目の素数さん :05/03/02 20:18:15
重回帰分析の質問です。 説明変数間に相関があるからこそ、変数間の影響が調整されて 重回帰分析の意味があるといえるのでしょうか?
406 :
132人目の素数さん :05/03/02 21:24:51
座標の取り方でどうにでもなるのでは?
407 :
132人目の素数さん :05/03/03 20:56:41
>>350 >「確率」と「確率密度」の違い....
一言で言えば、
>>355 も言ってるが確率関数ダイアグラムの「積分値」と「y軸値」。
408 :
教えてください :05/03/03 22:22:06
自然対数eに関する質問です。 e=1+1/1!+1/2!+1/3!+1/4!+… と言うのは周知のことだと思いますが、 1+(1/1!)^2+(1/2!)^2+(1/3!)^2+(1/4!)^2+… (つまり上記eの右辺の各項の2乗の和) は、一体どんな値になるのでしょうか?教えてください。
409 :
教えてください :05/03/03 22:24:02
追加、一般のnに対して、 1+(1/1!)^n+(1/2!)^n+(1/3!)^n+(1/4!)^n+… の値はいくらになるのでしょうか?
410 :
132人目の素数さん :05/03/06 22:04:30
M2ですが、数理統計学をみっちり勉強したいと思っているのですが、 何かイイ本はないでしょうか? 数理統計学 稲垣宣生著 裳華房 の次ぐらいに読めるレベルの本を教えて頂きたいのですが。
411 :
132人目の素数さん :05/03/07 12:18:30
今、正の相関が強い2つの銘柄に投資したい投資家がいたとする。この投資家 は各銘柄の株価変動に対し平均的に見て上下20円までなら対応可能で株価変動 の期待値が上下20円になるまで各株式を購入しようと考えている。 この投資家はX,Y,W,Zをそれぞれ何株購入するか?上で求めた株式保有量でXと Yを保有した場合のふたつの銘柄の保有価値(価格×保有量)の共分散を求め よ。 同様にWとZの保有価値の共分散を求めよ。 定義 Xは確率関数 E[X]は期待値 Var[X]=E[(X-E[X])の二乗] pxy(相関係数) =ルートVar[X]×Var[Y]分のCov[X,Y] Cov[X,Y]=E[(X-E[X])(Y-E[Y])] Cov[X,Y]は共分散 Var[X]=Var[Y]=4 Cov[X,Y]=3.8 Var[W]=Var[Z]=400 Cov[W,Z]=152 マジでお願い助けてください
413 :
132人目の素数さん :05/03/07 15:32:04
412さんへ 死ぬほど見ましたが何か?
>>408 ちょっと考えたが、何某かの値に収束はするが、それを
厳密にあらわすのは無理ではなかろうか ?
>>416 そんなわけないでしょう。
e より小さな値のはずでは。
418 :
132人目の素数さん :05/03/08 22:58:30
>>276 >(X-μ)/S は正規分布でなくt分布にしたがう...
ことの証明記事を載せた統計学書籍を、何例か紹介願えませんか。
>>418 漏れが証明を見たのは岩波の小針「確率・統計入門」が最初かな。
日本の統計学の重鎮は誰だと思う?
421 :
132人目の素数さん :05/03/09 21:33:49
422 :
132人目の素数さん :05/03/09 22:27:39
>>418 t分布はコゼットだね。
証明は密度関数がわかっていれば結構簡単に計算できると思うが。。。
423 :
132人目の素数さん :05/03/10 21:01:10
>>422 片や(X-μ)/σは正規分布に、片や(X-μ)/Sはt分布に従う...この相違の理由を
判りやすく説諭してもらえると有り難いのですが。
>>423 σは定数なのにSは確率変数。(X-μ)/σと(X-μ)/Sが異なる分布になるのは当然だろ?
(丁寧に書けば、X=(X[1]+X[2]+…+X[n])/nなわけだが、SもX[1],X[2],…,X[n]の
関数であることに注意)
(X-μ)/Sの分布(もはや正規分布ではなくなった、ゆがんだ分布)を「t分布」と名づけた
だけのこと。
Sの分布の密度関数は計算できるから、(X-μ)/Sの密度関数も計算できる。正規分布よりだいぶ
複雑な関数になるが。
425 :
132人目の素数さん :05/03/13 13:49:53
重回帰分析において、説明変数間の相関関係と、 パラメータ係数の標準誤差にはどういった関係があるのでしょうか?
米国のBSE検査について 屠畜された3500万頭のうち、2万頭を検査 信用できるサンプル数?
427 :
132人目の素数さん :05/03/14 21:09:38
重回帰分析の目的変数は等分散であるとされていますが、 この分散の値は具体的に何になるのでしょうか? 計算のしようがないと思うのですが。。。。
判別分析をゼミでやっているのですが、何か実例を用いて判別をすることになりました。 そこでうまく判別が出来そうなデータを探しているのですが、中々いいのが見つかりません。 どの様なデータでやったらよいのでしょうか?
因子分析を勉強し始めた者ですが、生のデータを載せて一から 解説しているサイトをどなたかご存知ないでしょうか。 どのサイトでも計算式はそこそこわかりやすいのですが、 データまで載せているところがないので聞いてみました。
>>430 ありがとうございます。早速取りかかります
432 :
132人目の素数さん :05/03/20 23:53:07
群間比較の評価方法についての質問です。 医学論文で 変化量(後値-前値)の値で単純に群間比較を行っているのと 変化率( {(後値-前値)/(前値)}×100 )の値で群間比較を行っているのを 見かけますが、厳密にはどちらが正しい方法なのでしょうか? それとも、場合により使い分けるべきものなのでしょうか。
433 :
132人目の素数さん :05/03/21 00:05:10
数学記号って顔文字になるから面白いよね〜! あはははははまはやなははははぱぱばはははばばばぱはははははははははははははは
434 :
エクセルの相関について質問です :2005/03/23(水) 18:37:36
エクセルのグラフで 「近似曲線の書式設定」で傾きと切片が表示されますが 関数で用意されているSLOPEとINTERCEPTで算出される 傾きと切片の値と一致しません SLOPEとかINTERSEPTでは駄目なんでしょうか?
435 :
132人目の素数さん :2005/03/23(水) 20:23:51
とある田舎の企業で、技術を商売にしています。 さて、突然上から商社部門で在庫を持つ商品を増やすことになったが、 何をいくつ持てばよいのか、というたらい回しの課題が私に回ってきました。 回転サイクルを6ヶ月位に併せたいとの事でしたが、 とりあえず出荷実績をピボットテーブルで集計して、 商品A 4月−100個 5月−200個 6月−10個 といったデーターを作りました。 この結果、8,9月の出荷がほぼ全ての商品に置いて出荷が伸びていたり 突出して高い月や低い月がしばしばあることが解りました。 さて、このような12ヶ月分のデーターを基に来年の出荷数の 期待値を求めたいのですが、単純に今年の半分にするには少々怖い気がします。 かつ、来期の経済動向を見る限り出荷が今年以下なのは間違い無いと思われ、 出来るだけ弱気な予測で進めたいのですが、 このような場合に置いて、標準偏差等から月の出荷数の最小値予測等を たてられないものでしょうか。 一例を示しますと、 4月から順に61,120,180,120,120,180,60,62,60,60,61 別の商品では 80,50,10,50,60,20,70,60,40,40,20 といった感じです。前者は感覚的に最低60個くらいかなといった感じですが、 何か根拠のある数字を算出することは可能でしょうか。
436 :
435 :2005/03/23(水) 20:25:08
技術と言っても、全然統計なんかとは異分野なのですが 数字使う以上は一緒だろう・・・という事で明日までに根拠のある 数字を出さねばならず困っています・・ 何卒ご助力をお願い致します。
正規分布の式なんですが。 天下りに、与えられていますよね。 母関数から、漸化式から、積分形式から〜〜など。 ところで、フーリエ変換だとみると、 F(x→f)について、変換前後で同じ様な形になるのは何故なんでしょうか? expの積分だから?だけで良いとは思うんですが、どうもしっくりきません。 分かる方説明お願いします。 まあ、別に使うだけなら何の問題もないことなんですが。
>さて、このような12ヶ月分のデーターを基に来年の出荷数の >期待値を求めたいのですが、単純に今年の半分にするには少々怖い気がします。 質問の意味から訳が分からないんだけど〜・・・。 期待値っていうのは平均値でしょ? 文章全体では、今年の出荷数から来年の出荷数の平均を出せっていうんだから・・・。 今年の出荷数×係数=来年の出荷数でしょ。 結局係数を適当に出して、今年の数に係数を書ければいいだけじゃん。・・・。 小学生でも出きる算数だが・・・・。 係数をどう出すか・・・。それは野生のかんでだしてね。 というか、ホントに技術にいるの?
439 :
132人目の素数さん :2005/03/24(木) 04:48:25
>係数をどう出すか・・・。それは野生のかんでだしてね それはむしろ小学生の方が直感強そうな気がするなw
>>440 そうだね〜、平均点だけで良いんじゃない?
アンケートの標本数をある程度以上大きくしないと、いみのある統計にならないからね〜。
でも、全数検査して平均点出すと(全てのデータをエクセルに入れると)
標本を抜き出すよりも正確なので、PCにシコシコ打ち込んで、標準偏差とか
機械的に書いておけば良いんじゃないの?
平均点に標準偏差を付け加えておけば、それで完璧でしょ?
詳しい人 →標準偏差から自分で詳しく計算し出す
詳しくない人→標準偏差は偏差値みたいなもんだとおもう。
442 :
132人目の素数さん :2005/03/24(木) 22:03:49
すいません、統計学に素人なのですが、ほぼ正確な平均点をだすには、 最低点数って何個必要なんですか?教えていただけませんか?
相加平均にしれよ
>442 教科書見ないと正確なこと言えないけど。 (標本数)^(1/2)にひれいして信頼区間が狭くなるはず。 あと・・。何か入門書呼んでから質問してくれ。 [基本] @正規分布の式があって、全部を足し算すると(積分すると)100%になる。 A平均値±σ(標準偏差)で63(?)パーセントになる。 をふまえた上で [応用] 使う分布 危険率を何%にするかをきめる。 こういう関係です。 分布表があったとして、人間様がある程度条件を指定してやったらある数字を出してくれます。 それが統計なんです。 つまり、質問のままでは答えようがないんです。 (かな〜り親切に答えてしまった。普通って本をよめで終わるぞ)
445 :
132人目の素数さん :2005/03/24(木) 22:38:33
>>442 ある程度信頼できる平均値を出すには、サンプルが30個以上は必要。
経験則だけど、割と一般的な基準だと思うよ。
>>445 詳しそうだね!
(離散型分布の)半値幅補正って、するときとしないときの違いってどうやってますか?
>>446 詳しかないよ。
分布が気になるならGrimmの式で中央値でも出せば?
>>447 半値幅補正するときとしないときでずいぶん確率変わりますよね。
しかし、するための方針が書いてない(きがする)ので悩んでました。
まあ、授業で言われたとおりにしただけですが。
中央値によってする・しないでいいんですか?
>>446 面接官「サンプル数は30とありますが?」
学生 「はい。30です。」
面接官「30では少なくありませんか?」
学生 「経験則です。」
面接官「え、経験則?」
学生 「はい。経験則です。ほぼ正確な平均点を与えます。」
面接官「・・・で、その経験則だと95%信頼区間は何点から何点までですか?」
学生 「はい。ほぼ正確な平均点です。」
面接官「いや、私は具体的な誤差をたずねています。それにほぼ正確ではあいまいですよね。」
学生 「でも、一般的な基準ですよ。」
面接官「いや、一般的とかそういう問題じゃなくてですね・・・」
学生 「詳しそうな人が言っているんですよ。」
面接官「ふざけないでください。それに詳しそうな人って何ですか。だいたい・・・」
学生 「統計に詳しそうな人です。素数さんとも呼ばれます。素数さんというのは・・・」
面接官「聞いてません。帰って下さい。」
学生 「あれあれ?怒らせていいんですか?使いますよ。半値幅補正。」
面接官「いいですよ。使って下さい。半値幅補正とやらを。それで満足したら帰って下さい。」
学生 「運がよかったな。今回は半値幅補正が必要ないみたいだ。」
面接官「帰れよ。」
>>445 は精度が問題にならない時の簡易法でしょう。
精度について適当なのに半値幅補正を行うのはちぐはぐです。
精度を重視するなら
>>444 の通りにやるべきでは?
母平均の信頼区間
http://aoki2.si.gunma-u.ac.jp/lecture/Average/Mean2.html
451 :
132人目の素数さん :2005/03/25(金) 12:48:37
>>434 エクセルのグラフのX軸の参照がきちんとされているかどうかを調べましょう。
452 :
440 :2005/03/25(金) 14:49:48
>441 数が少ないとあんまり意味ないんですな、なるほろ 即レスサンクスっした
453 :
132人目の素数さん :2005/03/26(土) 00:22:13
統計学で有名な大学って何処かわかりますか?
コルモゴロフ大学
>>453 なぞなぞ?
んー、あ、分かった。東京経済大学(東経大)
456 :
132人目の素数さん :2005/03/26(土) 01:07:12
いや、真面目な話です。国内だと何処になりますか?
一橋
証券系の資格とってそれ系の職に就けば嫌でも統計のエキスパートになると思うけどね
>>459 統計学者になるか、統計解析エキスパートになるかで違うのではないかな?
「最尤推定」ってどう読むんですか?
さいゆうすいてい
さいいぬすいてい
さいけんすいてい
466 :
132人目の素数さん :2005/03/28(月) 18:55:04
もっともやりてい
467 :
132人目の素数さん :2005/03/28(月) 19:33:46
さい尤すいてい
もっともっとすいてい
469 :
学籍簿”削除” :2005/03/29(火) 10:23:48
統計って、純粋に数学が得意だぜってやつがやってもわからないとかいうよね。 俺の大学の数学専攻のやつら、一般教養の社会統計学を落としまくっていたよ。 なんで、数学科が社会統計かというとだね、時間割上、この科目しかとれないからだよ。
470 :
463 :2005/03/29(火) 12:51:06
>>464-468 おまいら、おもろすぎる
>>469 統計学って数学は使うが、数学とはぜんぜん別の学問だと
思った方がいいと思うよ(個人的にはそー思っている)
471 :
132人目の素数さん :2005/03/29(火) 20:50:11
別にどうでもいいんだけどさ、F分布と二項分布の関係使ってやる検定ってめんどくさいよね。
472 :
132人目の素数さん :2005/03/31(木) 14:27:16
相関行列って半正定値行列だっけ?
473 :
132人目の素数さん :81/64/49/36/25/16/09/04/02(土) 10:22:01
すみません。教えてください。 定期的に測定している値が ある時期シフトしているって部分を 検出したいのですが何かいい方法ありますか。 ヒントをお願いします。
>>473 それはね〜。干渉項がきいているからなんだ〜。
実測される値は内積なので問題ないんだよ〜。
なんか、こう答えたくなった。
475 :
473 :2005/04/03(日) 09:38:09
>>474 みないといけない項目が多いので
自動的に検出できる仕組みを作りたいわけです。
検出した項目に着目して解析を進めて問題有り無しの判定をかけたい。
何かヒントを..
>>475 そんな真剣に聞かれても・・・。
統計学には全く答えていないよ?
あと、つい最近の答えにもあったけど。
統計学って、何か条件を指定してやると、ある数字(確率)を返す様なもんだよ。
定期的にずれる〜だけでは何とも。
どの分布を使うのか・・・。良くは分かりません。
入門書読んだらいいとおもうよ。
>> 475 outlier detection とか、anomaly detection とかの 論文は参考になるかも。
>>473 これだけの情報じゃ、誰もアドバイスできないと思うな。
回帰分析なんかでの係数の構造変化を知りたいならchow testというのがある。
まずは構造変化+chow+testとかでぐぐってみそ
479 :
132人目の素数さん :2005/04/03(日) 18:07:52
因子分析をして、プロマックス回転後の因子負荷量が Rotated Factor Loadings Variable | 1 2 3 4 Uniqueness -------------+------------------------------------------------------ qstn18_1 | 0.67214 0.05747 0.05408 0.31874 0.47035 qstn18_2 | -0.03822 0.73199 0.05834 -0.01974 0.47065 qstn18_3 | -0.22900 0.01113 0.18645 -0.62278 0.52126 qstn18_4 | 0.07614 -0.12252 -0.92382 -0.09130 0.18167 qstn18_5 | 0.41901 -0.38076 0.27673 -0.32740 0.37523 qstn18_6 | -0.06754 -0.13585 0.36188 0.68273 0.43877 qstn18_7 | 0.20298 0.67146 0.18360 -0.15224 0.49381 と出てきたのですが、たとえば4に、符号が逆で大きなものが出てきております。こういうのはおかしいのでしょうか。
>>479 おかしくない。
qstn18_6 と qstn18_3 って反対の意味になるような項目なんじゃない?
あとは、変数削れるなら qstn18_4 は削りたいなぁ、とか。
ところで、因子の抽出法は何使ったの?
481 :
479 :2005/04/03(日) 21:18:03
>>480 お世話になっております。おっしゃるとおり、確かに6と3は反対の項目であります。
ということは、反対の項目であることを考慮しつつその因子がなにを表すかを
考えればよいのですな。
因子の抽出には主成分分析を用いており、主成分分析で固有値が1以上にあるのが4つなので4としてみました。
さっき貼り付けたものですが、一番下のものがかけておりました。
ごめんなさい。「その他」という奴です。
qstn19_8 | -0.78053 -0.05101 0.16223 0.05360 0.37775
項目を削ったり入れたりする判断をどうするのか私はわからないのですが、
何かよいサイトはないものでしょうか
482 :
132人目の素数さん :2005/04/03(日) 23:01:18
素人質問すみません。 ガウス分布は正規分布と同じですか?
483 :
479 :2005/04/03(日) 23:22:21
や、もうしわけありません。項目の出し入れは共通性の高低で判断するのですな。
486 :
479 :2005/04/04(月) 03:53:39
どうもありがとうございます。さらに研鑽を積みます。
487 :
132人目の素数さん :2005/04/05(火) 15:21:57
"nearest neighbor" って、何て訳すのがいい?
488 :
132人目の素数さん :2005/04/05(火) 17:57:22
もっとも身近なご近所さん
隣のお姉さん
490 :
BlackLightOfStar ◆ifsBJ/KedU :2005/04/05(火) 18:06:09
Re:>489 何故お前にそんなことが分かる?
491 :
132人目の素数さん :2005/04/06(水) 11:05:29
T2-統計量 ってなんのことか分かりますか?
492 :
132人目の素数さん :2005/04/06(水) 11:25:10
T^2 = (X-m)^G C^-1 (X-m) (X は確率変数ベクトル、m はその平均ベクトル、C は共分散行列) と書いてあるのですが、^G ってなんなのかな。。。
494 :
132人目の素数さん :2005/04/08(金) 10:23:07
>>487 クラスター分析の最近傍法とか、それっぽい話?
495 :
487 :2005/04/08(金) 20:14:24
>>494 そのとおりです。
「最近傍」という訳が一般的ですか?
496 :
494 :2005/04/08(金) 20:22:33
じゃないすかね。
独立成分分析において、フィルタの更新式にtanhなどの非線形関数が入る理由について、 誰かわかりませんか。。。?
498 :
132人目の素数さん :2005/04/15(金) 11:13:02
age
499 :
132人目の素数さん :2005/04/21(木) 19:45:06
初心者からの質問です。 ある2つの薬物の効果を調べています。 薬物Aを暴露した場合、1 nM, 10 nM, 100 nMでそれぞれ10, 25, 80 mmHgの血圧上昇が認められました。 同様に薬物Bを暴露した場合、1 nM, 10 nM, 100 nMでそれぞれ20, 50, 100 mmHgの血圧上昇が認められました. 次に薬物A, Bを同時投与して(それぞれ1 nM, 10 nM, 100 nM)で25, 60, 120 mmHgの血圧上昇が認められました。 この場合、薬物の相加作用、相乗作用を調べるにはどのような統計方法を使いますか?
500 :
132人目の素数さん :2005/04/22(金) 18:51:29
ご教授お願いしますm(__)m (1)平均µ,分散σ^2の母集団から抽出した2個の無作為標本をX1、X2 とするとき、aX1+bX2が母平均µの不偏推定量で,かつ有効推定量となるような定数a , b の値を求めよ. (2)パンをたくさん作ったとき、パンの重さは平均μ(g)、標準偏差3(g)の正規分布に従うとする。このパンのなかから無作為に16個だけ抽出して、「推定の誤差が1.47以下で母平均μを推定できる確率」は0.95である。これはなぜか答えなさい。
501 :
132人目の素数さん :2005/04/23(土) 11:07:30
57 :132人目の素数さん :2005/04/22(金) 18:24:50 平均-1.5SDって偏差値で言うと35でいいんでしょうか? それと、平均-1.5SDは、正規分布であれば大体下位何%に相当するのでしょうか?
502 :
132人目の素数さん :2005/04/23(土) 14:42:08
>>500 (1)は去年のアク試験の問題だね。
有効推定量の定義は分散が最小になる不偏推定量、もうできるだろ?
(2)についてだが、お前は考える気あんのか?
ここまでわかったが、この先がわからないとか質問しろ。
数値が入ってる問題はこっちもめんどくさいんだよ。
503 :
132人目の素数さん :2005/04/23(土) 18:27:54
結合ガウス分布ってなんですか? 教えて下さい、どこにものってないんです
504 :
132人目の素数さん :2005/04/23(土) 19:48:13
都市の人口の統計は、なぜ対数正規分布になるのですか?
505 :
132人目の素数さん :2005/04/23(土) 22:10:23
506 :
132人目の素数さん :2005/04/24(日) 11:59:01
分析にあたって、サンプルの分布形状がかけ離れたものを一緒くたに 扱いたくないので、あらかじめサンプル分布の形状でサンプルを 分類しておきたいと思います。 このような場合、どのような手法を用いるのが一般的でしょうか? 平均値や標準偏差などの要約値にした上で分類することも考えた のですが、二峰性やすそ引きなども検出するにはうまくそれらの 分布形状を表現できる指標をそれぞれ導入しなければなりません。 できればそのような事前知識なしに直接に分布の類似性を判断 したいと考えています。
507 :
132人目の素数さん :2005/04/24(日) 19:20:01
Excel97のワークシート関数の相関係数計算用の=correl(Xi..,Yi..)と =pearson(Xi..,Yi..)って、同じ数値がセルに表示されるんですが、どの ように使い分けるのですか?
>>440 亀レスだが自演投稿以前に、このタイプの投票は統計学的にまったく信頼できない。
本来統計とは無差別にサンプリングして集計するもの。
サンプリング手法自体に問題があって、統計学の基本は「無作為抽出」以外の方法は信頼に値しないはずでしょう?
この場合任意で投稿している。つまり膨大に標本数があってもまったくの意味のない統計だと思うが?
509 :
132人目の素数さん :2005/04/25(月) 17:13:58
はじめまして、大学の統計学で教授が問題を出したのですが、わかりません。 どなたか教えてくだされば幸いです。 問題 ある検定法では有意だが、別の検定法では有意でない場合、何が原因か?またこの場合、結論はどうなるのか? よろしくお願いします。
>>509 自分で考えな。
答えを出そうともがく経験は大切なんだよ。
511 :
132人目の素数さん :2005/04/26(火) 20:27:31
調査によるとあるTV番組を夫が見る確率は50%、妻が見る確率は30%である。 しかし、妻が見ていたら夫が見る確率は60%の増加する。 夫妻が両方みる確率はどの程度か。 お願いします。
512 :
BlackLightOfStar ◆ifsBJ/KedU :2005/04/26(火) 20:39:15
Re:>511 夫がみて妻が見ない確率、妻がみて夫が見ない確率、夫妻が両方みる確率、両方見ない確率に分けて考えよう。
513 :
132人目の素数さん :2005/04/26(火) 20:41:56
>>512 わかりました、事前確率とかベイズの定理だとかが混ざってわけわからない状態です。
やってみます
514 :
132人目の素数さん :2005/04/26(火) 20:53:23
一応全部だしたんですが、先が見えません。 前回、事前確率の問題を教授がすごい面倒な計算をしていてトラウマです。 実は簡単な問題なのかな・・
515 :
132人目の素数さん :2005/04/27(水) 10:41:32
ただ答えが知りたいだけなんで教えてください。 @男女間での肉・魚の好みの差異を調べるために、肉か魚かのどちらかを選ばせる調査をした。 このデータを解析するために最も適当な手法はどれか? a.分散分析 b.因子分析 d.回帰分析 e.t検定 f.カイ2乗検定 A3群の平均値に差があるか否かを検定するための手法はどれか? a.因子分析 b.分散分析 d.回帰分析 f.クラスター分析 g.t検定
516 :
132人目の素数さん :2005/04/27(水) 11:03:58
ウィーク型効率的市場仮説を検証するために、時系列分析を考えています。 例えば、Nikkei225等のデータを用いて、ARMAモデルを推定したとします。 仮説が成立するのであれば、推定されたモデルの有意性というものが棄却 されると思うのですが、どのような検定を行ったらよいのか、アイデアを いただけませんか? 単に、自由度修正済み決定係数を計算しても意味がないと思いますし、 また、モデルの係数が全て0という仮説を棄却できるか?という事を 調べるのも安直のように感じますし。
517 :
132人目の素数さん :2005/04/27(水) 23:02:24
>>515 > @男女間での肉・魚の好みの差異を調べるために、肉か魚かのどちらかを選ばせる調査をした。
> このデータを解析するために最も適当な手法はどれか?
> a.分散分析 b.因子分析 d.回帰分析 e.t検定 f.カイ2乗検定
b
> A3群の平均値に差があるか否かを検定するための手法はどれか?
> a.因子分析 b.分散分析 d.回帰分析 f.クラスター分析 g.t検定
f
518 :
515 :2005/04/28(木) 00:29:15
519 :
132人目の素数さん :2005/04/29(金) 11:25:50
整数上で定義される実数値関数が定常時系列の自己共分散関数であるための 必要十分条件は、それが偶関数かつ非負定値となることを示してほしいのですが。 レベルの低い学部生なものですみません。おねがいします。
520 :
132人目の素数さん :2005/04/30(土) 12:49:36
521 :
132人目の素数さん :2005/04/30(土) 13:26:09
>>519 行列の非負であるための条件は知っているの?
Brockwell and Davisで勉強すれば
よかったら、大学2年生ぐらいの人向けの「確率と統計」のいい演習書をおしえてくれませんか?
523 :
132人目の素数さん :2005/04/30(土) 21:17:24
野田一雄、宮岡悦良著「数理統計学の基礎」とその演習書
524 :
132人目の素数さん :2005/04/30(土) 21:17:51
共立出版
525 :
132人目の素数さん :2005/04/30(土) 21:43:43
ブートストラップとは要するになんなのでしょうか? 全くわかりません。
526 :
132人目の素数さん :2005/04/30(土) 23:41:38
527 :
132人目の素数さん :2005/04/30(土) 23:43:18
>>519 はBochnerの定理(伊藤「ルベーグ積分入門」にある)の離散版だと思われ?
>>525 無限次元母集団からの復元抽出による信頼性試験
529 :
132人目の素数さん :2005/05/01(日) 10:35:53
530 :
132人目の素数さん :2005/05/01(日) 10:44:32
531 :
519 :2005/05/01(日) 11:26:49
532 :
132人目の素数さん :2005/05/01(日) 13:56:56
2000個のサンプルを無作為に抽出してヒストグラムを描くと、かなり右裾が長い分布になりました。 その後、3000個のサンプルを抽出してもう一度ヒストグラムを描くとその分布の形状はどうなると予想されますか? …という問題なんですが、やっぱりまた右裾が長くなりますよね? 左右対称にはなりませんよね?
t分布じゃね?
534 :
132人目の素数さん :2005/05/03(火) 17:30:09
>>532 2000個のときよりは中心寄りになる。
535 :
132人目の素数さん :2005/05/03(火) 17:50:24
中心極限定理か、なるほど。そういう意図の問題なんだね。理解した。おれは532ではないけど。
536 :
ちなみに :2005/05/03(火) 21:19:31
でも中心寄りになることと中心極限定理の「中心」は意味が違う。 後者は幾つかある極限定理で中心的役割を果たすから「中心」なのである。
537 :
132人目の素数さん :2005/05/03(火) 21:24:13
↑こいつ嘘だから信用するな。 中心極限定理はx1、・・・、xnの平均mの確率分布が(n->∞)のとき分散が0になるからでしょ。
538 :
132人目の素数さん :2005/05/03(火) 21:34:49
>>537 それこそ違うんじゃないのか?
中心極限定理(central limit theorem)は、
母集団が平均μ、分散σ^2の分布にしたがっているとき、
標本平均の分布は平均μ、分散σ^2/nに近似される
ということじゃないのか?
「中心」という言葉自体、特に意味ないのは各統計書籍で
著名の先生方がいっているぞ。
539 :
132人目の素数さん :2005/05/03(火) 21:41:46
(n->∞)のとき、分散が0になる: 分散σ^2/n −>0
540 :
132人目の素数さん :2005/05/03(火) 21:44:38
>>539 ああ、それは分かるよ。
「↑こいつ嘘だから信用するな。」というのがおかしいよ。
別に言ってることあってるし。
541 :
132人目の素数さん :2005/05/03(火) 23:03:47
「中心」と呼ぶ理由が出てる文献希望
542 :
132人目の素数さん :2005/05/04(水) 00:01:00
>>541 統計的方法のしくみ―正しく理解するための30の急所 : 永田 靖 (著)
にそんなようなことが書いてあったと思う。
手元にないので確認できず申し訳ない。
この本は一般人にとっての読み物としても非常に良い本なのでオススメ。
543 :
132人目の素数さん :2005/05/04(水) 09:47:52
Sample数を決定するのにいいsoftwareありますか? SPSSのSmplePower2.0がいいかなと思ったのですが、Win XP SP2では動かないんです。 他群を設定した場合もできた方がよいのですが。 以上、宜しくお願いいたします。
>>541 俺、古本屋で買ったんだけど、放送大学教材「統計学」長坂建二著,1989
に「中心化傾向」として記述されてる。
545 :
132人目の素数さん :2005/05/04(水) 18:32:01
>>544 なるほど、中心化傾向ね。
その著者がイメージするところは、
「平均の分布を取れば、それは元の分布の平均(すなわち中心)に寄る」
という考えから来てるんだろうな。
ここで補足しておきたいのは、「中心化傾向」は主に心理系の統計で
使われる言葉。例えば5件法のリッカート尺度で質問紙をとったときに、
ネガティブ項目に対しては「3.どちらでもない」に回答が集まりやすい傾向
が出る。これを中心化傾向といったりする。
総じて、中心化傾向というのは「母集団からサンプリングした際、その反応が
ある一点(連続不連続は別にして)に寄りやすい傾向がある」という場面で使うべき
だと思う。傾向なんだからさ。
あと、中心極限定理の仮定は
「母集団が平均μ、分散σ^2の分布にしたがっているとき」
だけで、別に何の分布でもいいんだよね。正規分布でなくても一様分布でもいい。
だから「中心に寄る」ということには、はっきり言ってあんまり意味はない。
海外の文献でも(何か忘れた。後日あげます)、
「centralではなく、fundamentalとして捉えるべきだ」
という表現が見られる。
他に何かある人お願いします。
547 :
132人目の素数さん :2005/05/05(木) 00:45:27
>>546 ですね。
>>534 でいう「中心に寄る」の別表現としては、
「スリムな形状になる」ぐらいかな。
だが、
>>532 で分布がスリムになる保証はないし、ましてや
>>533 でいうt分布にもならない。
だってリサンプリングするだけなんだろ?
解決の一つの方法としては、簡単なブートストラップ法を使うとか。
純出生過程の一様乱数を発生させ、パラメータを作るプログラムって検索かけたら出る?出ないんだが
549 :
132人目の素数さん :2005/05/07(土) 19:39:15
灰色理論って何?
550 :
132人目の素数さん :2005/05/07(土) 22:54:00
>>532 と似ている問題なんですけど、
「ある母集団からn個を抽出し、ヒストグラムを書く場合、nが大きくなるにつれて
ヒストグラムの形は
1)カイ2乗分布に似てくる
2)正規分布に似てくる
3)これだけではわからない」
…(3)じゃないんですか?
551 :
132人目の素数さん :2005/05/08(日) 01:11:38
2)が正解
>>551 んなーわけない。1000個の母集団から1000個抽出したら当然母集団分布に従う。
1個抽出して戻して、という独立試行をn回行うなら確かに正規分布に似るだろうが。
553 :
132人目の素数さん :2005/05/08(日) 11:35:31
確かに母集団の分布が示されてない以上、3を正解とするのが適当でしょ
554 :
132人目の素数さん :2005/05/08(日) 20:54:52
ピクロトキシンは痙攣を誘発する。フェノバルビタールはピク ロトキシンの効果を抑制すると考えられている。 ピクロトキシン単独投与の際に痙攣した個体は35、しなかった個体は10。 ピクロトキシンとフェノバルビタールを同時に投与した際は痙攣した個体は1、 しなかった個体は44である。 この時、フェノバルビタールに痙攣を押さえる効果があるかχ^2分布で求めよ。 有意差は五パーセントとする。
555 :
132人目の素数さん :2005/05/08(日) 20:56:32
>>550 が「
>>532 と似ている」と書いてても、無限集合しか前提にできず、挙げ句に
自分にレスアンカーをつけて馬鹿決定とは・・・GWの締めくくりにふさわしいなw
初歩的な質問ですが、どなたか助言をお願いします。 2群の比率を検定したいのですが、片方の比率が0の時は「解析不能」とすべきでしょうか。 無理矢理計算できるのですが、 X-squared = 0, df = 1, p-value = 1 となります。
558 :
132人目の素数さん :2005/05/09(月) 22:23:09
「片方の比率が0」とはデータ結果か理論から予想される比率か?
560 :
132人目の素数さん :2005/05/15(日) 13:11:53
分散や平均値などから他の値における確率は逆算できるのでしょうか?
>>560 標本分散や標本平均の値から、という意味?
標本平均3、標本分散1でした。標本の値は幾つでしょう?って
解ける?
標本数は幾つ?
562 :
132人目の素数さん :2005/05/15(日) 14:48:51
>>561 標準正規定数Zの問題でした。
ちなみに解けません。
>>562 標準正規定数って何?
初めて聞きました。
明日、稲垣先生に聞いてみよ。
564 :
132人目の素数さん :2005/05/15(日) 17:11:34
>>563 正確には標準正規変数Zで 1/√2π e -(1/2)z二乗 です。
正直意味はわかりません
565 :
132人目の素数さん :2005/05/15(日) 17:41:44
Mercury Mufflers guarantees its mufflers for 5 years On each muffler they sell make $8 ,out of which they must pay fo possible replacements under gurantee Each time a muffler is replaced ,it costs $40 Their muffler life is approximate normally distributed around a mean of 7years , with standard deviation of 3 years a What is the avarage profit per sale b If they want their average profit per sale to be $3 , to what time period should they reduce the gurantees? 意訳)ある会社はマフラーに5年間の品質保証を置いている。 マフラーひとつあたり8ドルの利益がある 毎回マフラーは返却され、その際40$かかる。 それがおおよそ7年を平均とした正規分布であり、また標準偏差は3年である。 a 一度の売り上げの利益の平均は? b 仮に一度の売り上げの平均が3$としたら、どのくらい保障期間を減らせばいいか? 必死です、よろしくお願いします。
>>566 うおおおおお
ありがとうございます。
ネタバレですが、しっかり考えます。
8*P(X>5)+(8-40)*P(X≦5) =8-40*P(X≦5) に展開されるのがよくわかりません お願いします。
>>568 私も一瞬間違いかと思った。
P(X>5)+P(X≦5)=1
代入してます。
570 :
132人目の素数さん :2005/05/15(日) 20:39:54
>>569 なるほど、ありがとうございます。
P(Z≦t-7/2.3)=0.125
t-7/2.3=-1.15
の展開でなぜ左辺に−がつくのかわからないんですが
よかったら教えてください。
>なぜ左辺に−がつくのかわからないんですが 右辺でした訂正です。 あと1.15ってのはZ=0.125のときの値です
>>572 0.125<0.5 ∴ 負になる。
Φ(z)=1-Φ(-z)です。Φは標準正規分布関数。
標準正規分布関数の性質です。
この辺り分かっていないと何も出来ません。
573 :
132人目の素数さん :2005/05/16(月) 04:22:14
Normalized Mean Squared Error(NMSE)とは日本語で何と言うのでしょうか? またこれは何を指しているのでしょうか? 学校の論文に出てくるのですが、検索しても全く分からないのです。 ご存知の方、是非教えください。お願いします。
>>573 MSEなら平均二乗誤差。
どういう局面でどう定義されたものかが分からないのでなんともいえんが、これになんらかの正規化、標準化をしたものだろ。
正規平均二乗誤差とか正規化(された)平均二乗誤差とかでいいんじゃね?
>>573 ,574
なんとなく、誤差を平均0分散1に基準化した後でのMSEだと思ったんだけど、
違ってたらごめん。
576 :
132人目の素数さん :2005/05/16(月) 21:31:05
質問です。 十分統計量の直感的イメージを教えてください。 教科書などの例を見ても、どうもしっくり来ません。
577 :
132人目の素数さん :2005/05/17(火) 12:28:01
>575 ならstandardizedでしょ。正規化と標準化と明確に意味が違いますよね。 でも573のNMSEってあまり聞かないですね。変数変換によって残差がガウス化 されました、みたいな話ですかね。
578 :
132人目の素数さん :2005/05/18(水) 14:13:03
なんだかよくわからないので、質問させてください。 ANCOVAを使うのに最も適した状況はどんな場合なんでしょう? また、使ってはいけない状況はどんな場合ですか? 教えてください。 お願いします。
579 :
NMSE :2005/05/18(水) 14:44:57
>>573 NMSEというのは、正規化2乗誤差のこと。
つまり、平均2乗誤差を真値の分散で正規化した値のことらしい。
580 :
132人目の素数さん :2005/05/18(水) 14:47:41
581 :
132人目の素数さん :2005/05/18(水) 15:40:26
578です。 580さんどうもありがとう。
582 :
132人目の素数さん :2005/05/18(水) 21:30:01
モデルを使った統計分析の話なのですが、 パラメータを推定する際に最尤法を使うとすると、 最尤方程式を解くために遺伝的アルゴリズム等の最適化手法が使われているのでしょうか?
583 :
132人目の素数さん :2005/05/19(木) 00:49:51
>>579 >平均2乗誤差を真値の分散で正規化...
真値の分散って、何の分散のこと?
585 :
584 :2005/05/19(木) 04:15:50
間違えました 訂正 ×調べる日2004/12/17-18は土日なので ○調べる日2004/12/17-18は金・土なので
普通にトレンド出せば良いのでは?
587 :
132人目の素数さん :2005/05/19(木) 07:53:19
最小2乗法の変わりにロジスティック回帰分析をつかう時はどんな時か知りたいのです。 どんなデータの時にロジスティック回帰分析を使い、どんな時に最小ニ乗法を使うんでしょう?
588 :
132人目の素数さん :2005/05/19(木) 11:38:37
わからない統計の問題があるので、教えてください。 3つの独立変数があり、 回帰分析の結果すべてのb-weightに有意差があることがわかりました。 この場合、階層的重回帰分析を使うこともできるけど、する必要がないのはなぜか? という問題なのですが、まったくわかりません。 わかる方がいたら、教えてください・・・・。
589 :
132人目の素数さん :2005/05/19(木) 15:21:32
>587 りんごとみかんを比べとる。 ロジスティック回帰→モデルの種類 最小二乗法→モデルのパラメーターの推定方法
正規分布 X〜N(m,σ^2) とし、 (X-m)/σ = Z とおくと 標準正規分布 Z〜N(0,1) となることを証明せよ これってどうやればいいんですかね? 僕が思うに、ZとXが逆のような気がするのですが……
>>590 標準化とかそんな用語で説明書いてあるんじゃない?
ちゃんとあっている式です。
確率密度関数で計算するとか、特性関数で計算するとか、
証明法は沢山あります。
使っている教科書、今までの講義内容見れば分かると思うけど…
592 :
590 :2005/05/21(土) 18:35:41
>>591 「標準化」でこれ書かれているわけですが、授業でこの部分を省略したんですよ。
んで、証明してこいと……
X=1/(√(2π)σ)exp[-{(x-m)^2}/{2σ^2}]
Z=1/{√(2π)}exp(-x^2/2)
としてもなりませんよね……
>>592 Xの従う分布の密度関数が
f(x)=1/(√(2π)σ)exp[-{(x-m)^2}/{2σ^2}]
だから、確率変数
(X-m)/σ = Z
の従う密度関数は
f(σZ+m)*σ
という話があったんじゃないかな?
微積の教科書なら変数変換で、統計の本ならちゃんと
書いてあるはず。
mでなく、μですね。
594 :
132人目の素数さん :2005/05/21(土) 20:10:02
誤差項のない因子分析のモデルは 主成分分析のモデルに逆行列をかけたものと同じようにみえるのですが そういう理解でいいのでしょうか。
595 :
590 :2005/05/21(土) 21:04:44
>>593 つまりXの密度関数f(x)を
f(σz+m)*σ
としたらZの密度関数
g(z)=1/{√(2π)}exp(-x^2/2)
が出るというわけですね
596 :
590 :2005/05/21(土) 21:15:46
あぁ、分かりました 何か変なことばかり訊ねてすみませんでした 答えてくれた方、どうもありがとうございます スレ汚しスマソ
597 :
132人目の素数さん :2005/05/21(土) 22:30:53
>>590 さすがに頭悪すぎ。分布関数と密度関数の違いが全く理解できてない。
598 :
132人目の素数さん :2005/05/22(日) 21:45:58
再質問です。 十分統計量の直感的イメージを教えてください。 教科書などの例を見ても、どうもしっくり来ません。
>>598 1が出る確率p
2が出る確率2p
3が出る確率1-3p
という分布があったとしよう。この分布はpの値に関わらず2が出る確率は常に1の2倍だから、3pと1-3pの確率でまず「1 or 2」か「3」かを決めて、前者なら確率1/3で1、確率2/3で2を出す、ってことと一緒。
だから、pについての情報としては「1 or 2」か「3」のどちらが出たか、さえ分かれば十分。後はpと関係ない確率で事象が生じる。
次によく出てくる標本の例。
たとえば、確率pで1、1-pで0、っていう母集団から(X_1,X_2)っていう大きさ2の標本を取った場合、(X_1,X_2)の分布は、
(0,0)である確率は(1-p)^2
(0,1)である確率はp(1-p)
(1,0)である確率はp(1-p)
(1,1)である確率はp^2
で、(0,1)と(0,1)は確率はpに関して同じ形。だから、(0,0)、(0,1)と(1,0)、(1,1)の3通りのどれが生じたか、さえ分かればことpに関しての情報は漏れなく取れることになる。
統計量の言葉で言えば、統計量T(X_1,X_2)がpの十分統計量であるためには、関数T(・,・)が、(0,0)、(0,1)と(1,0)、(1,1)の3通りで違う値を取ればいいことになる。
例えばT(X_1,X_2)=X_1+X_2は十分、T(X_1,X_2)=(X_1)*(X_2)は十分じゃないわけだね。
結局、(X_1,…X_n)が、まず統計量T(X_1,…X_n)の値を先に決めて、そこから母数θに関係ない分布で(X_1,…X_n)を決める、というプロセスに分解できればT(X_1,…X_n)はθの十分統計量ということになる。
(X_1,…X_n)の実現値そのものすべてを知らなくても、ことθの推定に関しては十分統計量T(X_1,…X_n)の実現値を知れば十分なわけだね。
600 :
132人目の素数さん :2005/05/23(月) 16:27:22
とある人から、「これからはベイズの時代だ」と聞いたことがあります。 どういう根拠で、これからはベイズの時代なのでしょうか。
ただ単にそう言いたかっただけちゃうんかと。
602 :
132人目の素数さん :2005/05/24(火) 09:11:20
>>600 意外と使えるということだろうね。
何を対象にしているかにもよる。
>>600 計算機のソフトを利用して、事前分布の候補を沢山設定できる
ようになり、もっともらしく結果が書けるようになったから
604 :
598 :2005/05/25(水) 00:49:23
>>599 ありがとうございます。
よく分かりました。
605 :
132人目の素数さん :2005/05/25(水) 06:05:59
最小十分統計量ってどうやって求めるのでしょうか。
606 :
132人目の素数さん :2005/05/25(水) 06:59:06
一致推定量の分散が、有効推定量の分散より 小さくなる場合はあるのでしょうか。
607 :
132人目の素数さん :2005/05/25(水) 22:23:01
2変量の相関係数を分割したデータセットから求めることってできますか? つまり (112.5, 88.4) (-5.3, 600.5).... みたいなデータが10万組ぐらいあったとして、その全てを一度に扱えるなら 相関係数は普通に計算できるのですが、それではメモリが足りません。 そこで最初の1万組から何らかの統計量を計算しておいて、また別の1万組で 計算して・・・というのを繰り返し、最後にそれらを合わせることで 10万組のデータについての相関係数を求める、ということをしたいの です。 そういうことってできるのでしょうか? また出来るとすれば どんな統計量を保存しておけばいいでしょう?
608 :
132人目の素数さん :2005/05/26(木) 02:17:44
LL confidensial
611 :
606 :2005/05/26(木) 19:55:06
>>608 クラーメルラオの不等式は、不偏推定量で、かつ分散最小の時に、
等号が成立するという意味ですが、不偏推定量でなければ
有効推定量の分散より小さくなる場合があるのかということが質問の意味です。
質問は、一致推定量に限っているわけでないです。
>>609 その論文に書いてあるということでしょうか?
612 :
132人目の素数さん :2005/05/26(木) 22:32:46
相関がある対数正規乱数ってどうやって生成できます?
>>611 不偏でなければ当然分散は有効推定量より小さくなりえるよ。っていうか推定量を定数にすりゃ分散はゼロだし。
そういう特殊なものはおいといて、推定量に関して
MSE(平均二乗誤差)=分散+bias^2
っていう関係があるけど、不偏推定量(bias=0)の場合、分散にクラメール・ラオの下限があるからMSEにも下限がある。
でも、不偏じゃない(bias≠0)の場合は分散に下限が無いから、MSEが不偏推定量のそれより小さくなることがありえる。
導出法なんですが・・・・ キュムラントのための積率母関数を求める際に、 E[e^{θλ}]=・・・・* ∫_{0}^{∞} exp{zθ/z - nθ/z logz}g(z)dz *・・・・ g(z)=カイ二乗分布のpdf の真ん中の部分をとくと =2^{-nθ/2} (1-θ)^{(-(1-θ)n-1)/2} *( (Γ((1-θ)n-1)/2)/Γ((n-1)/2) ) となるはずなんですが、過程がわかりません。 ガンマ関数の使いどころがわからず解けずにいます。 どうか教えてください。
615 :
132人目の素数さん :2005/05/30(月) 22:44:33
この問題がどうしても解けません・・・。 どなたか教えて下さい。 受験者1万人の模擬試験を行った。 この模擬試験の得点の分布が平均55点、標準偏差12点の正規分布に従っていると仮定した場合、 順位50位の人の偏差値はどれくらいになるか小数第1位まで求めよ。 また、採点が1点単位で行われているとしたとき、上位50位以内の順位に入るには何点以上の得点が必要か求めよ。
>>615 偏差値=((得点-平均)*10/標準偏差)+50
と、
(得点-平均)/標準偏差 が標準正規分布に従うこと
が分かってりゃ解けるだろ。
>>614 それだけじゃ何やってるか意味不明。
…の部分が分からないし、そもそもλがカイ2乗分布に従うのか?
質問するならもっとしっかり式や仮定を書けよ。
適合度の検定でOiを観測度数、Eiを期待度数として Σ((Oi-fi)/fi)^2という統計量を考えますが、 この値がχ2乗分布に従うことの証明が乗っているWEBや本はないでしょうか?
618 :
617 :2005/05/31(火) 08:50:15
誤:Σ((Oi-fi)/fi)^2 正:Σ(Oi-fi)^2/fi 2項分布で計算してみたらこの値が((x-μ)/σ)^2 μ,σは2項分布の平均、分散になっていました。 2項分布が正規分布で近似できるなら確かにχ2乗分布になりますが そういうことなのでしょうか?
>>618 Pearson Chi square testとかでググれば出てくると思う。
手元にある
栗栖忠、濱田年男、稲垣宣生
統計学の基礎
裳華房
のpp.149--150に書いてある。
絶版になっている
柳川堯
離散多変量データの解析
共立出版
なんか見るとこの辺り詳しく書いてあると思う。
すいません。証明は無かった。
620 :
132人目の素数さん :2005/05/31(火) 17:55:01
残差平方和と回帰平方和をたしても全平方和にならないんですが、計算ミスですか?
>>620 定数項のない回帰モデルだと、一致しません。
622 :
132人目の素数さん :2005/05/31(火) 21:17:56
623 :
132人目の素数さん :2005/05/31(火) 22:26:39
計算機統計学って分野を研究したいんだけど あんまり大学院で研究してる先生いない みたいなんだけどいい大学院ってしらない?
624 :
132人目の素数さん :2005/06/01(水) 00:04:14
たこやき大学,ポプラ大学,桃太郎大学あたりが計算機統計学会の 主要大学だと思うが,いい大学院は知らない.
誠大学がいいと思うよ。
627 :
132人目の素数さん :2005/06/01(水) 02:47:39
完備統計量の直感的意味が良くわかりません。 教科書などの例を見ても、どうもしっくり来ません。 どなたかご教授お願いいたします。
628 :
132人目の素数さん :2005/06/01(水) 03:55:13
性器分布って何ですか?
629 :
615 :2005/06/01(水) 11:41:55
統数研に計算機統計グループってのができましたね。 院はあったはず(ドクターだけだったかも)
>>627 Tが完備統計量なら、Tの関数の形をした統計量で平均が同じものは本質的に1つしかない、ということ。
632 :
オスエテ :2005/06/02(木) 18:08:56
AsB(2要因混合計画)の分散分析をしました。 A→2水準、B→2水準 すると、Aに主効果(p<0.00001),Bに主効果(p<0.00001), ABの交互作用(p<0.0001)が有意でした。 しかし、交互作用に関する下位検定をしたところ、 B1におけるAの効果が有意(p<0.00001), B2におけるAの効果が有意(p<0.00001), A1におけるBの効果が有意(p<0.00001), A2におけるBの効果が有意(p<0.05) と全てが有意になりましたwww おそらく、A1におけるBの効果(p<0.00001)と、A2におけるBの効果(p<0.05)の違いが、交互作用をもたらしたのだと思うのですがこれを交互作用と呼んでもよいのでしょうか??? 統計的には普通(p<0.00001)と(p<0.05)を異なるとは言うことはできないわけですよね??? 下位検定でどこかの部分だけが有意でない、もしくは逆方向に差がでていればわかりやすいのですが。。。。 専門家の方、教えてくりとりす!!!
633 :
132人目の素数さん :2005/06/02(木) 18:09:25
634 :
132人目の素数さん :2005/06/02(木) 18:18:33
635 :
132人目の素数さん :2005/06/02(木) 20:27:05
突然すみません。数学に詳しい方教えて下さい。 問題:任意に抽出した35人のうち3人が同じ誕生日(年は 考慮しないで月と日のみが同じ場合)である確率は何%? 1年は365日で計算します。 というものです。よろしくお願いします。
636 :
GreatFixer ◆ASWqyCy.nQ :2005/06/02(木) 20:34:01
637 :
132人目の素数さん :2005/06/03(金) 09:59:14
今日から統計の勉強を個人的に始めたのですが、なぜ幾何平均は 増加率の平均を求めるのに適しているのでしょうか? 例えば、GDP成長率として01年2% 02年8%とした場合、 普通に平均を求めて、5%とせずに、4%とするってところがわからないです。 教科書には、さらっと計算式しか載っていないんで、理由がわかるかた いらっしゃいましたらよろしくお願いします。
638 :
132人目の素数さん :2005/06/03(金) 12:14:19
GDP成長率aの定義は? 今年度GDP=(1+a)*前年度GDP?
>>637 増加率は複利計算になっているから。
GDP[01]=(1+0.02)*GDP[00]
GDP[02]=(1+0.08)*GDP[01]=(1+0.08)*(1+0.02)*GDP[00]
00年から02年までの間にGDPは(1+0.08)*(1+0.02)倍になった。
だから平均増加率は{(1+0.08)*(1+0.02)}^(1/2)-1。
640 :
オスエテ :2005/06/03(金) 20:11:47
ありゃ、オレ様の
>>632 の質問に答えてくれる賢人はおらんのか?
統計スレの住人のレベルも大したことないのう。。。。。。
ガッカリじゃ。。。。。。
>>640 専門家、がいないだけだろw
A2におけるBの効果が高度に有意、ってことで何か問題あるのか?
642 :
オスエテ :2005/06/03(金) 22:26:21
>A2におけるBの効果が高度に有意、ってことで何か問題あるのか? 有意水準を設定した場合、二つのうち片方がそれ以下で片方がそれ以上 の場合、両者の効果に違いがあると言ってよい。しかし、両方とも有意 な場合、もしくは両者とも有意でない場合は、帰無仮説棄却の原則から 考えると、P値が違っていても二つの効果が異なるとは言えないはず じゃないの? ただ、こういう特殊な場合には、基本原則の例外ということで両者に違 いがあると言っちゃってもいいのかな? 統計の本読んでもこういう例 は載ってないのでちょっぴり困ってるボクちゃん。 この質問に確信をもってこたえてくれる賢者はおらんのかのう?
全国の小学生854人についてのある調査によると、2004年の正月にもらった お年玉の平均額は24668円で、前年の平均23777円よりも891円多かった。 ただし、標準偏差(n-1で割ったもの)は17610円とかなり大きかった。 仮に、このデータが全国の小学生からの無作為抽出だとして、果たして本当に 母集団で平均額が上がったのかどうかを検定してみたい。 前年の詳しいデータが無いので便宜上、前年のケース数と標準偏差とは2004年と同一だと仮定する。 帰無仮説を「母集団において2つの年のお年玉の平均額は等しい」とするとき 検定結果はどうなるか?という問題。 設問からなんとなく片側検定でいいような気がするんですがどうでしょうか? この場合、帰無仮説は棄却されるんですか、それともされないんですか? tを求めることができないのでどなたかご教授願います。
644 :
132人目の素数さん :2005/06/04(土) 01:10:44
>>642 >有意水準を設定した場合、二つのうち片方がそれ以下で片方がそれ以上
の場合、両者の効果に違いがあると言ってよい。しかし、両方とも有意
な場合、もしくは両者とも有意でない場合は、帰無仮説棄却の原則から
考えると、P値が違っていても二つの効果が異なるとは言えないはず
じゃないの?
俺もそう思う。
逆に一言聞きたいんだが、下位検定に関しては多重性を考慮しなくていいのか?
下位検定については詳しく知らないので、ちょっと聞いてみた。
出来れば下位検定について簡単に教えてくれ。
645 :
132人目の素数さん :2005/06/04(土) 01:27:20
このスレは隠れマルコフモデルとかの話も可ですか?
646 :
オスエテ :2005/06/04(土) 17:32:17
>>644 オレもあまり詳しくないのだが、
なお、交互作用が有意だった時の下位検定である単純主効果検定は、多
重性とは関係ないんじゃないかな。交互作用が有意だったときには、オ
レの例(
>>632 )でいうと
B1におけるAの効果& B2におけるAの効果、A1におけるBの効果&A2
におけるBの効果があったかどうか、それぞれについて全体の誤差項を
分母にF値を算出する。そして、B1におけるAの効果はあったけどB2に
おけるAの効果はなかったなとかかんとか、それぞれの効果の違いにつ
いて考察する。
ただ、今回は交互作用が有意なのに、全ての単純主効果が有意だったの
でどう解釈してよいのか困っているわけ。
一方、主効果が有意だった場合に行う下位検定の多重比較については、
多重性について考慮に入れているのがほとんどのはず。
TukeyのHSD法なども、あらかじめその要因に含まれる水準数を考慮
に入れた臨界値を算出し、水準A1と水準A2の差が、その臨界値を上回
る場合は有意、下回る場合は有意でないと考える。また、ライアン法
も、ステップ数という概念を用い、多重性について考慮に入れている。
647 :
おみゃ :2005/06/04(土) 17:42:25
情報系の大学生です。 データ、(X1,Y1),(X2,Y2), ... ,(Xn,Yn) 標本相関関数が -1 <= rxy <= 1 となるのを シュワルツの不等式の関係をつかってときたいのですが、 すっきりいきません。 また、Yi = a*Xj + b (a not = 0)のとき、 lrxyl = 1 を証明したいのですが、代入後の式がごちゃごちゃして よくわかりません。 どなたか助けてくださいませんか?
648 :
648 :2005/06/04(土) 17:55:38
√64 = 8
649 :
おみゃ :2005/06/04(土) 19:06:20
>>647 一応解決しました。-1 <= rxy <= 1 の方は
きちんと立式できませんでしたが
652 :
132人目の素数さん :2005/06/05(日) 00:19:19
カイ二乗検定をやるようなデータで、 サンプル数とデータ数、そしてp値がわかっているとき、 そのデータの検出力を算出する方法を教えて下さい。 具体的な数字を出してくれると嬉しいです。 お願いします
>>649 ベタな証明じゃないですけど。
yi, xi をそれぞれ Xi, Yi の平均からの偏差とします。
t に関する2次式 Σ(yi-t*xi)^2 が非負となるように
判別式の符号を決めてやります。
これで -1 <= rxy <= 1 が導出できます。
654 :
643 :2005/06/05(日) 23:15:54
>>651 tの値。
自分で計算したら1.479になった。
危険度5%の片側検定で帰無仮説を棄却………できるの?
教えてニダ。
[人] 1 2 3 4 5 6 7 8 9 10 ____________________________________ [A] 77 68 67 72 60 54 51 53 44 41 [B] 58 68 79 70 64 65 49 69 60 58 ↑10人の[A][B]の平均値、標準偏差、共分散、相関関係を求めたい。 もちろん平均は[A]=58.7 [B]=64 と計算できたし、 教科書見ながらだから標準偏差^2=分散や他の公式とか分かるんだが イザ問題となるとなぜか使いこなせない。 誰か手取り足取り教えて栗。 orz
656 :
132人目の素数さん :2005/06/06(月) 06:01:14
>>631 「Tが完備統計量なら、Tの関数の形をした統計量で平均が同じものは本質的に1つしかない、ということ。 」
とありますが、完備統計量の定義式をどう解釈すれば、そう解釈できるのでしょうか。
>>656 では、まず完備統計量の定義を書いてみて。
658 :
132人目の素数さん :2005/06/07(火) 19:13:50
>>657 Xを十分統計量としたとき、E{u(X)}=0を満たすのは
確率が0になる集合を除いて恒等的にu(X)=0のとき
>>658 それから、Xの関数f(X),g(X)について、
E[f(X)]=E[g(X)] ⇒ f(X)=g(X) a.e.
を証明してみな。
突然失礼します(>_<) クラスター分析で非階層的手法(k-means法など) の基礎の基礎を勉強したいのですが、 オススメの書籍ありませんか?? 初心者なので、解りやすく薄い本がいいのですが・・・。
>>660 クラスター分析って階層的か非階層的かに関係なく大して理論的な背景がないから
どのパターン認識の教科書でもたいてい最後の方にちょこちょこっと解説が出てるだけだよ。
発表されてる論文の多くも、ほとんどがアドホックなヒューリスティックな話ばかりで
深みのあるような内容はまるでないし。
662 :
660 :2005/06/08(水) 03:04:23
>>661 ご返事ありがとうございます。
やはり、そうでしたかー。
学部学生でspss、クレメンタインを使って解析しているのですが、
教科書的なものが意外と少なくて困っていました。
けど、少ないのはクラスター分析の内容自体みたいですね(安心)。
勉強になります!!
663 :
132人目の素数さん :2005/06/08(水) 15:54:57
「X_1,X_2,・・・・X_nを f_X(x;θ)=exp{-(x-θ)} θ≦x<∞ からの確率変数とする。 パラメ-タθの事前分布をg(θ) =exp(-θ) 0≦θ<∞とした時、 θの事後分布を求めよ。」という問題があるのですが、 これって求めることが可能ですか?
可能です。
665 :
132人目の素数さん :2005/06/08(水) 17:49:11
>>664 事後分布の分母が求められないのですが。
ちなみにいくらですか?
666 :
132人目の素数さん :2005/06/08(水) 19:01:59
>>664 すみません。求められました。
失礼しました。
667 :
132人目の素数さん :2005/06/09(木) 00:56:40
検出力を算出する方法が書いてあるサイトや本があったら教えて下さい。
668 :
132人目の素数さん :2005/06/10(金) 22:45:01
669 :
132人目の素数さん :2005/06/10(金) 23:22:16
調べてみたんですが、分からないのでおすえて。すごい初歩的なんだろうけど。。。 データに対応がある場合のt検定と対応がない場合のt検定というのがよく 解説されていますが、対応するデータどうしの差の平均は、結局は 対応を考えない場合の各条件の平均の差と同じになりますよね? 対応がある場合のt検定というのをあえて選ぶ理由がわからないんですが、 エラーに強いとか何か利点があるんでしょうか? 結果が一緒?な割には必ず統計ソフトでもpairedのオプションがありますし。 参考にしているのは(ウェブ以外は): 「ユーザーのための 教育・心理統計と実験計画法」 (田中・山際著 教育出版) です。
670 :
132人目の素数さん :2005/06/11(土) 17:18:35
671 :
132人目の素数さん :2005/06/11(土) 17:42:31
672 :
132人目の素数さん :2005/06/11(土) 17:44:37
673 :
132人目の素数さん :2005/06/11(土) 18:00:56
過去のデータが未来に影響しているから統計が成り立つけど、 株式市場なんかデルタ関数の世界だからデリベテイブもあてにはならない。
>>673 効率市場仮説が成立しない現実では、そうともいいきれない。
675 :
132人目の素数さん :2005/06/12(日) 18:21:58
歪度のところで質問なんですが E{(X-μ)^3}=E(X^3)-3μE(X^2)+2μ^3 をどう示せばいいか教えてください。 よろしくお願いします。
676 :
132人目の素数さん :2005/06/12(日) 19:54:30
>>676 >Excelは,コンピュータ・ソフトウェアの三種の神器のようになっていますが
マイクロソフトの製品にろくなものはない。
OutlookとかPowerPointとか使用禁止という会社もけっこうある。
678 :
132人目の素数さん :2005/06/13(月) 10:53:52
ポアソン分布の歪度ってどう求めれば良いのでしょうか? 教えて下さい。
>>678 E[X(X-1)(X-2)]を求めて、後は代入。
680 :
132人目の素数さん :2005/06/14(火) 15:41:02
全くの初心者なんですが、統計学の良い入門書を教えてください。 ある2つの母集団における割合を比較して、有意差があるかという (皆さんにとっては簡単な)作業を決められた締め切りまでに仕上げないといけないのです。 過去ログを読め、と言われそうですがその時間も惜しい状況なので、 お勧めがあったら教えてください。 statview ver5.0 for windowsは手に入れました。 大学教養部程度の数学はうろ覚えで、怪しいです。
統計って任意抽出ではなく無作為抽出からが基本だよね? 商品でよくアンケート葉書があって、業者はアンケート葉書集計して統計的に傾向をみてかなり重要視するとききます。 でもこれって客が任意に投稿したものだから、統計学的に信用できないと思うのだが なんで重要視にするんだ?
>>682 それ以外に利用できるものがないから。
電話かけても良いけど、固定電話持っている人が減っているし、
電話だと本音が聞けない。
Netでアンケートしたら、祭りとか言われたら、グチャグチャになって
しまう。
684 :
132人目の素数さん :2005/06/15(水) 18:28:24
χ二乗検定みたいなことをしたいんですけど、 y=f(x)という理論曲線にどれだけ近いかという検定をするとき、 使用するデータでy_iにはΔy_iの誤差が、 x_iにはΔx_iの誤差があるとします。 通常のχ二乗検定だとΔy_iしか使用しませんが、 Δx_iも含めて検定したい場合にはどうするんでしょうか。
ある生データがあって、これがカイ2乗分布に従っているかを確かめたいのですが、 どのようにすれば可能でしょうか? SPSS等のソフトを使う必要があるのでしょうか?
687 :
132人目の素数さん :2005/06/18(土) 16:49:38
3年分の年次のデータ(閏年調整済み)があります。 この時Arimaモデルで、 arima(0,365,0)モデルで2年先を予測する時、 この予測値は過去3年の同月同日の平均値を採用しているといった感じでしょうか? アドバイスよろしくお願いします。
688 :
132人目の素数さん :2005/06/19(日) 09:59:15
687です。年次のデータではなく日次のデータでした。
689 :
分からない :2005/06/19(日) 22:00:41
ガンマ関数の特性関数の求め方を途中の式も含めて誰か教えてくださ〜い(><)
690 :
132人目の素数さん :2005/06/20(月) 08:23:04
古いログに、以下のよううな書き込みを見つけたのですが、
「パワースペクトルとFFTを使ってます.」とは
具体的にはどういう方法なのでしょうか?
サイトや論文(日本語or英語)でも結構ですので、教えてください。
7 :名無しさん@1周年:2001/07/31(火) 12:22
共分散行列をコレスキー分解して,下三角行列に
一様乱数ベクトルを掛ければ任意の相関性を持つ
乱数が作れます.
ただこの方法は行列のサイズがでかくなると
ちょっと厳しいんじゃないかな?
んで,自分はパワースペクトルとFFTを使ってます.
8 :名無しさん@1周年:2001/08/01(水) 12:37
>>7 一様乱数じゃなくて標準正規乱数だよ
9 :7:2001/08/02(木) 12:23
>>8 その通りです。
烏都陀刺脳。
691 :
素人 :2005/06/20(月) 23:36:06
あまり統計学に詳しくないのですが、Joint regressionというのはどの様なものなのか御教授願えませんでしょうか?
692 :
132人目の素数さん :2005/06/23(木) 23:49:11
Unique Medianとはどういう意味ですか? Uniqueじゃないメディアンってあるのでしょうか?
>>692 データ数が偶数の時のmedianの決め方に
関連しているんじゃないのかな?
694 :
ど素人 :2005/06/24(金) 14:13:05
normdist,norminv,normsdist,normsinv,lognormdist これらを使わずにEXCELで正規分布表と 標準正規分布の密度関数・累積分布関数のグラフの作成の仕方を教えてください。
>>694 テキスト巻末の正規分布表をひたすら打ち込め。
698 :
132人目の素数さん :2005/06/24(金) 22:15:02
>>694 ここはお前のような奴が来るところではない。
699 :
132人目の素数さん :2005/06/24(金) 23:45:00
>>693 偶数の場合でも、
(Sample)MedianはUniqueじゃないですか?
>>692 medianの定義によるよ。分布のmedianは
F(m-)≦1/2、F(m)≧1/2
を満たすmとして定義(50パーセンタイルの定義だね)するが、これは必ずしもユニークにはならない。
標本medianは当然点推定量にしたいわけだから、標本が偶数個だろうが奇数個だろうが
>>699 のいうように一つに決めるのが普通。
701 :
ど素人 :2005/06/25(土) 23:04:17
もちろん宿題ですよ。 宿題以外でこんなこと考えないでしょ。 それでもいいて人の協力お願いします。
702 :
132人目の素数さん :2005/06/25(土) 23:39:48
ポカーン
703 :
132人目の素数さん :2005/06/26(日) 18:12:37
標本分散の分散が良く分かりません。 なんで(1/n)(μ4-((n-4)/(n-2))σ^2) なんて妙な形になるんでしょうか?
704 :
703 :2005/06/26(日) 18:40:07
すみません 別すれで聞くことにします。
705 :
132人目の素数さん :2005/06/27(月) 23:53:54
Sample Median はその定義により常にunique (奇数なら中間値、偶数なら2つの中間値の平均)。 連続分布では、Median は常にunique。これは、仮定法で証明できます。 Medianがuniqueではないと仮定する(aと bがMedian)。 しかし、連続分布の場合、P(a< X <b)> 0 なので、Medianの定義と矛盾します。 離散分布の場合、Median は必ずしもuniqueではありません。例えば、 P(X=1)=.5 P(X=50)=.5 の離散分布では、1から50までの実数が全てMedianになります。
>>706 質問!
1.仮定法で証明
これは数学の教科書にないです。定義を教えてください。
2.例えば、
F(x)=0, (x<0), =x, (x<=1/3), =1/3, (1/3<x<=2/3), =2x-1, (2/3<x<=1), =1, (x>1)
は連続分布か離散分布のいずれになるのでしょうか?
>>707 1. ゴメン、これはとんだ間違い。本当は背理法です。仮定法は英語の教科書にしょか載ってませんね、すいません。
2. これは、連続です。 離散分布の確率分布F(x)は階段のような非連続のグラフになります。離散の場合、Point of discontinuity (跳躍点)にProbability Mass (確率)があります。
連続分布の定義は、確率分布F(x)が連続であることですので、どの実数aをとってもP(X=a)=0が成り立てば連続分布ということになります。
この例では、確率密度関数が、f(x)=0(x<0、1/3<x<=2/3)、1(0<=x<=1/3)、2(2/3<x<=1)ですので、一様分布に似た密度関数になります。
一般的に、確率点(x)がcountable(finite or infinite) であれば離散、 uncountable (bounded or unbounded interval) であれば連続になります。
>>MCMC mixtureという概念は無いのですか?
>>709 あります。例えば、F(x)=0(x<0)、x(x<=1/3)、1/3(1/3<x<1/2)、2/3(1/2<=x<2/3)、x(2/3<=x<=1)。 この確率分布だと、P(X=1/2)=1/3なので、F(x)に pointo of discontinuity (at x=1/2) が有るので、連続と離散のmixtureになります。
711 :
31 :2005/06/28(火) 09:16:44
>>MCMC 706では2つの場合分けしかしていなく、これで充分ですか? mixtureとかあるわけだし、一般的に証明したら? または凡例出したら?
712 :
132人目の素数さん :2005/06/30(木) 00:33:05
1.2つの量的変数間の関連をみるには、普通、積率相関係数や回帰分析が用いられる。 この場合、積率相関係数は、回帰方程式における標準化された回帰係数に等しい。 2.名義尺度同士の関連をみるのに、しばしばクロス表分析が用いられる。しかし、 クロス表分析では、3つ以上の名義尺度間の関連を検討することはできない。 3.従属変数が量的変数で独立変数が質的変数の場合に、変数間の関連をみるのに相関 比や分散分析を用いることができる。相関比は、最大値が1、最小値が−1である。 4.量的変数を従属変数、2つ以上の量的変数を独立変数とする回帰分析を、重回帰分析 という。重回帰方程式の標準化された回帰変数は、重相関係数に等しい。 5.順序尺度は、量的変数であるので、積率相関係数を計算したり回帰分析に投入したりして 構わない。 これの答えってどれですか? できれば間違いの理由も教えて欲しいです・・・。
713 :
132人目の素数さん :2005/06/30(木) 12:28:44
>>712 1番は正解。
2番は3つ以上できないわけがない。
3番は相関比は0以上1以下になる。
4番はググればすぐわかる。
5番はまず文言的におかしい。あとは調べてみて。
補足あったらヨロ!
714 :
132人目の素数さん :2005/06/30(木) 22:36:35
最尤法とは確率分布が解らないと(前提にしないと)使えない手法なのでしょうか?
715 :
132人目の素数さん :2005/06/30(木) 22:57:16
>>714 確率分布を表現するパラメータを知るのにその確率分布をしていしないでどうやって
となります。
716 :
132人目の素数さん :2005/07/02(土) 14:57:13
大学一年で統計学を学んでいるのですが t分布 F分布 カイ2乗分布 t検定 F検定 などごっちゃになってしまっていまいち「使い分け」??ができません。 根本的にまったく別物なのでしょうか?すいませんが分かりやすく識別の説明を教えていただけないでしょうか? 教科書無しの板書のみなのでおすすめの統計学入門書も教えていただきたいです。 お願いいたします。
5個の測定データを正規確率紙にプロットしたところほぼ直線になりました 5個のデータで正規分布に従っていると仮定してもいいんですか。最低これ 以上は必要というデータ数があれば教えてください。お願いします。
エクセルで例えば10から15の間というように、ある区間の乱数を発生させたいのですが エクセルの関数では0から1の間の乱数しか発生することができません。 方法があれば教えてください
720 :
132人目の素数さん :2005/07/03(日) 19:54:09
>>717 それは貴方の一存できまります、サンプルとは別に正規分布だとはっきり分る理由があるなら、
たまたま並んだ数字がでても、正規分布と思わない理由はないと思います。
例えば正規分布を生成する乱数表を使ってサンプルを抽出しているのに、
たまたま偏ったサンプルを得ても、これは正規分布ではないと思う理由はないと思います。
たとえば、正規分布と一様分布のどちらかが生成されているとする、何個くらいサンプル拾ったら、正規分布と仮定できますか?
というのは意味があるかも知れません、どちらの確率が大きいかで判断して、その信頼性で最低限必要な個数を決める事になると思います。
詳しくは検定を勉強してみてください。
721 :
132人目の素数さん :2005/07/03(日) 20:00:23
>>716 教科書みながらでもいいので、サンプルを作って手を動かして計算してみましょう、
統計学は、数学面していますが実は数学じゃないです、習うより馴れろです。
722 :
132人目の素数さん :2005/07/03(日) 22:31:02
723 :
132人目の素数さん :2005/07/03(日) 23:33:55
ATMは週末に渡る顧客の引き出しを確保するに十分な現金をストックしてなく てはならない。しかし、銀行は、必要以上にATMに現金をストックさせると、 貸し出しによって利子を稼げる機会を無駄にする。ある特定の支店のATMでは 週末期間中の顧客の取引一回あたりの予想平均引き出し金額は160ドル、 予想標準偏差は30ドルである。 1.対立仮説と帰無仮説を述べなさい。 2.もし36個の無作為抽出のATMの、預金引き出しの標本平均が172ドルだったら、 母集団平均がもはや160ドルではないevidenceになるだろうか?優位水準は0.05を使いなさい。 3.P値を計算しなさい。またその意味はどう解釈されるだろうか? 4.問題2で優位水準が0.01だったら答えはどうなるか考えてみよう という問題なんですがお願いします。m(- -)m
724 :
723 :2005/07/03(日) 23:42:20
自分なりの答えです。。。 1.対立仮説→支店によって引き出し金額は変わらない 帰無仮説→引き出し金額は支店に関係しない 2.α=0.05は20回に一回の頻度で起こり得るので160ドルではないとは 言い切れない。 3. ??解りません(泣
725 :
722 :2005/07/04(月) 00:39:01
自己可決しました
幾何学と統計学って関係ある?
728 :
132人目の素数さん :2005/07/05(火) 07:01:42
>727 1,2,4は自力で解けました。。でもP−valueが解りません!! どなたか式だけでも教えていただけないでしょうか??
>>728 を見て思ったんだけど、P-value派とp-value派はどちらが多いの?
p-valueとデフォで入力できないM$アプリのせい?
>>716 t分布 F分布 カイ2乗分布 t検定 F検定
などごっちゃになってしまっていまいち「使い分け」??ができません。
大雑把にいうとxが正規分布に従うならば、x^2はカイ2乗分布に従います。
x,yがカイ2乗分布に従うならば、x/yはF分布に従います。
xが正規分布、yがカイ2乗分布に従うならばx/yはt分布に従います。
どの分布にもあてはまらないという分布もあっても良さそうなのに なぜそのような反例が報告されないのでしょうか?
>>731 言ってる意味がよくわからんけど
統計量がこういった分布になるものしかあつかっていないから
てきとーな量はもちろんこうした分布に従わない
規則性のないデータの羅列はノイズと呼びます。 どの分布にもあてはまらない分布であって、 規則性があるなら、新しい分布としてあなたが命名すればよろしい。
早くもこのスレは夏休みモードですか
ランダムという規則がある。 不可逆という規則がある。 カオスという規則がある。 これらの規則を分布則として定義化し、既知の分布群と同程度の知名度にまで昇華させたい。
>>737 ほいじゃよ、分布関数が収束しない確率変数って奴はどうするよ?
たとえばこんなんじゃ
1,0,1,1,0,0,1,1,1,0,0,0 と後ろに行くほど連続する奴とか
739 :
132人目の素数さん :2005/07/07(木) 02:34:36
統計学で言う(1次、2次・・・・n次)モーメントというのは、 力学でいうモーメントとどういう関係があるのでしょうか。 名前が同じなので、何か対応があると思うのですが。
>>739 確率密度が物質の密度(比重)に対応するとすると、統計のモーメントと力学の
モーメントは基本的に同じ定義になります。
力学での重心は統計の1次のモーメントに相当し、
力学での慣性モーメントは、統計の2次モーメントに相当します。
密度に重み(もしくは距離)をかけて積分するのが「モーメント」ってことですかね。
742 :
:2005/07/07(木) 08:42:52
>>738 それ確率変数じゃなくてただの数列だって。
ほんとは、確率変数とか確率分布のことよく知らないの?
743 :
:2005/07/07(木) 08:59:58
>>737 ランダムは規則がないからランダムて言うんだよ。 しかも、正規分布でもポアソン分布でも、無作為に標本とったりできるんだから、確率分布全てがランダムナンバーの分布族に成り得るんだって。 カオス自体は規則性あるから確率分布でその性質を表すのおかしいって。 あまり知らないのに知った振りしてるの?それとも、ただの釣り師?
>>743 たとえば0以外出現しない確率変数はどうなるんだ?
747 :
:2005/07/07(木) 09:14:19
>>744 1、0、1、1、0、0、1、1、1、0、0、0、 これのどこが確率変数なの?どこまでいっても、次の数字がなんだかわかるじゃん。こんなことわかんないの?
748 :
:2005/07/07(木) 09:16:33
>>745 そういうの、定数っていうんだよ。釣ってるの?
749 :
:2005/07/07(木) 09:21:09
>>746 もっと勉強がんばってね。
なんだかな、数列だと思う件については、まっ、難しいのでよしとして・・・ お前平均の計算一つしたことないだろ、定数の確率変数を入れないと式変形なんてまともにできんよ。 例えば六面全部1と書いているサイコロの目の出現確率の分布を考えてみろ。
751 :
:2005/07/07(木) 09:52:20
>>750 だって、確率変数は関数なんだから、あんたの例では、X:Sー>{0、1}てかくべきだよね。 1、0、1、1、0、0、1、1、1、0、0、0、ってただ特定の結果だよん。 これのどこが確率変数? さいころの事だけど、それは、便宜上退化した確率分布っていってるだけで、実際 定数のことだよ。平均のことは、大数の法則のことかな?これって、確率変数が定数に収束することだよね、もしくは、定数嫌いのために便宜上、退化した確率分布に収束ともいうけど、結局、これ定数です。
>>751 おまえ確率やら統計やら以外の数学は知っていそうだが、こっちゃら方面は全くの無知なんだなw
そうそう、統計と確率の違いもしらないだろw
>>751 もしどうしても規則性というのが気に食わないのなら、相関係数という概念を考えてみようw
さらに自己の系列に対する自己相関という概念も考えてみようw
これらが考えられるものは確率変数ではない!
と断言されますか?そうですか・・・
754 :
:2005/07/07(木) 10:11:15
>>752 そーかな、意外と知ってるよ。
統計って、統計量のこと? 統計量がある確率分布にしたがって、その分布
をもとに特定の統計量の値の確率をもとめられるんだけど、何か?
>>754 統計が扱う母集団は確率とは全くの無関係なんだよ、だから統計は数学とはいい難いんだ。
756 :
:2005/07/07(木) 10:35:50
>>755 >>統計が扱う母集団は確率とは全くの無関係なんだよ あんた本当に知らんね。 母集団の確率分布が統計量の確率分布をきめるんだけど、、、 まあ、母集団の分布知らなくても、サンプルおおかったら、 正規分布に収束する統計量(平均など)も有るけど。 ともかく、もう少しガンガレ
757 :
:2005/07/07(木) 10:39:55
>>753 ?? そんなこといってないし、
自分のそんな頃があって恥ずかしこそばゆいな・・・ 見ているこっちが恥ずかしくなるからヤメレ
クロス集計表(分割表)の検定と平均値の差の検定ってどう違うの?
760 :
132人目の素数さん :2005/07/09(土) 22:20:37
統計学についてのレポートを書かないといけないんですが、良いサイトを紹介していただけないですか? テーマは統計の方法と理論についてです!
762 :
学生 :2005/07/10(日) 12:15:28
次の数字は一様乱数として使えますか?またその理由を教えて下さい。 (1)円周率の1000桁目か1250桁目まで (2)乗用車のナンバー4桁数字 (3)電話帳
宿題丸投げですか?丸投げならそうする理由を教えて下さい。
764 :
学生 :2005/07/10(日) 13:02:01
明日課題の締め切りなんです(T-T) この問題よく意味分からないし。 しかも締め切りに間に合わないと単位落としちゃうんです。
一様乱数というのは、全部の目が同程度に出るサイコロのような物の事 (1)円周率の1000桁目か1250桁目まで ウエブ上で1-9までの数字がほぼ同程度にあることが書いているページがあると思われる、それを理由に使えるとしてみればよい。 (2)乗用車のナンバー4桁数字 まず、どうやって使うのか分らないな、分らないものは使えないな。 ナンバープレートなら、自動車から引っぺがして、表と裏でどっちがでるかやってみれば良いが、違法だから使えない。 (3)電話帳 これはいけるんじゃないか?、はさみで丁寧に切って、セロテープで巻いてサイコロ作って、表面に数字書いて転がせ。
766 :
学生 :2005/07/10(日) 15:34:00
返事ありがとうございました。
767 :
学生 :2005/07/10(日) 15:39:28
ちなみにそのサイトを教えてもらっていいですか?
768 :
132人目の素数さん :2005/07/10(日) 15:44:38
(2)乗用車のナンバー4桁数字 名探偵コナンであるひらがな、番号は使われていないだからNG
769 :
学生 :2005/07/10(日) 15:51:34
≫768意味が分からないのですが・・・
770 :
132人目の素数さん :2005/07/10(日) 15:54:48
>>762 (1)たしかに10万桁ぐらいまでみると、ほぼかたよりなくでるらしい
けど250桁ではすくないかも。
(2)電話番号の局番の最初の桁は2-9しかつかわれない。
でも下ひと桁、下ふた桁はいけそうな稀ガス。
(3)つかわれない数字もあるし、今は希望の番号がえらべるから
きっとランダムじゃ無いと思われ。
771 :
132人目の素数さん :2005/07/10(日) 15:56:04
772 :
学生 :2005/07/10(日) 16:01:22
わかりました。 ありがとうございました。
773 :
132人目の素数さん :2005/07/10(日) 19:14:23
教えて君ですいません SPSSでROC曲線がうまく書けません 何冊か本は読んだんですがROC曲線についての記述が無く、 参考になるサイトなどありましたら教えて下さい
774 :
学生21 :2005/07/10(日) 20:46:59
問題の答えの文章をどう書いたらいいのか 分からないんですけど教えてもらえませんか? 次のような場合に標本を取り出すために(近似的な) 無作為抽出計画を立てるにはどうしたらいいであろうか。 (a)森林の立木 (b)1台のトラックに積まれている袋入りのジャガイモ っている問題なんですけど・・・
775 :
132人目の素数さん :2005/07/10(日) 21:01:40
すみません、χって言うのは何ですか? χ2乗分布と、χ2乗検定とかあってよくわかりません
ここもすっかり宿題駆け込み寺になってしまった
777 :
132人目の素数さん :2005/07/10(日) 23:25:07
>>775 カイってなんですか?って言われてもな
確率変数を用いて統計量の計算をし、それがカイ2乗分布に従っている検定をカイ2乗検定という
ところで誰かカイ2乗の名前の由来知ってる?
778 :
132人目の素数さん :2005/07/10(日) 23:49:32
統計学入門 蓑谷 千凰彦 (著) この本は初心者が読めますでしょうか?
779 :
775 :2005/07/10(日) 23:52:51
>>777 ためになりそうなので、是非教えてください。
781 :
132人目の素数さん :2005/07/11(月) 13:54:38
>>777 です
>>780 thx
t分布とかF分布は有名で知っていたが、カイ2乗だけ聞かないんだよな
青木先生が知らないとなるとショボーン
782 :
132人目の素数さん :2005/07/11(月) 14:09:11
>>780 岩波理工系の数学入門コース7 薩摩順吉 確率・統計によると
「もともと統計学者は、$\chi^2=X_1^2+X_2^2+\cdots+X_n^2$を、正規母集団
からの標本分散に関係した量としてよく用いていたので、このような名前がつ
けられるようになった。」
とありました。ギリシャ語アルファベットで\chiの大文字はXだから、ってところですかね。
783 :
132人目の素数さん :2005/07/11(月) 17:37:18
修士課程の問題なのですが、教えて下さい。 (1),(2)はなんとなく分かるのですが、(3)(4)はさっぱりでして・・・ ある装置Aには2つの部品AX、AYが使われている。それぞれの部品が故障するまでの時間を 確率変数X、Yであらわす。(X、Y)が同時確率密度関数 exp{-(x+y)}, x≧0 fXY(x、y)={ 0 otherwise を持つとする。 (1)Xの周辺分布fX(x)を求めよ。 (2)X,Yが独立であることを示せ。 (3)部品AXの方が部品AYより先に故障する確率を求めよ。 (4)装置Aは2つの部品のどちらかが故障すると動かなくなる。装置Aが動かなくなるまでの時間を確率変数Zとすると、 Z=min(X、Y) と表せる。Zの確率密度関数 fZ(z)を求めよ。 ここで、minは次のように定義された関数である。 x1, x1 < x2 min(x1,x2)={ x2, x1 ≧ x2
784 :
784 :2005/07/11(月) 19:09:23
√(784) = 28
>>783 大阪の方の大学院かな?
このくらい出来ないダメです。
786 :
132人目の素数さん :2005/07/11(月) 20:26:22
なんで正規分布の式に、πが含まれているのか教えてください
それがねーと積分して1にならねーからじゃねーの
>>783 二次元の図を描いて味噌、積分範囲がどこになるか考えたらOK
後は定積分でゴー
だとおもう、オレ高卒なんであんまり信用しないでね〜
>>786 酔っ払いモードで帰ってきた高卒クンが勢いでといてみます、うろ覚えなので合っているかどうかチェックもこめてやりま〜す。
∫e^( -x^2 / 2 ) dx を -∞ 〜 ∞ を積分して √(2π) を証明します。
f(x) = ∫(範囲-∞ 〜 ∞) e^( -x^2 / 2 ) dx
f(x) の積分はできたものじゃないので、f(x)^2 をにして
積分範囲は、正の部分( 0 〜 t )だけ計算します、対称なので lim t -> ∞ とした後、二倍にすれば答えになります。
f(t)^2 = ∫(範囲0〜t) e^( x^2 / 2 ) dx * ∫(範囲0〜t) e^( y^2 / 2 ) dy
f(t)^2 = ∬(xy共に0〜t) e^( x^2 / 2 ) * e^( y^2 / 2 ) dx dy
f(t)^2 = ∬(xy共に0〜t) e^{ (x^2 + y^2) / 2 } dx dy
とりあえずここまで計算したところで、これはほうって置いて
中の式 e^{ (x^2 + y^2) / 2 } を極座標で表現します。
x = r * cos(θ) y = r * sin(θ) として ここで、r を 0 〜 π/2 まで、 θ を 0 〜 r まで積分します、積分範囲は省略 g(r) = ∬ e^{ -(x^2 + y^2) / 2 } dxdy g(r) = ∬ e^{ -(x^2 + y^2) / 2 } * ( ∂x/∂r*∂y/∂θ-∂y/∂r*∂x/∂θ ) drdθ g(r) = ∬ e^{ -(x^2 + y^2) / 2 } * ( cos(θ)*{r * cos(θ)}-sin(θ)*{-r * sin(θ)}) drdθ g(r) = ∬ e^{ -(x^2 + y^2) / 2 } * r * { cos(θ)^2+sin(θ)^2} drdθ g(r) = ∬ e^[ -{ ( r * cos(θ) )^2 + ( r * sin(θ) )^2 }/ 2 ] * r drdθ g(r) = ∬ e^[ -r^2 * { cos(θ)^2 + sin(θ)^2 }/ 2 ] * r drdθ g(r) = ∫ e^( -r^2 / 2 ) * r dr * ∫dθ g(r) = [ -e^(r^2/2) ](範囲0 〜 r) * π/2 g(r) = ( 1 - e^(r^2/2) ) * π/2 ここで g(t)の積分範囲 ⊆ f(t)^2の積分範囲 ⊆ g(t*√2)の積分範囲 なので g(t) ≦ f(t)^2 ≦ g(t*√2) となり、挟み撃ち法で lim t -> ∞ で π ≦ f(t)^2 ≦ π したがって f(t) = √(π/2) 範囲-∞ 〜 ∞だったので二倍にして √(2π) ∫(範囲-∞ 〜 ∞) e^( -x^2 / 2 ) dx = √(2π) 分布関数にするために面積を1にするようにするためには 1 / √(2π) で割れば良いとなる。 ところで、多次元正規分布の場合が良く分かりません、重積分が全然解けないです。 重積分が自在に計算できるようなコツとかないでしょうか・・・・
792 :
786 :2005/07/12(火) 02:43:54
ありがとうございます。 けっこう複雑な計算が必要なんですね。 参考になりました。
>けっこう複雑な計算が必要なんですね。 791さんが丁寧に書いているのでそう見えるだけです。
783の問題教えてください。
795 :
31 :2005/07/12(火) 10:13:47
>>784 783の問題
ある装置Aには2つの部品AX、AYが使われている。それぞれの部品が故障するまでの時間を
確率変数X、Yであらわす。(X、Y)が同時確率密度関数
exp{-(x+y)}, x≧0
fXY(x、y)={
0 otherwise
を持つとする。
(1)Xの周辺分布fX(x)を求めよ。
(2)X,Yが独立であることを示せ。
(3)部品AXの方が部品AYより先に故障する確率を求めよ。
(4)装置Aは2つの部品のどちらかが故障すると動かなくなる。装置Aが動かなくなるまでの時間を確率変数Zとすると、
Z=min(X、Y) と表せる。Zの確率密度関数 fZ(z)を求めよ。
ここで、minは次のように定義された関数である。
x1, x1 < x2
min(x1,x2)={
x2, x1 ≧ x2
優しく教えて貰えたのにすみません。 問題だけでなく答えのほうをよろしくお願いします。
>>783 (1) fxy(x,y) を y で積分する。fx(x)=exp(-x)
(2) fxy(x,y)=fx(x)*fy(y) を示す。
(3) 答えだけ。1/2
(4) 面倒。
以上、文系人間の解答です。添削よろ。
798 :
31 :2005/07/12(火) 16:08:35
>>783 (4)
P(min(X,Y)<=t)=1-P(min(X,Y)>t)
とすれば分かるでしょ。
>それぞれの部品が故障するまでの時間を 確率変数X、Yであらわす。 >fXY(x、y)=exp{-(x+y)}, x≧0 時刻0で故障する確率が最大ってことになっておかしんじゃぁ? なんか勘違いしてる?
>>799 指数分布をお勉強しませう〜
飛行機事故は、間隔をあけて起こるより、連続して起こる確率の方が高いって話を聞いたことがないですか〜
>>800 > 飛行機事故は、間隔をあけて起こるより、連続して起こる確率の方が高いって話を聞いたことがないですか〜
それ、関係ないでしょ。
10時間故障がなく動作した後にはじめて故障する確率と、
100万時間故障がなく動作した後にはじめて故障する確率と、
どっちが大きいか、が直感的に理解できれば799の誤解はとけるはず。
>>800 横レスなんだけど、これから統計学を勉強する輩に良いサイトor本はありますか?
ぐぐったりアマゾン行ってみたけど、何がなんだか・・・
池沼発見(藁 586 :マドモアゼル名無しさん :2005/07/12(火) 23:09:55 ID:2Z4mTxJA サンプルは少なくても、的中率が100パーセントだとさすがに信憑性は あると思うのだが、いかがかな?現実世界で出会う人物で研究対象となるほど 距離が近づける人はさすがにサンプルをしては数が限られてくるが、 量よりも質を重視している。 587 :マドモアゼル名無しさん :2005/07/12(火) 23:11:44 ID:2Z4mTxJA 最低でも誕生日を聞き出すなり、調べ上げるなりしなきゃいけないから、当然、 サンプルの数を問われれば、少ないと言わざるをえないがな。 だけど、信憑性はあると確信している。
>>803 前後を見ていないのでなんとも言えないがある意味真実だよ、
統計量から統計学の各種結果を使った推定は所詮は仮定の上の物。
実践的な統計では、まずサンプルをとったら検定などせず、その実物を目視確認
予定している仮定を設定しても良いかどうかは、その後決めるというのは基本中の基本。
とりあえず、その晒し趣味はすかん、死ね
>>799 fXY(x,y)は確率密度でしょ。
故障率という概念も勉強しましょう。
バスタブ曲線とかも調べるといいね。これは信頼性理論の方かな。
806 :
799 :2005/07/13(水) 10:21:48
いや確率密度ってことはわかってるけど製品として出荷するにあたり、 出荷検査なりで初期不良品は除かれているという思い込みがあり、 なんか違和感を感じた。 とにかく答えてくれた方thanks
>>802 いい本知らないです、あったら教えて欲しいくらいです。
これは買ってはいけないという本なら紹介できます(汗
>>806 その違和感は大事だと思うけどな〜
指数分布というのは、適当な時間の期間中に一様に故障時間となるポイントを配置したときの間隔の分布だから、
製品の内部要因によって破損するというよりも、外部要因による不慮の事故のモデルだと思う。
製品の内部要因が原因でおこるとすれば、例えば n 回破損が生じたとかをモデリングすると、これはガンマー分布という別の分布になるし、
最弱の部品が壊れるとき製品が壊れるとモデリングすればワイブル分布を想定しないといけないと思う。
>>807 >いい本知らないです、あったら教えて欲しいくらいです。
>これは買ってはいけないという本なら紹介できます(汗
そうっすか
残念
指数分布探してみます。
783 ちょっと解いてみました、合っているかどうかは不明で〜す (1)Xの周辺分布fX(x)を求めよ。 fX(x) = ∫(範囲0〜∞以下略) fXY(x,y) } dy fX(x) = ∫ exp(-x) * exp(-y) dy fX(x) = exp(-x) * ∫ exp(-y) dy fX(x) = exp(-x) * { -exp(-∞) - {-exp(0)} } fX(x) = exp(-x) (2)X,Yが独立であることを示せ。 (1) と同様にして fY(y) = exp(-y) fX(x)*fY(y) == fXY(x,y) exp(-x)*exp(-y) == exp{-(x+y)} (3)部品AXの方が部品AYより先に故障する確率を求めよ。 = P( X < Y ) = ∬(範囲X<Y<∞) fXY(x,y) dxdy = ∫(0〜∞以下略) fY(y) * { ∫(0〜y以下略)fX(x) dx } dy = ∫fY(y) * { ∫exp(-x) dx } dy = ∫fY(y) * { -exp(-y) - (-1) } dy = ∫fY(y) * { 1 - exp(-y) } dy = ∫exp(-y) * { 1 - exp(-y) } dy = ∫exp(-y) - exp(-y)*exp(-y) } dy = ∫exp(-y)dy - ∫exp(-2y) dy = 1 - 1/2 = 1/2
(4)装置Aは2つの部品のどちらかが故障すると動かなくなる。装置Aが動かなくなるまでの時間を確率変数Zとすると、 Z=min(X、Y) と表せる。Zの確率密度関数 fZ(z)を求めよ。 まず fZ の累積確率分布 FZ を計算する FZ( z ) = ∬(範囲x,y<z) fXY(x,y) dxdy FZ( z ) = ∬ exp(-x)*exp(-y) dxdy FZ( z ) = ∫ exp(-x) ∫exp(-y) dy dx FZ( z ) = ∫ exp(-x) * ( 1 - exp(-z) ) dx FZ( z ) = ∫ exp(-x) dx * ( 1 - exp(-z) ) FZ( z ) = ( 1 - exp(-z) )^2 微分して確率分布を求める。 d FZ / dz = ( 1 - exp(-z) )^2 d FZ / dz = 2( 1 - exp(-z) ) * exp(-z) fZ( z ) = 2( 1 - exp(-z) ) * exp(-z)
>>810 798にある
P(min(X,Y)<=t)=1-P(min(X,Y)>t)
から展開するのが普通でしょ。
min(X,,Y)>tは、(X>t)かつ(Y>t)と同値。
P(min(X,Y)<=t)=1-P(min(X,Y)>t)
=1-exp(-t)*exp(-t)
微分すれば密度関数。
813 :
132人目の素数さん :2005/07/14(木) 10:53:10
大学で統計をやっているのですが、 まったくわかりません。 なにかわかりやすい教科書とかありましたら 教えていただけると幸いです。 マンガでわかる統計学とかどうなんでしょか?
>>813 まったくわかんないんなら、
マンガから入って徐々に基本テキストへと
進んでいけばいいんじゃないの。
あひゃっ、積分範囲を間違ってる、自分で二次元の図を描いて味噌、
積分範囲がどこになるか考るといいよ〜とか言っておきながら、
図を描かずに横着を下挙句間違っていれば世話はないですね……(汗
>>810 の修正しておきます
まず積分範囲 S を計算する
S(z) = { (x,y) | x < z ∨ x < z , x ∈ R , y ∈ R }
S(z) = Sa(z) + Sb(z) + Sc(z)
Sa(z) = { (x,y) | x < z ∧ y < z , x ∈ R , y ∈ R }
Sb(z) = { (x,y) | x >= z ∧ y < z , x ∈ R , y ∈ R }
Sc(z) = { (x,y) | x < z ∧ y >= z , x ∈ R , y ∈ R }
fZ の累積確率分布 FZ を計算する
FZ( z ) = ∬( 範囲 S(z) ) fXY(x,y) dxdy
FZ( z ) = ∬( 範囲 Sa(z) ) fXY(x,y) dxdy + ∬( 範囲 Sb(z) ) exp(-x)*exp(-y) dxdy + ∬( 範囲 Sc(z) ) exp(-x)*exp(-y) dxdy
FZ( z ) = ∬( 範囲 Sa(z) ) fXY(x,y) dxdy + 2∬(範囲 Sb(z) ) exp(-x)*exp(-y) dxdy
FZ( z ) = ∬( 範囲 Sa(z) ) fXY(x,y) dxdy + 2∫(範囲 x>=z ) exp(-x) { ∫(範囲 y<z )exp(-y) dy } dx
FZ( z ) = ∬( 範囲 Sa(z) ) fXY(x,y) dxdy + 2∫(範囲 x>=z ) exp(-x) { 1 - exp(-z ) } dx
FZ( z ) = ∬( 範囲 Sa(z) ) fXY(x,y) dxdy + 2*{ 1 - exp(-z ) }*∫(範囲 x>=z ) exp(-x) dx
FZ( z ) = ∬( 範囲 x,y<z) fXY(x,y) dxdy + 2*{ 1 - exp(-z ) }*{ exp(-z) }
FZ( z ) = ( 1 - exp(-z) )^2 + 2*{ 1 - exp(-z ) }*{ exp(-z) }
FZ( z ) = 1 - exp(-z )^2
微分して確率分布を求める。
d FZ / dz = d { 1 - exp(-z )^2 } / dz = fZ( z )
fZ( z ) = -2*exp(-z ) * ( -exp(-z ) )
fZ( z ) = 2 * exp( -2 * z )
817 :
816 :2005/07/15(金) 01:20:32
統計を使ってるとか数学的裏づけとか言ってるが、使い方が素人くさい。 最近では大学入試に数学を課してない文系にも統計学を教えてる。 その授業というものはひどいもので、相関係数とか回帰分析とかのやり方だけしめして、 あとはエクセル使ってやってみましょうってやつ。 そんなやつも混じってるだろうし、統計とか数学とか言われても説得力がない。 とはいえ俺自信も統計は齧った程度しかやってないので、 ここの皆さんに検証していただきたい。
818 :
816 :2005/07/15(金) 01:22:16
彼らの根拠としているデータはこれ。
http://hitode.org/archives/000066.php 15:09 自由民主党 20% 494 票 公明党 7% 182 票 民主党 59% 1455 票 日本共産党 4% 112 票
15:15 自由民主党 20% 535 票 公明党 7% 193 票 民主党 60% 1585 票 日本共産党 4% 119 票
15:35 自由民主党 20% 661 票 公明党 7% 236 票 民主党 60% 1978 票 日本共産党 4% 139 票
15:46 自由民主党 20% 719 票 公明党 7% 257 票 民主党 60% 2174 票 日本共産党 4% 158 票
16:03 自由民主党 19% 821 票 公明党 7% 295 票 民主党 60% 2507 票 日本共産党 4% 178 票
16:09 自由民主党 19% 849 票 公明党 7% 304 票 民主党 61% 2608 票 日本共産党 4% 185 票
16:32 自由民主党 19% 982 票 公明党 7% 359 票 民主党 61% 3030 票 日本共産党 4% 215 票
16:41 自由民主党 19%1032 票 公明党 7% 377 票 民主党 61% 3166 票 日本共産党 4% 227 票
17:00 自由民主党 19%1127 票 公明党 7% 410 票 民主党 61% 3478 票 日本共産党 4% 254 票
17:14 自由民主党 19%1206 票 公明党 7% 439 票 民主党 61% 3710 票 日本共産党 4% 267 票
17:17 自由民主党 20%1232 票 公明党 7% 448 票 民主党 61% 3769 票 日本共産党 4% 272 票
819 :
816 :2005/07/15(金) 01:25:03
448 :隣の名無しさん :03/10/11 21:00 ID:j0L0UsvD
散レスで申し訳ないのですが、
>>248 さんご提供の資料でちょっと単純な回帰分析してみました。
民主党投票数=α + β×自民党投票数
結果、
R^2が0.999を超えましたw。状況証拠だけで言えば明らかな作為が見られます。
526 :隣の名無しさん :03/10/11 21:10 ID:Wu5y+MhF
>>498 ずれた
自由民主党 公明党 民主党 日本共産党
自由民主党 1
公明党 0.999624978 1
民主党 0.999820319 0.999398175 1
日本共産党 0.998534081 0.99899655 0.998344414 1
604 :448 :03/10/11 21:18 ID:j0L0UsvD
もう必要ないかもしれないけど、一応係数載せておきます。
係数標準誤差t
切片-101.087705718.24615845-5.540218561
X 値 13.1654550390.020005071158.2326296
つまり、自民1回の投票に対し、民主は3.165回投票された計算になります。
しかも前述の通りR^2は0.999を超えてます。
820 :
31 :2005/07/15(金) 09:42:50
X_1,X_2,...,X_nはある分布F(x)に従っている。F(x)の形は 連続、離散を限定しない。 このとき、2番目とn-2番目の確率分布を求めよ。 お願いします。
>>820 意味の分らない問題だな、二番目とn-2番目が X_2 と X_(n-2) の事で
X すべての分布がF(x) なら、F(x) に決まってんじゃねぇの
>>820 順序統計量の2番目とn-2番目の同時分布という意味ですね。
@P(|z|>a)=0.2を満たす実数aの値を求めよ 一応、自分の計算した途中までの結果も書いときます。 z>aとz<-aの時に場合わけ。z≧aならばI(z≧a)=0.5-I(a)z≦-aならばI(z≦a)=0.5-I(a)。 ここまでわかりました。これからどうすればいいのかわかりません。 Axに対するyへの回帰直線の方程式って (y-yの平均値)=共分散(x-xの平均値)/xの分散 ですよね? だとしたらこれが一応、y=-0.692x+37.44になったんですが、 問題:x=10の時のyの推定値を求めよ。 これは、ただ単にxに代入すればいいのでしょうか? お願いします。
もうちょっと問題しっかりかかないと、問題として完成してないよ〜ん、 @あまりにミカン星人です、理解でけません。 I の定義とか z の分布とかが判らないとだめ。 問題文確認すべーし。 Axに対するyへの回帰直線の方程式って >(y-yの平均値)=共分散(x-xの平均値)/xの分散 ですよね? 定義しだいだけれど、特に断ってなければコレの型が多いですね、結果だけ使いたい人たち向けの本にはこれしか書いてないことも多いです。 x に値ぶち込んで y を求めればOKです。
>>824 問題は
確率変数Zが正規分布N(0,1)に従うとき、P(|z|>a)=0.2をみたす実数aの値を求めよ。
です。
Aについてですがありがとうございます!
>>825 @P(|z|>a)=0.2を満たす実数aの値を求めよ
これはちょっと本がないと説明難しいね、本の巻末に正規分布の累積分布の数表があると思うんだけど、それを使うんですよ。
それで、その数表の見方がわからないともうお手上げですね、説明書をよく読んでみてください。
んで、範囲ですが、多分数表には右半分か左半分しか書いてないと思うんですよ。
正規分布は左右対称なので、0.2の半分0.1を満たす位置を探せばよいのですが、さてさて・・・・
>>826 見方はわかりますよ。正規分布のグラフではz>a,z<-aのとこですよね?
>>827 見方がわれぱ、この問題計算不要というか読んだ時点で終わりっすよ〜
というか、この問題は読み方の練習問題なんだとおもいます〜
829 :
132人目の素数さん :2005/07/16(土) 01:41:13
中心極限定理のことで少しご教授ください。 ある検査の項目に対する回答が正規分布しない場合でも検査の合計点は 必ず正規分布に近似する理由がわからないです。 標本度数が無限に近づくことで正規分布するということでしょうか? または、定理に関係なく検査に正規分布するような項目を設定する為なんでしょうか?
830 :
829 :2005/07/16(土) 01:42:25
ageてしまって、申し訳ありません。 以後気をつけます…
>>829 中心極限定理の簡単な証明を読んでみた?
和の分布の特性関数が正規分布と一致するとかそんな方法だったような
17個のデータを用いて母分散の検定を行うとき、有意水準1%に対するχ^2分布の右側棄却域を求めよ。 これってどうやるんですか?
ある都市の工業団地で120企業を無作為に選び、1ヶ月間の工業用水の使用量を調べたら平均値756m^3、標準偏差125m^3という結果を得た。 工業用水の使用量は正規分布するものとする。 (1)この工業団地で1ヶ月間の工業用水使用量が600m^3以上800^3以下の範囲にある企業数。 ↑わかりました。 (2)この工業団地で1ヶ月間の工業用水使用量が1000m^3以上の企業数。 これは、一応不安なので式書きます。 z=X-μ/δ μ:平均値 δ:標準偏差 より z=1000-756/125=1.952 正規分布表を見ると、I(1.95)=0.47441 よってP(z≧1.95)=0.500-0.474=0.026 企業数は 120×0.026 より3.12 よって企業数は3。 これで合ってますか? (3)使用量の多いものから順に20起業を選ぶとき、上から20番目の起業はどのくらいの水を使っているか? これは全くわかりませんでした。 よろしくお願いします。
>>829 さいころを使って実際にやってみるっす、コインの両面を1,0としてやってみてもいいです。
さらに、さいころの数字を各面すき放題つけてもそうなるのでやってみてください。
分散1、平均0になるように正規化すれば、正規分布にどんどん近づくのが分かります。
最後に、コーシー分布というのがあるのですが、これについてやってみるといいです。
これは中心極限定理が成立しない分布です、だだしこれはコンピュータ使えないとメンドクサイかも。
これは実際に見ると分布関数がいつまでたっても収束せずにフラフラと漂います。
平均は、いつでも定義できる万能の計算ではないと分かります、当然、二乗の平均である分散も同様となります。
一通り実物を見終わったら証明を見てみるべし、もう書かれていますがモーメント母関数を使います。
837 :
31 :2005/07/16(土) 17:41:53
838 :
132人目の素数さん :2005/07/16(土) 17:54:22
ちょっと教えてください。 N個の異なる実数A1,A2,・・,Anから、重複を許さずに無作為にn個を取り出すことによって標本(X1,X2, ・・,Xn)が得られる。この無作為抽出によって定義される確率変数 X1,X2,・・・,Xnについて次の各門に答えよ。ただしN>nであるとする。 (i,j)の各組について、Xi,Xjの共分散COV(Xi,Xj)をNと分散σ^2を用いて表せ。ただし、確率変数X1,X2,・・・,Xnは全て同一の分散を持つので、これをσ^2とせよ。
>>828 すいません。ちょっと疑問に思ったのですが
範囲はz>a,z<-aですよね?で、それをグラフに書きます。そうすると、
例えばP(z>a)=0.1となるわけですよね?となると、aの時の面積をI(a)
とするとP(z>a)=0.5-I(a)となりますよね?ということは
0.5-I(a)=0.1よりI(a)=0.4となります。この0.4を満たす実数を正規分布表
からみつけるんじゃないんでしょうか?
どなたか834お願いします。
>>841 宿題は自分でやりましょう、余りに露骨なのはどうかと思います
843 :
829 :2005/07/16(土) 21:32:43
返信ありがとうございました。 サイコロで考えてみると少しだけイメージがわいてきました。 サイコロは1〜6の目の各目が出る確率が全て1/6で項目内では正規分布しませんが 仮に2回投げて出た目の総和を考えた時に合計点が正規分布するということでしょうか? この場合の最小値2と最大12の出る確率はそれぞれ1/36で、7が出る確率は6/36ですよね。 これにより度数が増加することで正規性が増すと理解してもよろしいでしょうか? しかし、質問紙検査などの結果においてこれは本当に証明されるのでしょうか? 具体例を探しているのですが適当な検査などありましたら教えて頂けないでしょうか?
>>843 証明はできません、正しい結果であると仮定しても矛盾しないとこが示されるだけです、
したがって、結論できたからといって正しいという事にはなりません。
正しい結果を証明する方法は只一つ全数検査のみです。
>>842 宿題じゃないんですが・・・。テスト勉強の不明点です。
この夏休みの真っ只中にか? うそっぺーーー
>>846 ってか、まだ夏休みじゃないんですが・・・。
848 :
132人目の素数さん :2005/07/17(日) 01:01:15
平均値に関して質問。 2乗平均とか3乗平均とかあるが、これらn乗平均とはどんな時に使うものなのでしょう?
>>848 広がり具合とか、ひねくれ具合とか、とんがり具合とか、ぐにゃぐにゃ具合とかを調べる。
850 :
132人目の素数さん :2005/07/17(日) 06:11:20
今,私は,専門ではないのですが,クラスター分析について勉強しています. で,とある文献に「導類似性行列と階層的樹形図が作られるもとの類似性行列の対応する要素の間の (ピアソンの)積率相関係数を計算することでこれらの行列の要素間の相関を調べることができる」 とあり,「この用途に用いられる積率相関係数のことを特にコーフェン相関係数と呼ぶ」 とあったのですが,この文章から,ピアソンの積率相関係数とコーフェン相関係数は 名前が違うだけで実際は同じものであるということは分かりました. そこで,コーフェン相関係数について別の文献で調べたところ, Σxy−(1/n)(Σx)(Σy) r(X,Y) = --------------------------------------------------------------- {Σx^2−(1/n)(Σx)^2}^(1/2) * {Σy^2−(1/n)(Σy)^2}^(1/2) ↑がコーフェン相関係数であるとありました. しかし,これはピアソンの積率相関係数である(XとYの共分散)/(Xの標準偏差 * Yの標準偏差) の式とは形が異なります. ですが,実際に任意の2つの行列で値を当てはめて試したところ,どちらも全く同一の値を返してくるので ピアソンの積率相関係数の式を変形したら,上記したコーフェン相関係数の式になるのだと思って式変形を 試みているのですが,どうもうまく同じ式になりません. どなたか,ピアソンの式からコーフェンの式に変形できる方はいらっしゃいませんか? いらっしゃいましたら,どうか変形の過程をご教授下さい m(_ _)m 長々とすみません.
>>850 分子に出てくる共分散=(1/n)Σ(Xi−(1/n)(ΣXj))(Yi(1/n)−(1/n)(ΣYj))
=(1/n)Σ{XiYj−Xi(1/n)(ΣYj)-Yi(1/n)(ΣXj)+(1/n)(ΣXj)(1/n)(ΣYj)
=(1/n)ΣXiYj−(1/n)ΣXi(1/n)(ΣYj)-(1/n)ΣYi(1/n)(ΣXj)+n(1/n)(1/n)(ΣXj)(1/n)(ΣYj)
=(1/n)ΣXiYj−(1/n)(1/n)(ΣXjΣYj)
分母に出てくるXの分散=(1/n)Σ(Xi−(1/n)(ΣXj))^2
=(1/n)Σ{Xi^2−2Xi(1/n)(ΣXj)+(1/n)^2(ΣXj)^2
=(1/n)ΣXi^2−2(1/n)ΣXi(1/n)(ΣXj)+n(1/n)(1/n)^2(ΣXj)^2
=(1/n)ΣXi^2−2(1/n)ΣXi(1/n)(ΣXj)+n(1/n)(1/n)^2(ΣXj)^2
=(1/n)ΣXi^2−{(1/n)(ΣXj)}^2
Xの二乗の平均から平均の二乗を引いたものになります。
分母に出てくるYの分散=(1/n)Σ(Yi−(1/n)(ΣYj))^2
=(1/n)ΣYi^2−{(1/n)(ΣYj)}^2
後は代入してください。
コーフェン相関係数ってあまり聞かないですね。
852 :
850 :2005/07/17(日) 06:44:25
>>851 早速の回答ありがとうございます m(_ _)m
本当に助かりました.
>コーフェン相関係数ってあまり聞かないですね。
そうですね,ぐぐっても3,4件ぐらいしか出てきませんでしたし,
やっとの思いで見つけた文献にも数行しか書かれていなかったという始末;
853 :
132人目の素数さん :2005/07/17(日) 09:57:39
17個のデータを用いて母分散の検定を行うとき、有意水準1%に対するχ^2分布の右側棄却域を求めよ。 これってどうやるんですか?
833 名前:132人目の素数さん[sage] 投稿日:2005/07/16(土) 10:46:09 17個のデータを用いて母分散の検定を行うとき、有意水準1%に対するχ^2分布の右側棄却域を求めよ。 これってどうやるんですか?
855 :
132人目の素数さん :2005/07/17(日) 10:14:45
>>853 17個の標本が正規分布に従っていると仮定する。
[分散未知の時]
このとき、帰無仮説H_0:σ^2=σ_0^2の下で統計量
Σ(X_i-Xbar)^2/σ_0
は自由度n-1のカイ二乗分布に従う。
[分散既知μの時]
このとき、帰無仮説H_0:σ^2=σ_0^2の下で統計量
Σ(X_i-μ)^2/σ_0
は自由度nのカイ二乗分布に従う。
ということを使います。
後は教科書の巻末のカイ二乗分布表を見てください。
858 :
132人目の素数さん :2005/07/17(日) 22:17:46
Y=1 Y=2 Y=3 X=1 0.2 0.2 0.2 X=2 0.3 0.2 0.1 Xの周辺分布、Yの周辺分布、Xの平均、Yの平均、XとYの共分散 の求め方を教えてください。教科書を見たりネットで調べたけど分かりませんでした。お願いします。
859 :
132人目の素数さん :2005/07/17(日) 22:20:16
Y=1 Y=2 Y=3 X=1 0.2 0.2 0.2 X=2 0.3 0.2 0.1 表がうまくかけませんでした。ごめんなさい。理解していただけるでしょうか?
>>858 >教科書を見たりネットで調べたけど分かりませんでした。
たちの悪い冗談はやめてください。
861 :
132人目の素数さん :2005/07/18(月) 01:18:14
>>860 くだらない冗談を書くほど暇人ではないんです。真剣です。
あと、表は書き間違えてました。X=2,Y=1のところは0.1です。
まず、「Xの周辺分布を求めよ」って言われたときに何を出せば良いのか分からないんです。
P(X=1),P(X=2)をそれぞれ出すのでしょうか?
もしそうであれば、P(X=1)=0.2+0.2+0.2=0.6,P(X=2)=0.1+0.2+0.1=0.4で合ってますか?
あと、「Xの平均」は1*0.6+2*0.4=1.4で良いんでしょうか?
教科書とかネットの書き方が私にとったら分かりづらくて、
これは私なりに考えた結果なんで、合ってるかどうかだけでも教えていただきたいです。
親切な方、お願いします。
>>861 書き込みしたところまでは合っています。
864 :
132人目の素数さん :2005/07/18(月) 10:12:21
X件法Y項目の検査の各項に対する回答がせいき分布に従わなくても、 検査の合計点がせいき分布にきんじするのはなじぇ?
866 :
132人目の素数さん :2005/07/18(月) 12:38:47
ある都市の工業団地で120企業を無作為に選び、1ヶ月間の工業用水の使用量を調べたら平均値756m^3、標準偏差125m^3という結果を得た。 工業用水の使用量は正規分布するものとする。 (1)この工業団地で1ヶ月間の工業用水使用量が600m^3以上800^3以下の範囲にある企業数。 ↑わかりました。 (2)この工業団地で1ヶ月間の工業用水使用量が1000m^3以上の企業数。 これは、一応不安なので式書きます。 z=X-μ/δ μ:平均値 δ:標準偏差 より z=1000-756/125=1.952 正規分布表を見ると、I(1.95)=0.47441 よってP(z≧1.95)=0.500-0.474=0.026 企業数は 120×0.026 より3.12 よって企業数は3。 これで合ってますか? (3)使用量の多いものから順に20起業を選ぶとき、上から20番目の起業はどのくらいの水を使っているか? これは全くわかりませんでした。 よろしくお願いします。
>>867 なんで(2)が分かって(3)が分からないのか
分からない…
(2)で企業数が3と言っているから、それを20にして話を
逆に辿れば(3)の答えが出るんじゃない?
正規確率表の横軸から見るのと横軸からみる問題ですね。
う〜〜ん、試験問題に出しますか。
>>868 レスありがとうございます。ちょっと計算してみたんですが、これってはっきり例えば750m^3みたいな答えはでませんよね?例えば600〜700みたいな感じですか?
人種Aの頭蓋骨の長さは、平均190mm,標準偏差8mmの正規分布に従い、人種B の頭蓋骨の長さは、平均196mm,標準偏差8mmの正規分布に従う。いま新しい発掘 の結果12個の頭蓋骨が発見され、それらはある理由から人種Aに属するらしいと考え られた。標本平均はXバー=194mmであった。標本の頭蓋骨が人種Aに属するという反説 を有意水準5%で片側検定せよ。この場合、対立仮説は、標本の頭蓋骨が人種Bに 属するとして考えよ。 これ、どうやってとけばいいんでしょうか?
>>869 876.9277という値が出てきました。
877社じゃない?
872 :
132人目の素数さん :2005/07/19(火) 18:58:07
統計の問題でつまずいています。 どうか手助けを・・・ 日本の成年男子の身長 m=165 σ=6 標準的な鴨居の高さを177とする 日本の青年男子の中で鴨居に頭をぶつける可能性のある人は何%か? 私の回答 177≦Z Z=(177-165)/36=0.33 正規分布表よりP=0.3707 よって37% となりましたが37%もいるはずないのは明らかです。 どこを間違えたのか教えてください。
>>872 Z=(177-165)/6ですね。
P=0.02275013なので2.2%位ですね。
874 :
132人目の素数さん :2005/07/19(火) 19:24:38
>>873 σで割るんですね!どうもありがとうございます
875 :
132人目の素数さん :2005/07/19(火) 19:37:21
A君とB君がじゃんけんをした。 Aの勝敗が5勝1敗のときA君の方がB君よりじゃんけんが強いといえるか? この解き方も教えてください。お願いします。
片側検定でも両側検定でもZcalの公式は変わりませんよね?
877 :
132人目の素数さん :2005/07/19(火) 20:30:08
876ですが というよりもZcalを使う母分散既知の検定に 片側検定もありますか?
878 :
132人目の素数さん :2005/07/19(火) 20:47:55
健常成人男子白血球数の標準正常値は5100±1100(標準偏差)である。 従業員135人の白血球数の平均は4900であった。 従業員の白血球数は標準値に比べて低いか。 この場合の帰無仮説は何て立てればよいでしょうか? H。:標準値より低い でいいのですか? お願いします、教えてください
879 :
132人目の素数さん :2005/07/19(火) 22:26:48
帰無仮説 文字通り無に帰してほしい仮設。つまり欲しい結果の否定
880 :
132人目の素数さん :2005/07/20(水) 00:21:36
>>878 キム仮説は
「標準値と等しい」
「標準値と等しいか標準値より高い」
のどちらかでよいとおもいますが。
ある市役所では、これまで、数年間銘柄Aの電球を購入していたが、銘柄Bの電球の ほうが価格が安いのでBへの切り替えを検討中である。 銘柄Bのセールスマンは、銘柄Bの電球は銘柄Aの電球と同じ品質であると主張している。 さて、数年間の経験によれば、銘柄Aの平均寿命は1180時間で、標準偏差は90時間 であった。無作為標本として、銘柄Bの電球を購入して試験すると、 標本平均は、Xバー=1140、標本標準偏差はs=80であった。 銘柄Bの電球の平均寿命が銘柄Aの電球の平均寿命に等しいという仮説が正しいかどうか検定せよ。 対立仮説は、銘柄Bの電球の平均寿命が銘柄Aの電球の平均寿命よりも短いとせよ。 有意水準5%で片側検定を行え。 って問題なんですけど これ、銘柄A、Bのサイズがわからないので標本平均の差の分布の公式が使えないのですが どうやって計算すればいいのでしょうか?
>>871 俺の計算
20÷120=0.166666・・・・
で、I(z)=0.5-0.167=0.333
X-756/125=0.96よりXは876になった。
どう?
>>882 871の計算はRというソフト使っています。
精度の話ですね。
正規確率表使っているなら876で良いんじゃない。
どうして(X-756)/125と括弧入れないの?
何か変な感じがします。
すいません・・。括弧つけてなかったです、、。レスありがとうございました。
>>878 帰無仮説:標準値と同じである。
対立仮説:標準値より低い。
です。
>>881 その前に分散が等しいかどうかの検定しなきゃ。
90時間と80時間を同じと見なすのは危険ですね。
でも、標本数が無いので検定できません。
何か移し間違えでは?
887 :
881 :2005/07/21(木) 14:06:55
>>886 標本のサイズが大きい場合ならσ二乗=s二乗で置き換えてもいいけど
標本のサイズが小さい場合は差が大きすぎてできないってことですよね?
90時間、80時間と差は結構離れてるので標本サイズは小さい感じかな
この問題は、大学の講義資料として配られたプリントに書いてある問題なんですが
一字一句間違えずに移しました。
もしかしたら先生の問題作成ミスかもしれません
標準偏差と標本標準偏差が両方記されてるので、もしかしたら
別の公式かなにかで、それらを使って標本サイズを求めるとか
いきなり標準誤差を出すとかできるのかなあと思ったんですが。。
888 :
132人目の素数さん :2005/07/21(木) 23:21:28
普遍分散と普通の分散ってどのように使い分けて、覚えていますか?というか何が違うのですか? n-1で割るのか nかの違いとか微妙でいまいち解っていません。 クソな質問ですがアドバイスください。お願いします。
>>888 正規母集団からの標本を使って分散を計算するとき
平均が既知の場合はnで割る。
平均が未知の時は未知のものを標本平均で置き換えるので
n-1で割る。
このとき計算される標本分散に(n-1)/σ^2を掛けると
自由度n-1のカイ二乗分布に従う。
よって、σ^2の不偏推定量となる。
>>888 平均が既知でないときもnで割ります。
これは不偏分散にならないので、推定・検定では
用いられません。
でも、標本分散を計算しなさい、と言われたら
困ってしまいますね。
nで割ったものとn-1で割ったものをちゃんと
分けて丁寧に書けば、×を付けられることないです。
891 :
132人目の素数さん :2005/07/23(土) 17:31:15
質問です。 階級代表値って何のことを指してるのですか? 155-165 165-175 175-185 ってかんじなのですが・・・
892 :
891 :2005/07/23(土) 17:36:39
真ん中ってことなんでしょうか? それしかないかなーとは思うんですが。。
893 :
確立統計難 :2005/07/23(土) 23:07:54
教えてください。 確立変数X,Yが標準正規分布に従うときZ=X-Yの従う分布をZの積率母関数 求めることによって求める問題なんですが、どうすればいいでしょうか??とりあえず、X,Yの積率 母関数m=exp(t^2/2)は求めたんですが・・・・
>>893 m_{X-Y}(t)=E(exp(t(X-Y)))
=E(exp(tX))E(exp(-tY)) (XとYが独立なので)
=exp(t^2/2)exp(t^2/2)
=exp((√2t)^2/2)
>>893 894は独立性を仮定しています。
独立性の無い場合ですから、
(X,Y)の積率母関数を計算。
それからX-Yの積率母関数を計算。
です。
896 :
132人目の素数さん :2005/07/24(日) 08:07:47
小学校、中学校、高校受験をする人がそれぞれどの位居るかわかりますか?
897 :
確立統計難 :2005/07/24(日) 14:04:11
答えていただいた方、本当に助かりました!!また質問すると思うので是非よろしくお願いします。。
898 :
132人目の素数さん :2005/07/24(日) 14:59:15
どなたか、「分割表における独立性」を説明しろと出たら、どう書けばよいのか教えて下さい。お願いします。
899 :
132人目の素数さん :2005/07/24(日) 23:01:29
どなたかこの問題解いてもらえないでしょうか?>< 俺の頭じゃ解けなくて。。ちなみに明日は統計のテストなんです。。 できれば解き方も教えてくれると助かります。 □問題□ ある年の国税調査によれば、核家族世帯を次の4つの累計にわけるとき、 その割合は、 【夫婦だけ】 【夫婦と子供】 【父親と子供】 【女親と子供】 20.7 69.8 1.4 8.1 (%) であるという。次のデータは、ある地域に住む核家族世帯の内訳である。 全国的な標準にあっているか、帰無仮説、対立仮説を明示して検討しなさい。 【夫婦だけ】 【夫婦と子供】 【父親と子供】 【女親と子供】 201 294 5 20 (世帯) ただし、x二乗表より、 x^2(4, 0.05)=9.49 x^2(3, 0.05)=7.81である。
「統計の誤用の原因と誤用を防ぐ手段について述べよ」 これどのように解答すればよいのでしょうか…?
902 :
132人目の素数さん :2005/07/27(水) 21:31:44
>>891 >階級代表値って何のこと...
どこの教科書に出てたんだ?ふつうには真ん中の値だろう。
代表値ってのは、文字通り分布を代表する値の総称。具体的には
平均値、中央値、最頻値、最小値、最大値の総称。前3者の総称が
中心値。
某板よりw ある機械部品の外径寸法の規格が28.00±0.75mmで 与えられている。 切削工程での寸法の分布は平均28.27mm、標準偏差0.294mm、 の正規分布にしたがっている。 これの不良率はどうすれば求められるんでしょう
>>902 階級代表値はclass markの訳
代表値はcharacteristicsの訳。
だから、本によっては特性値とかもある。
ところで、中心値の英語は何?
中心の尺度とか、中心傾向とかは聞くけど、
中心値は初めて聞きました。
教えてください。
905 :
132人目の素数さん :2005/07/29(金) 12:57:20
すいません、なんで無作為標本って互いに独立で同じ確率分布に従うのですか。例えば母集団がnの数から構成されているとすると 1回目の抜き出しは母集団分布そのままだと思うのですが2回目は母集団がn-1 の大きさだから2回目の確率分布は母集団分布と異なるのではないでしょうか?
906 :
132人目の素数さん :2005/07/29(金) 13:54:11
907 :
132人目の素数さん :2005/07/29(金) 13:58:16
どなたかファンヒーレの学習水準理論について解説してください。
908 :
GSX774R :2005/07/30(土) 01:39:25
Rについてですが、試行数30、成功確率0.3の二項分布を標準化して正規近似することによって、成功数がx回以下となる確率の近似値を求め、それを図示しろという問題なんですがよくわかりません。誰か教えてください。
>>908 x<- 0:30
plot(x,pbinom(x,30,0.3),type="l")
で二項分布の累積確率分布が書けます。
これに
lines(x,pnorm(z),col="red")
で正規分布の累積確率分布を重ね合わせます。
zについては考えてちょ。
910 :
132人目の素数さん :2005/07/30(土) 21:49:23
概収束と確率収束の違いの イメージを教えていただけないでしょうか。
911 :
GSX774R :2005/07/31(日) 01:56:51
>>909 なるほど下側確率の意味を考えるとそれはいいですね。参考にします。
912 :
909 :2005/07/31(日) 03:03:28
>>911 「成功数がx回以下となる確率の近似値」と言っているから
下側確率を求めています。
913 :
132人目の素数さん :2005/07/31(日) 11:05:25
すみません。Excelの近似曲線の選択方法について教えて下さい。 線形近似・対数近似・多項式近似・累乗近似・指数近似といろいろありますが、 どういった場合にどの近似曲線を選べばよいのか、よく分かりません。 とりあえず全部試してみて、R-2条値が最も良いものを選択すれば良いのでしょうか?
914 :
913 :2005/07/31(日) 11:17:45
横軸に入院日数を、縦軸に入院単価をとり、入院日数と入院単価の関係を グラフにしようとしています。 入院日数が長くなると入院基本料というものが下がるので、右肩下がりになる のは初めから分かっています。
>>910 おれっちは
概収束は、確率空間の零集合以外ですべて収束する
ようするに、確率空間について考えている物
確率収束は確率変数間の差の絶対値が0以外の確率となる確率が0
ようするに、確率変数について考えている物
とか理解しています〜
916 :
132人目の素数さん :2005/07/31(日) 13:59:58
新公認会計士試験を受けるものです。選択科目に新たに統計学が加わり、 数学のエキスパートの皆さんにお聞きしたいのですが、 初学者向きの統計の参考書について教えてください。 他の文系受験生と差をつけたいんです。 良かったらサンプル問題も見てください。
917 :
132人目の素数さん :2005/07/31(日) 18:00:36
600世帯を調べて、視聴率が10%である場合 全国の平均視聴率Pは信頼度95%で P=10%±1.96√(0.1*0.9)/600 となり 7.6%〜12.4%と推定されるわけですが(ビデオリサーチ社より) 各目が1/6であるサイコロを600回振った場合 1の目が出る回数m’は信頼度95%で m’=100±1.96√(600*1/6*5/6) となり 78.5回〜121.5回という推定で合っていますか? (1/7.64〜1/4.93 母平均=1/6.00) これ、結局 標本平均から母平均を推定する場合も 母平均から標本平均を推定する場合も 同じ式を使うということなんでしょうか?
918 :
132人目の素数さん :2005/07/31(日) 18:08:07
サイコロを振ったときの分布は二項分布に従う(1の目が出るor出ない) その二項分布の分散σは√n*P*(1-P) σ=√600*1/6*5/6 = 11.0(回) 正規分布に近似することにより、平均回数m’は m’=100回±1.96σ そんな安直に正規分布に近似していいのだろうか・・・ 他にもt分布とかF分布とかあるけどよく分からないし
919 :
913 :2005/07/31(日) 18:19:25
最初のうちは単価が大幅に減り、その後は緩やかに減少することが予想されるのですが、 対数近似でよろしいでしょうか?
920 :
913 :2005/07/31(日) 18:29:14
また、入院日数の値ひとつに対して入院単価の値が複数存在します。 入院日数が20日の時の入院単価のデータが複数ある、といった具合です。
922 :
913 :2005/07/31(日) 18:55:35
関数を使った方がいいんでしょうか?
「日本の男性は平均171cm、分散8cmの正規分布に従い 日本の女性は平均160cm、分散6cmの正規分布に従うとします。 このとき男性、女性おのおの一人ずつを任意に選んだとき 男性のほうが大きい確率を求めよ。」 という問題について質問します。 ぼくなりの解法は以下の通りです。 男性の分布の式をf(x)、女性の分布の式をg(x)とする。 男性を任意に一人選んだときその人の身長がtcmである確率は f(t) * △t。 また選んだ女性の身長がtcmを超えている確率は ∫(tから∞まで)g(x) dx。 これをtについて-∞から+∞まで積分すれば求めたい確率が出る。 よって答えは 「∫(-∞から+∞まで) f(x)*{∫(tから+∞まで)g(x)dx} dt」 となる。 でもこれだと手計算だと出来ないですよね。 (∵fやgの不定積分が出来ない。) このあたり何か簡潔な計算の方法ってあるのですか? そしてもうひとつ。 このような問題について解説の載っているサイとって無いですか? ちょっと込み入っていますがよろしくお願いします。
924 :
132人目の素数さん :2005/07/31(日) 22:43:36
>>913 ちゃんとやるならモデル選択の勉強が必要。でも、そもそも何をしたいのか・・・
減少傾向を示したいだけなら直線あてはめで十分と思われ。
最初のうちは入院単価が急激に減少して途中から減少がゆるやかになる、という曲線傾向を示したい
のなら、二次関数とか指数関数なんかをあてはめてみては?
>>917 ,
>>918 は同一人物?
>そんな安直に正規分布に近似していいのだろうか・・・
n=600、p(true)=1/6なら、カナーリ正規分布に近似と思われ。
>>924 単に(男子-女子)の分布を求めて、0にかかっているか検定するだけちゃう?
正規分布の結合法則は知っているよな?
925 :
924 :2005/07/31(日) 22:45:08
>>924 それは問題なかろ・・・といってもグラフを見ないとわからんが。
926 :
925 :2005/07/31(日) 22:49:23
927 :
913 :2005/07/31(日) 23:31:15
急性期の病床の入院基本料(病院にとっては収益)が段階的に引き下げられる のに対して、亜急性期病床の入院基本料は一定です。 亜急性期の入院基本料の方が高いのですが、急性期の病床では診療にかかった 費用として請求できるものでも 亜急性期の病床では入院基本料に含まれていて請求できないものがかなりある ため、入院初期は急性期の病床の方が収益が高くなります。 私が知りたいのは、急性期の病床の収益が亜急性期の病床の収益を下回るのは 何日目あたりか、ということです。
928 :
913 :2005/08/01(月) 00:01:34
経験曲線ってありますよね? あんな感じになると思うのですが・・・。
929 :
923 :2005/08/01(月) 00:06:32
>>924 二つの「山」の重なっている部分が答えと言うことでいいのですね
そういわれればそうです
どうもありがとうございました
(「正規分布の結合法則」についてはよく分かっていません
ググって見てもイマイチよく分からないので
明日あたり図書館に行って調べてきます)
930 :
924 :2005/08/01(月) 00:21:30
>>905 普通の標本理論では無限母集団を仮定しているから、
1回目と2回目は同じ母集団に従うとみなす。有限母集団を
仮定する場合もあるけど、その場合はもちろん貴方のいうとおり。
>>928 うー。よくわからんですけど、その分野(経済学?)でよく使われている曲線であてはめるのが
いいんじゃないでしょうか。これは統計学が答えられる問題じゃないように思います。
931 :
913 :2005/08/01(月) 00:55:47
>>924 そうしてみます。
私には難しい問題ですが、頑張って答えを出してみます。
親切にありがとうございました。
932 :
132人目の素数さん :2005/08/01(月) 01:50:09
600世帯を調べて、視聴率が10%である場合 全国の平均視聴率Pは信頼度95%で P=10%±1.96√(0.1*0.9)/600 と思っていましたが 標本から母分散を推定する場合は 標本分散ではなく普遍分散を使って P=10%±1.96√(0.1*0.9)/(600-1) なんじゃないですか? ビデオリサーチ社が間違ってるのか、私が間違ってるのか もしくは、599≒600と近似してるのか、どれでしょうか?
933 :
132人目の素数さん :2005/08/01(月) 02:02:20
>>915 言葉をヒントに考えてみます。
ついでに、分布収束、covergence in mean, convergence in mean square
のイメージも教えていただけないでしょうか。
934 :
924 :2005/08/01(月) 13:36:15
>>929 結合法則、という言葉が悪かったかも。スマソ
X 〜 N(171,8)
Y 〜 N(160,6)
のとき
X-Y 〜 N( ?, ?)
はどうなるか、ということ。かなり基本。
935 :
923 :2005/08/01(月) 15:48:59
>>934 あ〜なるほど〜
X-YはN(171-160,8+6)なのでN(11,14)ですよね。
これが0よりも小さい部分は正規分布の表によると22%です。
よって女性の方が高い確率は22%というわけですね。
結合法則ではなく「再生性」と教わっていたので混乱してしまいました。
あらためてありがとうございました。
936 :
923 :2005/08/01(月) 15:51:46
改めて
>>924 をみ直してみると「(男子-女子)の分布」を
「男子マイナス女子の分布」ではなく「男子ハイフン女子の分布」読み違えていたので
男子の物と女子の物とを別々に作る物と勘違いしていました
937 :
132人目の素数さん :2005/08/01(月) 20:52:01
自己解決しました。誰も答えてくれないので・・・ 600世帯の視聴率を調べて、標本平均が10%である場合 標本分散sは 600*10%*90% 不偏分散μは 600*10%*90% * 600/599 標本の不偏分散は母分散の不偏推定値であるので 母分散σ=不偏分散μ となる 全国の平均視聴率Pは自由度599のt分布に従うので P=10%±t√(10%*90%)/599 となる 自由度599の場合、ほとんど正規分布と等しいと近似できるので t分布表より信頼度95%のとき、t=1.96 となり P=10%±1.96√(10%*90%)/599 が導かれる
>>933 分布収束はそのまんまですよ〜
分布が一致しているという事です。
covergence in mean, convergence in mean square
英語苦手・・・所詮高卒が背伸びしているので、間違ってたらすんません
辞書引いてみたら、平均とか収束とか書いてあるのできっとそれに違いないという所でk乗ノルム収束って事にしときます。
これは幾何的に考えたほうが分りやすいかも。
確率変数の実現値の無限次元ベクトル、なんとなくわかりにくいので 2 個とりだして 2 次元として
{ Y(ω1) , Y(ω2) }
てな物を作って確率変数 Xi が、これに収束するところを考えればいいのだから、とどのつまり k 乗平均収束は
0 = lim( i→∞ )( | Xi(ω1) - Y(ω1) |^k + | Xi(ω2) - Y(ω1) |^k )^(1/k)
二乗の場合は
lim( i→∞ )√( | Xi(ω1) - Y(ω1) |^2 + | Xi(ω2) - Y(ω1) |^2 )
ようするにユーグリッド距離です、地点A から 地点B までの普通の距離です、「確率変数の列」と「収束先の確率変数」の距離の何乗かが0に収束しますという事です。
これがそのまま無限次元までどかーんと伸びる訳です。
注意しないといけないのは、無限次元まで増えると、有限個程度なら一致していない確率変数があっても一致しているという事になってしまいます。
>>938 ω間違い、
0 = lim( i→∞ )( | Xi(ω1) - Y(ω1) |^k + | Xi(ω2) - Y(ω2) |^k )^(1/k)
lim( i→∞ )√( | Xi(ω1) - Y(ω1) |^2 + | Xi(ω2) - Y(ω2) |^2 )
でした
>>938 {X_n}:確率変数の列
{X_n}が分布関数Fに収束するとは
Fの連続点xに対して
lim(n→∞)P{X_n<=x}=P{X<=x}
が成立することです。
(不連続点は収束しなくてもいい)
二乗収束は
E(X_n-X)^2→0 as n→∞
です。
P. Billingsley
Convergence in Probability Measure
とか、読むといいよ。
>>940 あっどもです、平均収束の定義は違ってたんだ・・・
参考になりました。
>>940 すみません、ちょっとだけ確認させてもらってもいいですか?
E(X_n-X)^2→0 as n→∞
は
E( (X_n-X)^2 )
それとも
( E(X_n-X) )^2
どっちでしょうか?
943 :
:2005/08/01(月) 23:09:17
E( (X_n-X)^2 ) の方。
>>932 もう見ていないかもしれんが・・・
(n-1)にする必要はないでしょう?なぜ(n-1)にするのですか?
二項分布の正規近似に関しては「ラプラスの定理」でぐぐってみれ。
小針[isbn:4000051571]の5章には証明がある。厳密な証明は意外と複雑。
945 :
132人目の素数さん :2005/08/02(火) 01:44:57
>>945 つ www.kwansei.ac.jp/hs/z90010/sugakuc/toukei/nikou/nikou.htm
すみません。どなたか教えてください。 サンプルを抽出する際に、母集団の大きさがどれだけであれ、25個抽出すれば 90%以上の信頼性(母集団を代表する点で)を得られると聞いたのですが、これは 統計学の世界ででそう言えるのでしょうか?? どこを勉強すればよいか教えて いただければ、それを目標に統計学の勉強をしたいです。
948 :
132人目の素数さん :2005/08/03(水) 02:02:05
t分布の自由度の意味を取り違えてました。 600世帯をサンプリングしたなら標本数n=600というだけで 自由度は1 東京で600世帯、大阪で600世帯、名古屋で600世帯を調査したなら 自由度は3 そういうことですね?
ケッケッケ、演繹的に行こうぜ
>>947 普通に統計学入門をやればゴールはそういうのを考える内容になってるよ、いわゆる推定・検定って奴です。
ちなみに、その問題は母集団の分布次第です。
例えば、宝くじの様な物を考えて、当たりくじ一本、ただし、とてつもなく大きい賞金で平均が0よりかなり上になるような分布を考えると・・・・
この場合25本程度では何も推定できなかったりしたりします。
951 :
132人目の素数さん :2005/08/03(水) 15:14:30
test
952 :
132人目の素数さん :2005/08/03(水) 15:16:25
数量化1類というのは英語の論文でもよく使われてるのでしょうか? 使う場合、どういう英語名になるんでしょうか?
>>950 丁寧な回答ありがとうございました。安心して入門書を買って勉強できます。
母集団の分布次第というご指摘も念頭において進めますね。重ね重ねありがとう
ございました。
>>947 平均値のことですか?
中心極限定理のとこかな。
>>948 二項分布の母比率の推定・検定にt分布は使いません。
だから自由度を考える必要もありません。
>>952 数量化○類というのは日本ローカルな分け方だったような・・・
ちょっとくどいけど「独立変数が全部ダミー変数な重回帰」といえば確実かも。
統計を使うのではなくて 統計を作る方で最新の理論が公表されているサイトをお教え下さいな
956 :
132人目の素数さん :2005/08/04(木) 01:16:39
やっと謎が解けました 結論:ビデオリサーチ社は間違っている あらかじめ全国の全世帯を調査して母比率Pが10%と分かっている状況で そこから600世帯の標本を取り出したのなら、標本平均P’は信頼度95%で P’⊆10%±1.96√10%*90%/600 以内の数値になることが期待できるが 母比率も母分散も何も分からない状況で600世帯の標本を取り出し 標本平均P’が10%になったからといって、母比率Pの取りうる範囲を P⊆10%±1.96√10%*90%/600 と推定することはできない そもそも 標本平均から母平均を推定する式 と 母平均から標本平均を推定する式 が同じになるはずがない
>>955 統計は場当たりだよ、一にも二にも現場主義
実験、医療、相場、保険と現場で使われている最新の論文とって来い
もしくは自分で作る
スチューデントtもビール工場発ですね
959 :
132人目の素数さん :2005/08/04(木) 05:50:31
2変量正規分布の持つ共分散はどういった意味があるのでしょう? 1変量の場合はイメージできたのですが、2変量になってイメージができなくなりました。 どなたか、御教授願います。
960 :
:2005/08/04(木) 06:38:01
>>959 二変量に限らず、多変量での共分散は、二つの確率変数(X、Y)がどちらの方向(+、ー)に線形関係(Y=aX+b) を持っているかを数値化したものです。
二つの確率変数に線形関係がなければ、共分散は0。+の線形関係だと、
共分散は正、ーの線形関係だと、共分散は負となります。
ただ、共分散の数値から線形関係がどれだけ強いかということは判断できませんが、その場合、相関係数で線形関係の強弱はわかります。
イメージとしては、X(たとえば、体重)とY(身長)をグラフにするとき、
平均体重を上回る人が同じく平均身長を上回る傾向が強ければ、グラフは右肩上がりになり、共分散は正になります。
もう一つ、二つの確率変数が独立の場合、共分散は常に0。しかし、
XとYとの間に相関関係(線形関係)がなくても必ずしもXとYが独立であるとは
言えません (例外:正規分布)。
961 :
132人目の素数さん :2005/08/05(金) 09:50:04
全くの初心者です。 問.2群における製造量の差を検定する場合、帰無仮説H0と対立仮説H1の組み合わせに関して 正しいものはどれか。 a.H0:群間に差がない、H1:群間に差がある b.H0:群間に差がある、H1:群間に差がない c.どちらでもよい 「無に帰したい」方を帰無仮説にするわけですよね? ただ単に差の有無を見たいときってどっちをH0にしてもいいんですか?
aかな… bだったら棄却域の定め方がわからんのですが…
>>961 aだよ。
「H0が正しいときにH0を正しくないと判断する確率」
を小さい値(1%とか5%とか)に固定して(これを有意水準という)、
「H0が正しくないときにH0を正しいと判断する確率」
をなるべく小さくする、というのが検定のスタンス。
前者は固定した値にするから、値が計算できなきゃいけない。
群間の差の値によって確率は変わるわけだから、H1のように群間の差が固定されていない仮説は帰無仮説にはできないんだね。
H0:群間に差がない、H1:群間の差が1である
なんて場合はどちらを帰無仮説にしても検定はできる。少し性質は異なってくるけどね。
964 :
961 :2005/08/05(金) 19:52:01
965 :
132人目の素数さん :2005/08/06(土) 01:55:24
二項分布からの近似に必要な条件をシミュレートしてみました 二項分布→ポアソン分布 条件:Pが十分に小さいこと、1/30以下 二項分布→正規分布 条件:N*Pがある程度大きいこと、30以上 大体合っていますか?
小針本には「(二項分布を正規分布に)近似するときのメドは、普通’Np≧5, N(1-p)≧5’ぐらいであると いわれている・・・しかし’Np≧4, N(1-p)≧4’でよいという人もいる・・・」 と書かれています。 しかし上の記述は手計算を楽にする意味で書かれたもので、パソコンが普及した今では 近似せずに直接計算しても大した手間はかからないですね。
967 :
132人目の素数さん :2005/08/06(土) 12:44:14
ポアソン分布は自然対数eの定義からも Pが十分小さくないと近似できないことは想像できます。 正規分布はNP≧5ということは 大体、確率分母の5倍以上のサンプル数が必要ということですね。 これは中心極限定理で証明するんでしょうか?
>>967 「大体、確率分母の5倍以上のサンプル数が必要ということですね。」
どういう意味か分かりません。
二項分布を直接展開して、Stirlingの公式を使えば、
正規分布との近似が評価できます。
中心極限定理とか言うと、Berry-Esseenの定理とか
使って、証明するのでしょうが、こちらの方が精度
悪そうですね。単に、直感ですが。
969 :
132人目の素数さん :2005/08/06(土) 14:17:33
偏回帰係数の標準偏差について ・何を表すか ・どんな性質があるか 数学苦手なのでよくわかりません・・・ 模範解答としてはどのようなものが考えられますか?
970 :
132人目の素数さん :2005/08/06(土) 19:00:47
>>960 >XとYとの間に相関関係(線形関係)がなくても必ずしもXとYが独立であるとは
>言えません....
独立と言えないって、どういう時なんですか。XとYに関係無し==必ず独立では?
971 :
132人目の素数さん :2005/08/06(土) 19:19:18
>>935 >正規分布の..結合法則ではなく「再生性」と教わっていた....
俺は、加成性と習ったが。教科書によって、用語が違うのか?
972 :
969 :2005/08/06(土) 20:27:00
問題の全文は 最小二乗法によって求められる偏回帰係数の標準偏差が何を表し、どのような性質をもつのか。 また、自室的な多重共線関係の意味を偏回帰係数の標準偏差と関係付けて説明しなさい。 です。
三百日。
974 :
:2005/08/08(月) 08:27:10
>>970 XとYに何も関係がなければ、独立。 XとYに相関関係がない(共分散=0)は必ずしも独立ではない、と言う事です。 相関関係は単に線形関係のみです。
976 :
? :2005/08/08(月) 15:06:14
他所に誤爆をしてしまってこちらの板を教えていただきました。 両板またがってお読みの方にはお目汚し申し訳ありませんが、どなたかお力拝借させて いただければと思います。 実験を二回繰り返して平均を取り、グラフにしたところ、ボスにエラーバーもつけなさいと いわれました。n=2でエラーバーをつけるには、どうしたらよいのでしょうか? nの数はもう増やせませんし、ボスには今日中にやってねといわれ、途方に暮れております。
>>976 独立な観測でn個のサンプル X[1], X[2],…,X[n] が得られた場合、分散は
{(X[1]^2 + X[2]^2 + … + X[n]^2)/(n-1)} - {(X[1] + X[2] + … + X[n])^2/(n(n-1))}
で推定できる
標準偏差の推定値は上の平方根を取ればよい
978 :
? :2005/08/08(月) 20:06:29
>977 おお、どうもありがとうございました。
979 :
132人目の素数さん :2005/08/10(水) 10:48:43
基本的な問題だと思いますが、よろしくお願いします…正誤問題です 1.標準正規分布をする確率変数が1.96を超える確率は0.05より小さい 2.カイ2乗分布は、比率の標本分布として用いられれることが多い 3.母平均がμの95%信頼区間とは、確率変数であるμが、その区間に含まれる確率が 0.95である区間のことである 4.内閣支持率が60%±5%と出た。これは母比率がほぼ55%から65%の間にあることを示している
>>979 1.○
2.×?(「比率」の意味するところがあいまいだから悪問だけど、普通は×と思う)
3.×
4.○?(「60%±5%」がサンプルから得られた信頼区間を意味する表現であるなら○)
ある複数の変数が多変量正規分布に従っているかを検定したいのですが どうすればよいのでしょうか?
982 :
979 :2005/08/10(水) 19:01:32
>>980 ありがとうございます。
おかげさまで助かりました。
三百三日。
「どれも悪問ですね」と先生に言ってやんなさい。 1 1.96を(正の方向に)越える確率は0.05/2で0.025。しかし、0.025は0.05より小さいので、これは○ということになる。ダブルのひっかけ問題ですね。 2は二項分布のことだろうか? 3 文意が不明確 4 解なし ±の表現はいろいろな意味で用いられる。内閣支持率の表記方法の慣例を問う問題ならアリだと思うが。
985 :
979 :2005/08/10(水) 23:50:12
>>984 ありがとうございます。どれも悪問なんですね…
986 :
132人目の素数さん :2005/08/11(木) 10:46:05
分からないので分かる方どうかお願いします! 期待値μ>0の指数分布に従う確率変数Xを考える。分布関数はF(x)=1-exp(-x/μ),x>0である。信頼係数を0<β<1として、(0,ax)という形のμの信頼区間を求めよ。 Pr{μ∈(0,aX)}=βを満たす実数aをβを使って表せばよい
987 :
132人目の素数さん :2005/08/11(木) 11:55:54
確率論は詳しくないですが一応解答します。信頼区間とか知りませんが 問題文の誘導にのって μ∈(0,aX) ⇔ μ/a < X …(1) よって(1)の確率は 1 - F(μ/a) = exp(-1/a) ゆえに exp(-1/a) = b より a= -1/log(b) 違ってたらごめんなさい。
988 :
132人目の素数さん :2005/08/11(木) 11:56:44
989 :
132人目の素数さん :2005/08/11(木) 17:08:54
>>988 ありがとうございました!助かりました!
990 :
132人目の素数さん :2005/08/11(木) 18:43:42
統計を勉強中なのですが、わかりません。 できれば計算式もお願いします。 A校の男子生徒と女子生徒の身長は、男子の平均は170cm、標準偏差は10cm。 女子の平均は156cm、標準偏差は9.8cmである。 A校から男子生徒と女子生徒を1人ランダムに選んだとき、選ばれた男子生徒の身長が 女子生徒との身長より高い確率はいくらか。 なお、身長はそれぞれ正規分布をし、以下のPrで示した標準正規分布の下側確率を参考にせよ。 Pr(Z<0.7)=0.76,Pr(Z<1.0)=0.84,Pr(Z<1.3)=0.90,Pr(Z<1.4)=0.92
三百四日。
993。
誰か次立てて
995 :
:2005/08/13(土) 00:46:21
誰か、お願い、、、
ume
997
998 :
132人目の素数さん :2005/08/13(土) 10:34:36
999 :
132人目の素数さん :2005/08/13(土) 10:37:01
わーーー
1000 :
132人目の素数さん :2005/08/13(土) 10:42:50
1000get
1001 :
1001 :
Over 1000 Thread このスレッドは1000を超えました。 もう書けないので、新しいスレッドを立ててくださいです。。。