1 :
132人目の素数さん :
2008/05/26(月) 16:26:10
2 :
132人目の素数さん :2008/05/26(月) 16:28:45
観測データの平均周りの4次モーメントを、期待値周りの4次モーメントを用いて表したいんですけど どのように考えればよいでしょぅか?
5 :
132人目の素数さん :2008/05/28(水) 11:54:03
そもそも、そうする理由書いたほうが良いんじゃないか アプローチ自体が間違っているかもしれないだろ
6 :
132人目の素数さん :2008/05/28(水) 15:59:24
まずは方法そのものだけでも答えてあげたほうが 知ってる風には見えるな
平均値を期待値で表すのと同じように考えたらいい
8 :
132人目の素数さん :2008/05/29(木) 00:14:50
つか分布のモーメントを標本モーメントで推定するのは当たり前すぎ。
だから
>>4 の質問の意味がわからんし、そういうわけわからんヤシに
技術的なことを聞いてもムダだから、
>>5 は何やろうとしてるのか書けと
言ったんだろ?
普通平均値と期待値は同義ですが。
サイコロの出目の期待値は3.5 確認のため10000回振った平均値は3.625だった
11 :
132人目の素数さん :2008/05/29(木) 01:13:04
>>10 かなり有意差あるぞ。そのサイコロは歪んでる
正の相関について聞きたいんだけど 身長と体重は正の相関があると分かるんだが、年齢と身長には正の相関があると考えてもいいんだろうか? 年齢って使えるんかな?
14 :
132人目の素数さん :2008/05/29(木) 23:29:25
例えば、ランダムに200人に同じ質問をして、全員が『イエス』と答えた場合、統計学的に信憑性はどれくらいありますか?
15 :
132人目の素数さん :2008/05/29(木) 23:33:44
>>14 真実(本来の対象全員のYes割合)は何と仮定した時の信憑性?
16 :
132人目の素数さん :2008/05/30(金) 00:05:09
>>14 精度はこんな感じ。
y: 母集団のYESの人の割合
P{200|200}: 200人中200人がYESと答える確率
y P{200|200}
98.9% 10%
98.5% 5%
97.7% 1%
17 :
132人目の素数さん :2008/05/30(金) 00:21:32
怒らないでマジレスして欲しいんだけど、 なんでこんな時間に書き込みできるわけ? 普通の人なら寝てるはずなんだけど
18 :
132人目の素数さん :2008/05/30(金) 11:30:42
19 :
132人目の素数さん :2008/05/30(金) 15:14:01
>>17 まだ、30分くらい起きているので、
泥棒にはいるなら、その後のほうがいいよ
って答えて欲しいのかな?
>>17 昼夜逆転してる人が多いんじゃない。学生や院生なら珍しくはない。
どこの板でも見かけるコピペ
22 :
132人目の素数さん :2008/05/30(金) 16:09:01
23 :
132人目の素数さん :2008/05/30(金) 19:25:14
バカなので、色んな本よんでみたのですがわかりません いちお過去ログも検索したのですが出てきません 抄録の締め切りが迫ってきているのでお願いします!! 使っているソフトはSPSSとStatView5です 1.100人を対象として、ストレスを測る100点満点のテストをしました。 また、診断基準に基づいて、ある病気であるかないかを判定しました。 病気あり・なし群に分けて、テストの点数に有意差が出るところまでは 自力でたどり着きました。 さらに、このテストを用いる事で、ある病気であるかないかを判定する ためのカットオフ値を出したいのですが(X点±Y点みたいなやつ)、 どのような手順をとればよいのでしょうか? 2.ある病気の集団100名に100点満点のテストをし、平均値と標準偏差を 出しました。このテストは健常者ですでに統計がとられており、 個々のデータはわからず、母集団の数もわかりませんが、 平均値は60±10点でした。 ある病気の集団と、健常者との間の値に有意差があるかどうかを 調べるにはどのような手順を踏めばよいのでしょうか? 日本語がだめで申し訳ありません お願いします!お願いします!
24 :
132人目の素数さん :2008/05/30(金) 20:56:46
>>23 2の方だが、健常者の方の分散は分からないの?分かれば平均値の差の検定が使えるんじゃないかな。
25 :
132人目の素数さん :2008/05/30(金) 21:06:24
カイ2乗分布ってのがよく分からないんですが 簡単に言うとどういうものなんでしょうか
>>23 同業者っぽい。6/5までまだ数日あるよ。
1の方は、判別分析でいいんじゃね。SPSS/StatViewは使わないので具体的には
助言できない。2の方は、平均の差の検定ではなくて、平均の検定ね。
「母平均の検定」でぐぐったら青木先生のサイトに当たると思うよ。
27 :
26 :2008/05/30(金) 22:14:35
>>23 2の方を読み間違ったみたいだ。すまん。60点は全国平均とか母平均とよべるもの
かと思ったけど、健常者のテストって限られたコントロール群で測られたもの?
そうだったら、平均の差の検定だな。
>>24 の言うとおり。
28 :
sage :2008/05/30(金) 22:17:49
ありがとうございます泣く>頭脳集団さん さっそくやってみます! 首尾よくできたらまた報告させて頂ければ幸甚です
>>25 確率変数が標準正規分布の2乗の和で表せるような分布。
30 :
132人目の素数さん :2008/06/01(日) 15:18:27
>>30 しかし、退場者というのは独立してなくて、1回に2人とか3人とかあるんじゃないかな。
1試合は同じ審判が担当するし。
ちょっとよく検討して分析しないといけないように思う。
(自分もちらっと読んだだけなんでどうすればいいかアイディアはないけど)
32 :
132人目の素数さん :2008/06/01(日) 18:03:23
>>31 「独立な一様分布」つー偶然性仮説が統計的に否定されたわけだから、
じゃあ「どんなパターンになってるのか」を調べることで、原因の解明に進めるわけ。
カード乱発して試合を壊す悪名高い審判員
またはラフプレ―の多いチームの試合ローテーションと、
チーム対戦の組合せローテーションとが、お役所的に固定化されてないか?とか、
異常チームの順位(優勝orJ1脱落)の変動と、出場停止発生率の変動に相関が無いか?とか・・・
そうでないと制度運用面の怠慢なのか、意図的不正なのかが区別できないからさ。
ファアな対戦スポーツとして、不適切な結果が生じていることに、何も変わりはないけどね、、、
33 :
132人目の素数さん :2008/06/01(日) 19:16:13
残り物に福があるって本当? 例えば10枚カードがあったとする。10人が順番にカードをひいて、特定の一枚をひいたら勝ちの場合と負けの場合、それぞれ何番目にひくのが最も有利なんでしょうか? 中卒の俺にも解るように教えて天才。
>>33 10人が順番にカードを引くが、結果は見ずにおき、10人いっせいに結果を
見る、と考えると、何番目に引いても同じであることが納得できるはず。
>>34 ありがとうございますm(__)m
凄くわかりやすいです。結局10分の1なんですね!
36 :
132人目の素数さん :2008/06/01(日) 20:01:56
>>33 引いてく途中では確率が変化するように見えるから、それを説明するね。
変化するのは条件付き確率であって、無条件な確率に換算してみれば同じ。
レッツ計算してみよう!
最初の人、当たる確率=1/10
最初の人が外した時の2番目の人
条件付き確率=1/9、条件の起きる確率=9/10、だから確率=(1/9)(9/10)=1/10
最初の2人が外した時の3番目の人
条件付き確率=1/8、条件の起きる確率=8/10、だから確率=(1/8)(8/10)=1/10
・・・
最初の9人が外した時の最後の人
条件付き確率=1、条件の起きる確率=1/10、だから確率=(1)(1/10)=1/10
天才でなくても、これぐらいは簡単に解けるお(^o^)。
>>36 ご丁寧にありがとうございますm(__)m
納得できました。
スッキリしました
(^^ゞ
38 :
132人目の素数さん :2008/06/01(日) 20:31:20
調べてもわからなかったので、ご教授願います。 Z-statistics(Z統計?)とはどのような統計なのでしょうか? すごく単順に教えていただけるとありがたいです。 よろしくおねがいします。
39 :
132人目の素数さん :2008/06/01(日) 21:26:03
ある1工程のばらつきを調べています。 熱処理後に出来上がった物の特性ばらつきが 2台の装置間でどのくらいあるかを知るための評価です。 装置Aで処理したデータ:50個 装置BでAと異なる条件で処理したデータ:3個 装置AとBでのばらつきを統計的に評価することは可能でしょうか? 可能であればどのような手法でデータ処理をすれば良いのでしょうか。 品質管理の本をみると「2つの母分散の違いの検定(両側)」 というのが使えそうな感じがしたのでエクセルでF検定をしてみたのですが、 その後どうしてよいか(この考え方でいいのかも)わかりませんでした。 統計についての知識は全くありません。 よろしくお願いします。
40 :
132人目の素数さん :2008/06/01(日) 22:51:41
>>38 使われてる話の内容がわからないことには、何ともねぇ
変数の標準化なのか、相関係数の変換なのか、それとも他の何かなのか・・・
>>39 装置Bのデータ3個は少ないね。有意差出ないかも。
統計学の入門書で検定を勉強してからでないと、ココで説明するのはムリ
ビジネス書のコーナーにけっこう入門書があるはず
42 :
39 :2008/06/01(日) 23:06:38
>>40 >>41 統計学の入門書を探して勉強してみます。
ありがとうございました。
質問なのですが「現在までの生徒の体重の平均が55kg標準偏差が10kgで 今年度の新入生から100人無作為抽出して計測した結果その平均が57kgだとした場合 今年度の新入生の体重は例年より重いといってよいか?」という問題について 重いといえるかいえないかはどういった基準で判断されるのでしょうか 中心極限定理を利用して解こうと試みたのですが知識不足でうまくいきませんでした よろしければどのように回答すればよいか教えてください
>>43 帰無仮説:「今年度の新入生の体重の平均μは例年と同じ」つまりμ=55
のもとで今年度の新入生のサンプル(標本の大きさn=100)の平均(標本平均)Xが
とる値の分布(平均μ、標準偏差55/√nの正規分布)を計算し、実際のデータ57が
その分布の右端5パーセントの範囲(棄却域)にあれば、帰無仮説は5パーセントの
危険率で棄却できる(つまり今年度の新入生の平均体重は例年より重いといえる)。
これが右片側検定。
ただし同じか重いかのどちらかであるという根拠がない場合は両側検定に変更すること。
また危険率は(指定が無いので)必要に応じて適当に設定変更すること。
また棄却域に入らなかった場合は「重いといえない」ではなく「重いとは限らない」と
言うこと。
45 :
44 :2008/06/02(月) 10:54:16
書き間違い訂正: 平均μ、標準偏差55/√n → 平均μ=55、標準偏差10/√n
46 :
23 :2008/06/04(水) 14:12:50
>>17 おまいの便利で快適な生活を支える24時間3交代制勤務の工場労働者や
コンビニや夜勤の病院などの存在を知らぬ阿呆だな。
一見会話が成立しているかのように見せかける荒らしかもね
50 :
132人目の素数さん :2008/06/10(火) 18:34:15
事後分布の漸近性についての証明を読んでいるのですが、sample spaceが 有限な個数の点で構成されている場合の証明は理解できましたが、 sample spaceが連続(compact)な場合の証明が良く解からないです。 何か良い説明はないでしょうか。
統計学1から勉強するにはこれがいいよっていう参考書教えてください
52 :
132人目の素数さん :2008/06/11(水) 16:05:46
有意水準99%の片側や両側検定。これって一体何がしたいのだろう?
53 :
132人目の素数さん :2008/06/11(水) 19:05:05
え〜っと。 これって何が聞きたいんだろ?
両側検定でμ=μ0であって欲しいとか 信頼度と逆になってるとかだろw
56 :
132人目の素数さん :2008/06/11(水) 20:24:03
誤用者を馬鹿にしてはいけません
>>56 違う。誤用じゃないんだから
>>52 は質問。
教わりたいならそれなりの態度で書けって事だ!
>>52 って質問だったのか。ひとりごちてるんだと思った。
何がしたいって…普通に母数の推定値が正しいか否か検定したいんじゃない
って思った。
60 :
132人目の素数さん :2008/06/11(水) 23:25:09
検定がわからないのは、その母数や独立性とかがわからないからだとおもうぞ データをコンピュータに掛けるのが統計学つーのが世間の認識ね 考古学で言えば遺跡や化石を発掘すればいつの時代の何かは自明と思ってるw
数量化T類と一般線型モデルって何が違うのですか?
62 :
132人目の素数さん :2008/06/12(木) 05:00:29
>>58 何か色々おかしなレスだな。
そんな理由じゃなく厭味だと認識してるんでしょ?
>>55 じゃそんな感じだし…。
ならムキにならず無視してるのが一番。
63 :
132人目の素数さん :2008/06/12(木) 09:37:26
まじめな質問だとすれば、もうちょっと聞きたいことを絞る必要があるね。 でも統計知らない人なら、自分で絞れないから、聞き出してあげる 必要がでてくるな。 この質問だと、検定ってしっているか?両側と片側の意味は分かっているか? 99%と出ているが、99%という質問に意味があるか(たまたま99%と何かに 書いてあったとか)? とかとか。。。。聞き出してから、内容に答えるということになるのかな。
64 :
132人目の素数さん :2008/06/12(木) 09:39:13
それとも、99%以上を求める分析(業務?)って なにがあるのって質問なのかな? どちらにしろ、その辺がわからないな〜
65 :
132人目の素数さん :2008/06/12(木) 19:27:03
66 :
132人目の素数さん :2008/06/12(木) 19:55:50
質問かどうかよりも「誤用じゃない」の方が気にかかりますね そのせいか話の流れを見てると 母数が一致してるかどうかを調べたい場合は 99%の検定もあり得る事のように見えるのですが これは誤用ですよね?
67 :
132人目の素数さん :2008/06/12(木) 21:13:23
>>66 99%も95%もどちらもよく検定で使うよ。
69 :
132人目の素数さん :2008/06/12(木) 22:08:48
無視しておこうかと思ったが我慢の限界だ。 有意水準99%で母平均の検定と区間推定を行う。 帰無仮説 H0:μ=μ0 対立仮説 H1:μ≠μ0 A・危険率1%での検定となる。 B・推定は99%信頼区間となる。 C・もし有意な差が認めなければμとμ0は等しいと判断できる。 D・μとμ0が等しい確率は99%である。 これは基礎中の基礎なので、しっかり頭に叩き込んで勉強をやり直しなさい。
71 :
132人目の素数さん :2008/06/12(木) 22:40:40
悪ノリし過ぎw でもこれは笑い事じゃないよね 本当に間違えて覚えている人も結構いると思う
>>69 これA〜Dまで全て間違いだけど、皆わかってるのかな?
本当は有意水準が99%なら危険率も99%。信頼区間は1%の推定になる。
危険率99%なのに「危険率5%が一般的だけど1%もよくあるよ」
と思いながらレスしてるような気がする。
>>67 >99%も95%もどちらもよく検定で使う・・・・
業界によって、違うのでは?信頼性工学分野では、99%は使わないな。
75 :
132人目の素数さん :2008/06/13(金) 14:38:15
有意水準を大きくする事がないのは検出力の問題があるからだよ
>>74 基本的な統計理論の話で。実際は勿論分野によって違うと思う。
それ厳密に「仮説検定」じゃないのでは?
78 :
132人目の素数さん :2008/06/13(金) 16:48:54
「aが1日に生産するbの成功率が99%以上ならaを採用しとく」とかいくらであるじゃん
統計がさっぱりわからない俺に教えてほしいのですが、 A-Dの人と戦うとして 名前/戦った回数/勝ち/負け/勝率/勝ち-負け A/12/9/3/75%/6 B/5/0/100%/5 C/7/4/64%/3 D/5/2/61%/3 こんな感じの結果が出たとします。 勝ち-負けの回数はAが6と一番多いですがBは勝ち-負けが5と一回少ないですが勝率が100%です。 この様な結果が20人分とかあるとして、誰が対戦相手になったらうれしいのでしょうか? 質問の意味が分かりにくかったらすいません。 ちなみに戦った回数は多くとも25回くらいです。
>誰が対戦相手になったらうれしいのでしょうか? うれしと思うのが分析者本人じゃなく戦う側の事だったら アンケートを採ってうれしいと思った原因は何か探る必要があるでしょう。
嬉しさの基準として、カモポイントというものを考えました。 カモポイントが高ければ相手にしたときにうれしいということにします。 で、このカモポイントですが、 1.単純に(勝ち-負け) 2.勝率を反映させて(勝ち-負け)×勝率 3.試合数も反映させて(勝ち-負け)×勝率×試合数 これだと試合数が多いほど数が増えてなんか違う感じがした 4.(勝ち-負け)×勝率×試合数/10 見やすくはなったがあんまり意味がないことに気が付く 今ここ
自分の遺伝子が人生が滅亡するまで残り続けるためには、何人子供を設ければ十分ですか? 板違いだったら誘導してください;
83 :
z-test :2008/06/13(金) 19:35:13
韓国の 20歳 「統計学」専攻大学生です. 初心者です. ^^;; まだ統計学に対する専門的知識はないが.. 仮説検定位は可能ですw たびたび来て統計学に対する話しあいたいです. よろしくお願いいたします.
84 :
z-test :2008/06/13(金) 19:40:38
質問です. 「信頼区間の意味」に対して分かりたいです. もし, 信頼も 95% 信頼区間でモピョングギュンを区間推定ハルテエシンルェも 95%は何を意味しますか? モピョングギュンを含む確率が 95%という意味ですか? 正確にどんな意味なのか分かりたいです.
Googleで"信頼区間の意味"を検索した方が 分かりやすい解説が見つかると思うよ
>>79 単純に勝率だけ考えて勝率が低い相手なら嬉しいんじゃないの。ただ戦った回数が少ないと信頼度に欠ける。戦った回数が多ければ多いほど勝率の精度は増す。
87 :
132人目の素数さん :2008/06/13(金) 21:06:17
「口」という漢字が入っている名字は山口 浜口 田口 の3つしかない これ豆知識な
88 :
132人目の素数さん :2008/06/13(金) 21:09:46
A,B,C∈F(Fの上の線は波線です) AとBは独立 CとBは独立 CとAは独立 となる時 P(A∩B∩C)≠P(A)P(B)P(C)となる例を探せ。 これ、分かる方いらっしゃいますか??
89 :
132人目の素数さん :2008/06/13(金) 21:10:07
90 :
z-test :2008/06/13(金) 23:32:59
誰か知らせてくれ.. 池の魚を網で 12 匹を捕れば任意抽出だと言えますか?
91 :
132人目の素数さん :2008/06/14(土) 00:29:37
>>79 サッカーとか野球とかは、勝ち負け(+分け)以外に得失点など
他の情報によって「実力」を測ることができる。
だから得失点差とかの指標を考えたりする。
勝ち負けしか情報が無ければ、指標は勝率で補助情報として
試合数があれば十分
92 :
132人目の素数さん :2008/06/14(土) 00:36:00
>>90 大きいのばかり狙うとか、赤いのばかり狙うとかしたら「任意」じゃないよ。
日本の調査捕鯨みたいに、目視したあと乱数で捕獲するどうか決めるとか、
特定の対象を抽出しようとしてもできない、何らかの撹乱手順が最低限必要
94 :
132人目の素数さん :2008/06/14(土) 00:57:25
分からないの。 なんか、先生がレポートです。って言って、書かれたんだけど意味不明で。 確率論なんだけど。
95 :
132人目の素数さん :2008/06/14(土) 02:03:08
>>94 A,B,Cが互いに独立ならP(A∩B∩C)=P(A)P(B)P(C) は成り立つと
思いますが…。一般にA,B,C,D,…が互いに独立なら
P(A∩B∩C∩D…)=P(A)P(B)P(C)P(D)…
>>95 標準的な問題もあるけど、全体的にはハイレベルだと思う。
98 :
132人目の素数さん :2008/06/14(土) 04:27:03
>>96 合コンで、A, B, C、 3人の女の子とヤれるカードを9枚準備したw
「ABC全員と可」つー最強カードも作った!www
で、その9枚のカードの中身をコッソリ教えると、こうなってる。
1枚目「ABC!!!」
2枚目「ABC!!!」
3枚目「ABC!!!」
4枚目「AB !!」
5枚目「 BC!!」
6枚目「A C!!」
7枚目「A !」
8枚目「 B !」
9枚目「 C!」
が、急用ができちまって、当日行けなかったんだよ。
後日会った友達は、
「まあカード引いたんで仕方ないわ、Aとヤったよ〜」と言ってたが、
「で、Bとは?Bとは?」と聞いても、ニヤニヤ笑って答えない。
その情報じゃあ、本命Bとヤった確率は変わらんよなあ。
ではこの友達があとのBC両方とヤった確率はどうよ?w
99 :
132人目の素数さん :2008/06/14(土) 15:53:40
条件付確率の話なんですが x1,x2,x3∈X X={0,1}が条件、例えばx1x2x3=001などの記号列となるとします x1が起こる確率をp(x1)、x1x2が起こる確率をp(x1x2)としてpで表します このとき p(x1x2x3)=p(x3|x1x2)P(x1x2) =p(x3|x2)p(x2|x1)p(x1) となるそうなんですが、p(x3|x1x2)->p(x3|x2)になる理由が分かりません どなたか教えてもらえないでしょうか
100 :
132人目の素数さん :2008/06/14(土) 16:10:04
>>99 >p(x3|x1x2)->p(x3|x2)になる理由が分かりません
著者の勘違いまたは書き間違いまたはミスプリだから。
>>98 の例で A=x1, B=x2, C=x3 と置いて数値計算してみればわかるよ
101 :
132人目の素数さん :2008/06/14(土) 20:02:03
今まで検出力といえば, 「対立仮説が真の場合に帰無仮説を棄却する確率」 と考えていたんだが,竹村彰道の現代数理統計学によると, 仮説の真偽に関わらず「帰無仮説を棄却する確率」っぽい. 実際はどっちが正しい認識なんだろうか?
>>88 サイコロを二つ投げたとき
A = {一つ目が偶数}
B = {二つ目が偶数}
C = {合計が偶数}
104 :
132人目の素数さん :2008/06/14(土) 21:57:31
>>105 独立だよ。一つ目が偶数でも奇数でも、
合計の偶奇は二つ目の出目のみによるから。
直感的に理解できなければ計算すればいい。
108 :
132人目の素数さん :2008/06/15(日) 03:27:17
>>107 いや
>>96 の前半は間違ってるよ。
A, B, C 3つの事象が「互いに独立」と言うには、
ペアでの独立性に加えて
条件: P(A∩B∩C)=P(A)P(B)P(C) も成り立つ必要がある。
これは「定義」ね。
この条件は、ペアの独立性からは導けないから、その例が上がってるわけだ
不偏分散を求めるときにどうしてn-1で割るのかが直感的に理解できません。 どなたかうまい説明おねがいします><
111 :
132人目の素数さん :2008/06/15(日) 15:22:28
>>109 テクニカルな話から説明すると、不偏性を持たせるための
工夫を凝らしているだけ。
自由度の観点から解釈すると、
(\bar{x}-x_{1}) + (\bar{x}-x_{2}) + ...+(\bar{x}-x_{n})=0
という関係があるため、x_{1},...,.x_{n}の内、n-1個の値が決定され、
平均もわかっているとしたならば、残りの一つの値も自動的に決定される。
分散は、n-1個分の自由に動ける「情報量のようなもの」を持っているため、
それを平均するためn-1で割っている。
>>109 イメージ的にはn個のサンプルのうち(n-1)個が決まれば、残りの1個は必然的に決まることになるから、自由度が1失われていることになる。
113 :
132人目の素数さん :2008/06/15(日) 19:53:57
>>110 縦軸ラベルが入ってない「悪いグラフ」なので、なんともねえ。
まあ常識を働かせて推理すれば、累積相対度数だろうけどさ、、、
114 :
132人目の素数さん :2008/06/15(日) 20:45:22
>>109 もし「不偏」の方にこだわるなら、、、
母平均をμとすると、
Σ(Xi - μ)^2
の期待値は
E[ Σ(Xi - μ)^2 ] = Σ E[ (Xi - μ)^2 ] = n V[X]
一方、標本平均を Xbar とすると
Σ(Xi - μ)^2 = Σ(Xi - Xbar)^2 + n(Xbar - μ)^2
と表せて、
n V[X] = E[ Σ(Xi - μ)^2 ] = E[ Σ(Xi - Xbar)^2 ] + n E[ (Xbar - μ)^2 ]
= E[ Σ(Xi - Xbar)^2 ] + V[X]。
よって
E[ Σ(Xi - Xbar)^2 ] = ( n - 1 ) V[X]。
115 :
132人目の素数さん :2008/06/15(日) 20:49:18
>>110 それぞれの業態での
販売単価(お弁当単価)とその数量
あるいはそれぞれの金額の分布を
100%にしてみたグラフでしょう。
コンビニは500円位のお弁当が多い(集中)んだね
それが売れるというか、置いてあるとみたほうが
現実的にはいいのかな。無い物は買わないしね。
116 :
110 :2008/06/15(日) 21:46:07
よくわからない・・・。 縦軸が50%のときに価格が500円に集中していますがこれは何を意味しているのでしょうか。
>>116 縦軸が累積相対度数だとすれば、
売ってる弁当の中で500円以下の弁当が半分(50%)つーこと。
横軸はXX円以下の弁当、縦軸はそれが何%を占めるか
ということは一般小売店では600~1200円の間の値段の弁当が90%を占めるってことですか。
>>118 「X円からY円の間の弁当が占める割合」を知りたい時は、
Y円の縦軸値と、X円の縦軸値との、「差」を求める必要がある。
例えば、一般小売店だと、1200円以下が100%(?)、600円以下が約85%(?)、
なので100%−85%=15%ぐらいだね (?はグラフからは正確に読み取れないつー意味)
120 :
132人目の素数さん :2008/06/15(日) 22:36:34
以下のように定義される確率過程N(t)がパラメータλのPoisson過程であることを示せ。 D1... Dn i.i.d. Exp(λ) , Tn= D1+・・・+Dnについて N(t) = max{n;Tn <= t} ・・・という問題があるんですが、どう議論を進めればよいかわかりません。 主にmaxの取り扱いが不明です。どういうい風にしてN(t)を確率変数ととらえればよいのでしょうか。
>>119 おおなるほど。わかりやすい説明ありがとうございました。
122 :
132人目の素数さん :2008/06/15(日) 23:22:45
>>120 D1=1.5, D2=2.9, D3=2.4, … だと累和値は T1=1.5, T2=4.4, T3=6.8, …
なので、
N(2) = 「Tn が 2 を超えない最大の n」 = 1
N(5) = 「Tn が 5 を超えない最大の n」 = 2
とか N(t) は確率変数になる。
言葉で書いても良いのなら
「いつ初めて Tn が t を超えたかを N(t)+1 で表す」
の方がわかりやすいかも
123 :
120 :2008/06/15(日) 23:34:42
>122 レスありがとうございます。 すみません、舌足らずでしたね。そういうことはわかるんです。 Poisson過程であることをきちんと示さなくてはならないので、 たとえば独立増分がPoisson分布に従うことなどを示さなくてはならないんですよ。 TnとTn+1-Tn=Dn+1は独立で、Tn~Ga(λ,n)から F(Tn<t&Tn+1>t) = \int F(Tn=x<t & Dn+1 > t-x) dx などとすればよいのか、など考えていますが さすがに積分がしんどそうですし、独立増分については何にもいえないのでどうしたものかと・・・
124 :
132人目の素数さん :2008/06/15(日) 23:35:37
>>118 一般小売店では、600円以下で9割をしめる。
ただし、他の業態では扱っていない800円以上の
お弁当が5%程度の売上(数量?)をしめる。
これが累計金額ベースなら、800円以上の弁当は
扱わなくとも、収益への影響は少ないと見える。ただし
目玉商品になっている可能性もあるので、一概には
得ないけど。
グラフをみて気をつけなければいけないのは、
売れているというよりも、扱っていると見る必要がある(かもしれない)。
というのは、売りのこりが出ないようにお店は調整している(可能な
限り品切れも防ぎたいが)ということ。
ともかく、コンビニは有る価格帯(500円程度)に集中して商品を
投入していて、600円を超える物は扱っていないということのよう
ですね。
125 :
122 :2008/06/16(月) 00:09:12
126 :
120 :2008/06/16(月) 00:46:48
確認しました。なるほど、各待ち時間がExp従属であることから示していけばいいのですね。 助かりました。
127 :
132人目の素数さん :2008/06/17(火) 13:07:31
>>95 簡単ではないが、東大生ならそれなりに出来るはずの問題。
128 :
132人目の素数さん :2008/06/18(水) 00:45:04
平均、分散、歪度、尖度を所与として、 確率密度か累積確率のグラフを(Excelで)描きたいと考えています。 ネットで調べたところ「積率母関数を逆変換して・・・」という ことらしいのですが、手に負えず困っています。 どなたかヒント(もしくは答え)をいただけないでしょうか。
質問です。 標準偏差を求めたのですが、 標準偏差がいくつ以上なら有意にばらつきがあると考えることができるのか計算方法を教えてください。
>>129 有意というのは確率的な問題だから分布も何もなくてそういう判断ができることはないよな。
単に基準という意味ならデータの種類のよっては平均の10%とかいうことはあるけど。
最尤推定とベイズ推定について教えてください。 観測データがあったとして、 最尤推定は、その背後の分布を仮定してそれを尤度関数として、 観測データを入れたときの尤度を最大化するパラメータを推定する。 ベイズ推定は、観測データの背後の分布のパラメータも 分布を持つとして、その分布の事後確率を(なんとかして)求める。 的な、言葉尻ならなんとなくわかるんですが、 それをどう使うのか的なことがわかりません。 (っていうか、上の説明もざーっと書いただけなので間違ってるかも・・・) 何か良い具体例があれば教えてください。
132 :
132人目の素数さん :2008/06/19(木) 22:09:09
診断テストの正解率に統計的な有意差があるか調べたいんだけど、 検定にはどれを使えばいいですか?χ二乗? 2007年度1年生 (受験者850人) 第一問 80% 第二問 92% ・・・ 2008年度1年生 (受験者790人) 第一問 83% 第二問 85% ・・・ みたいなデータなんですが。
134 :
132人目の素数さん :2008/06/19(木) 23:53:58
135 :
132人目の素数さん :2008/06/20(金) 00:08:21
1000人受けたテストで平均点650点、標準偏差50 上位120位以内に入るには何点必要か?正規分布を基に答えなさいって問題で 650+50×1.18=709 だとわかったんですが標準偏差を足すのは何故か解説お願いします。
136 :
133 :2008/06/20(金) 00:23:31
>>135 ぢゃあ平均に何点か足すのに他の何を使うんだ?
牛丼の値段でも足してれば不思議に思うだろうけどw
>>135 手の込んだマルチだな
「650+50×1.18=709 だとわかった」って何がどうわかったのか言ってみな。
そもそも、「標準偏差」ってどういう意味をもつか(特に正規分布において)、わかってるか?
139 :
132人目の素数さん :2008/06/20(金) 00:42:53
>>135 さん
これは標準化の逆をしているだけでは?
z=(x-平均)/標準偏差
は標準正規分布に従い、
この88%点は1.1749...となります。
なので
x=(z*標準偏差)+平均
=1.1749*50+650
となるのではないでしょうか。
さてさて、私の質問です。
試験の成績をつけるときに
平均点や標準偏差、ついでに偏差値なんかも出すんですが、
こういった場合では
“この試験の受験者”を母集団として標準偏差を出すのか、
それとも“ある母集団からの標本”としてその標準偏差の推定量を求めるのか
どちらが妥当なのでしょうか。
140 :
132人目の素数さん :2008/06/20(金) 00:43:58
120位以内は表から1.18 ってのは分かったんですがそれに標準偏差をかけたら何がでるんですか?
141 :
132人目の素数さん :2008/06/20(金) 00:46:54
>>139 ありがとうございます!
なんとかわかりそうです
>>133 同一母集団におけるベルヌーイ試行のZ検定でもできるね。
143 :
132人目の素数さん :2008/06/20(金) 20:43:16
経済や経営の領域で回帰モデルになるものはないかな? できればモデル改良とかあればいいのだが・・・ 参考になるサイトが見つからないので
144 :
132人目の素数さん :2008/06/21(土) 03:19:19
教科書に 「危険率は仮説を捨てるときの条件で、 仮説を捨てないときは何の関係もない」 と書いてあったのですが、そもそも 仮説を捨てるかどうかは危険率に左右されるから 関係はあると思うのですが、何が間違ってるのでしょうか。
146 :
132人目の素数さん :2008/06/21(土) 15:40:44
>>145 著者が言いたかったのは、
『「仮説を(捨てるべきなのに)捨てない危険率」の方ぢゃないぞ』
ということだろうね。
それだって一方を減らせば他方は増えるから、関係はあるし、
要は親切心から出た不適切な表現だとおもう
147 :
145 :2008/06/21(土) 20:49:31
>>146 なるほど、もやもやが取れてスッキリしました。
ありがとうございます。
一般化モーメント法とは何でしょうか・・・? さっぱりわからんとです
149 :
132人目の素数さん :2008/06/23(月) 18:22:23
>>148 標本モーメントをポピュレーションモーメントに置き換えて、
パラメータについての連立方程式を解いたもの。
150 :
132人目の素数さん :2008/06/23(月) 18:49:01
共役事前分布って、何に使うのですか?
151 :
132人目の素数さん :2008/06/23(月) 19:47:41
近い将来確率・統計が必要になりそうなので勉強しようと思っているのですが、 やや程度が高く、良い演習書があれば教えて下さい(測度論は専門ではないので、用いていないものの方が好ましいです)
>151 何故に測度論が出てくる? 中途半端な知識を持った奴は性質が悪い。 金融関係か?
153 :
148 :2008/06/24(火) 01:58:39
>>149 なんとなくわかったような気がしますが・・
何かよいテキストとかありますでしょうか?
154 :
132人目の素数さん :2008/06/24(火) 11:33:40
>>153 イメージとして簡単に言えば母集団の平均、分散(モーメント)を標本平均、標本分散で置き換えて母数を推定すること。テキストは多分統計学の入門書ならたいてい載ってます。
156 :
132人目の素数さん :2008/06/24(火) 13:37:05
>>149 >>155 標本モーメントがポピュレーションモーメントに置き換えられる理由が抜けている。
157 :
132人目の素数さん :2008/06/24(火) 14:37:51
なんかここは 素人同士で言い合っても始まらないよ と素人がちょっかい出してみる
158 :
132人目の素数さん :2008/06/24(火) 14:38:29
↑誤爆 ごめん
正規分布 N(μ,σ^2) からの無作為標本 X_1,・・・.X_n に基づいて σ^2 の推定を考える。 μ は未知として、σ^2 の不偏推定量の分散に対するクラメール・ラオの下界を求めよ。 という問題なのですが、X_1 のもつσ^2 に関するフィッシャー情報量 I(X_1(σ^2)) を求めるところで詰まってしまいました。 解答では I(X_1(σ^2)) = 1/(2σ^4) となっているのですが、自分が計算すると、計算するたびに違う値が出てきてしまいます。 どなたか、途中の計算式をご教授いただけないでしょうか?
160 :
132人目の素数さん :2008/06/24(火) 19:30:15
共役事前分布って、何に使うのですか?
161 :
132人目の素数さん :2008/06/24(火) 21:02:39
0000〜9999までの4桁の数の内、1,2,3,4のいずれかを1個でも含む数は何通りありますか? 但し、並べ替えたとき同じになるものは1通りとする。 例)1234,1243,1324…4321は全部で24通りあるが、並べかえとき同じになるので1通りとする。 全く手がでません。 どなたか解る方、出来れば具体的に教えて下さい。 よろしくお願いします。
0001 0002 0003 0004 0011 0012 … … … 数えれば?
1から順番に数えて、3がつくか、3の倍数の数字はいくつありますか? 3のときにアホな顔になるっていうネタを思いついたんだけど、受けますかねえ
>>161 余事象考えればよい。それで分からないなら高校の教科書等に類題あるから順列の確認しる。
>>161 ん?よく見たら0000は4桁の数なのか…?
166 :
132人目の素数さん :2008/06/25(水) 02:45:19
167 :
132人目の素数さん :2008/06/25(水) 07:34:37
絶滅保護種じゃなかったけ
168 :
132人目の素数さん :2008/06/25(水) 07:35:55
絶滅を保護するんじゃなくて 絶滅危惧種だったな
169 :
132人目の素数さん :2008/06/25(水) 17:31:54
正規分布に従う確率変数X,Yがありともに分散は1、X、Yの平均値はそれぞれ-1、1である。 (1)X、Yが独立のときXYの平均値、分散を求めよ (2)X,Yが独立でZ=2X+7YのときZの確率密度関数p(z)を求めよ (3)XとYが独立でないときE(XY)=1/2のときX+Yの平均と分散をもとめよ (4)X+1のn次モーメントを求めよ。 解法がわからないのでどなたか教えていただけるとうれしいです.
ある尺度について,その妥当性(人によって評価が変わらないかどうか) を調べたいのですが,的確な方法があるとしたらなんでしょうか? その尺度は,サンプルそれぞれについて2因子5水準で評価します. 因子Xが1から5,因子Yが1から5まであって,それぞれどの水準に 当てはまるかを判断するわけです. 現在,この尺度で同一のデータ(サンプル80件くらい)を評価した 3人分のデータがあります.
171 :
132人目の素数さん :2008/06/25(水) 18:55:23
>>169 そんな標準テキスト的な問題の場合は、丸投げされると
「テキスト嫁!」しかレスのしようが無いじゃんw
ここで簡単に全部説明できるのなら、そもそもテキストなんか要らんわ
172 :
132人目の素数さん :2008/06/25(水) 19:10:33
>>170 回帰だったら3人プールしたデータを、
(1)3人の構造係数は別
(2)3人の構造係数は同じ
で推定した残差の2乗和使って尤度比検定やるけどね。
主成分とか因子分析でも、同じような手法があるんでないの?
173 :
132人目の素数さん :2008/06/25(水) 19:54:43
>>171 たしかに
特に(1)は、教科書のページにそのまま
書かれてるだろう
174 :
132人目の素数さん :2008/06/25(水) 21:21:05
この問題がどうしてもわかりません ご教授ください 問)05前期の「統計基礎」と07前期の「統計基礎」の授業に対する 講師の熱意は違うのか?平均値を出し、t検定をして、結果をだせ。 表)アンケート:授業を通して、講師の熱意が感じられるか? ←感じられる 5 4 3 2 1 05前 4 5 22 0 1 07前 10 14 8 0 0 解)05年度の講義の熱意 (M=ア(SD=イ)に比較して 07年度の講義の熱意 (M=ウ(SD=エ)は a.学生に高く認知されていた(t(オ)=カ,p<0.05) b.違いが無かった(t(オ)=カ,ns) アイウエオカとabどちらかということについて教えてください もしくはSPSSソフトでどのように分析をしたらいいのか教えてください。お願いします・・・
175 :
132人目の素数さん :2008/06/25(水) 21:50:05
実は05前期の生徒に学ぶ気がなかったりして
176 :
132人目の素数さん :2008/06/25(水) 22:21:57
どういうこと?
177 :
132人目の素数さん :2008/06/25(水) 22:56:23
サンプルそのものにロバスト性がないって ことでしょう 教師も、生徒も異なる 比べることの難しさってやつかな
178 :
132人目の素数さん :2008/06/25(水) 22:57:16
と勝手に理解してみたけど・・・・
179 :
132人目の素数さん :2008/06/26(木) 05:25:26
質問ノ 未成年の全人口に対する割合が2割5分だとすると、 未成年の犯罪率が3割7分だった場合、「未成年の犯罪率は高い」と言えるのでしょうか?
全犯罪の未成年率が3割7分では?
181 :
132人目の素数さん :2008/06/26(木) 07:27:52
「全犯罪に対する」未成年の犯罪率でした。失礼。
182 :
132人目の素数さん :2008/06/26(木) 12:40:22
>>179 なぜ質問してるのかが良くわからないんだが、まあ統計スレ的に答えると、、、
こういった問題の場合、標本が小さいと、標本抽出誤差で数字の信頼性が低くなる。
例えば 0.25 や 0.37 が各々24人を調べた結果だったら、「0.25 < 0.37 ?」は
統計的に検定してみる必要がある。
しかし数値が、普通使う政府統計ベースなら、その検定は不要。
なぜなら、人口の未成年割合はおそらく国勢調査ベースの数字を使うだろうから、
全数調査で標本抽出誤差は無い。
また犯罪者の未成年割合はおそらく司法統計ベースだろうから、これも全数調査で
標本抽出誤差は無い。
注意するのは同じ時期の統計を使うとか、飲酒・喫煙のように未成年特有の
非合法行為が犯罪の中で無視できない割合存在しないか?と言った中身のチェック
183 :
132人目の素数さん :2008/06/26(木) 12:53:51
検定の必要がないということでお願いします 大きいと言えるのでしょうか?
×各々24人を調べた結果だったら ○各々60人を調べた結果だったら
185 :
132人目の素数さん :2008/06/26(木) 13:19:37
>>183 何ベースのどんなデータで、質問者がその数値にどんな疑問を懐いているのか
を言わないと、この板の連中は慎重だから答えないよ。
つかそれを説明しても曖昧なことには答えないだろうから、この板向きじゃないような
ノルウェーに関するデータをILOかなんかが出したんですよ。 それによると人口4442000、未成年1028000 未成年の人口比はだいたい2割3分くらい。 98年の少年犯罪件数を見ると165268件で、これは全犯罪数の37%だったらしい。 この年度の少年犯罪率は人口比から見て高かったと言えるのか?が知りたい。 2割3分の人口が3割7分の犯罪やったから1割4分分高いのかなあとか思ってた。
全犯罪件数≒165,000÷0.37≒446,000件 少年以外の犯罪件数=446000-165000=281,000件 少年以外の人口=442000-1028000=3,414,000人 少年以外一人当たりの犯罪件数=281,000÷3,414,000=0.08 8% お?少年以外の犯罪件数割合は圧倒的に少ないんでね〜の?
188 :
132人目の素数さん :2008/06/26(木) 16:02:58
この問題の本質とは関係ないが、 幼年は基本的に犯罪犯さないだろうから、 未成年のうち或る範囲(12〜17歳くらい?)の 犯罪率は相当高いってことなのかな
一人当たりの犯罪件数を出してなにかわかるのでしょうか
190 :
132人目の素数さん :2008/06/26(木) 19:56:23
え?そんなことって思われるかもしれませんが よければ、 標準偏差と分散の関係を教えてもらえませんか?m(_ _)m
191 :
132人目の素数さん :2008/06/26(木) 22:03:48
>>189 1人あたり犯罪件数が高いと人口の割に犯罪件数が多いと言える。
193 :
132人目の素数さん :2008/06/27(金) 01:12:43
レベルと1階階差のグラフを作成し、定数項のみを含むモデルでADF検定を行いなさい。 最大ラグを5とする。つまりs=4 全く意味が分からないんですが、何からはじめたらいいですか?
x1・・・xn 〜 Po(θ)(θ:未知)のときg(θ)=exp(-θ)のUMVU推定量を求めよ どのように解いていったら良いのかわかりません・・・、お願いします
195 :
132人目の素数さん :2008/06/27(金) 23:11:40
>>194 まず、あんたのレベルが解からんな。
ラオブラックウェルの定理とか、レーマンシェッフェの定理とか
知っとると?
>>195 194で質問したものです
一応知っていることは知っていますが・・・
197 :
132人目の素数さん :2008/06/29(日) 00:00:45
分割表の適合度検定において、自由度は rc - 1 - (r - 1 + c - 1) = (r - 1)(c - 1) になりますが、なぜこうなるのか理解できておりません。 これを厳密に証明している本などがございましたら 紹介していただけませんでしょうか?
>>197 適合度検定というか独立性の検定だよね。まあ同じようなもんだが。
自由度というのは制約条件を考えるので、
rc - 1 - (r - 1 + c - 1) = (r - 1)(c - 1) =
rc-r(行平均の制約)-c(列平均の制約)+1(全平均の重複分)
というイメージでいいんじゃないかなと思います。
χ^2分布で近似できることの証明はかなり難しいと思います。
>>197 岩波の小針あき宏「確率・統計入門」に証明が書いてあったとオモ。
200 :
132人目の素数さん :2008/06/29(日) 20:12:05
>>198 >>199 ありがとうございました。
証明が載っている本を本屋で探しまくったのですが、
見つけ出すことができませんでした。
一度どのくらい難しいのか見てみたいものです。
小針あき宏「確率・統計入門」をみましたが、
厳密な証明は載っていませんでした。
「きちんと証明してもよいが・・・」とは書いてありましたが・・・。
果たして、証明が載っている本は存在するのでしょうか・・・
>>200 ドモアブル・ラプラス: 二項分布 → 正規分布
その一般化: 多項分布 → 正規分布
カイ自乗: 標準正規変量の自乗和の分布
と三段階あるから、それを一発で書いてある本は無いっしょ
202 :
132人目の素数さん :2008/06/29(日) 23:46:15
>>201 ありがとうございます。
自分で勉強して証明するしかなさそうですね。
厳密でなくてもどの定理を用いて、どうやったら証明できるのかが
書いてある道しるべ的な本があれば有難いのですが。
贅沢ですかね・・・。
>>202 >>201 の証明のうち二項分布→正規分布→χ^2分布の確率密度関数の
証明は色んな本に載ってると思います。マセマのキャンパスゼミ確率統計
にも載っている。
適合度検定のχ^2分布を使うことについてはホーエルの「入門数理統計学」
に載っています。
自由度については厳密な証明というのはちょっとよく分かりませんが、
>>198 の掴みでいいのではないでしょうか。
204 :
199 :2008/06/30(月) 01:07:01
いや、
>>201 は少し勘違いしている気がする。それらの証明は
>>203 のように
わりとあちこちに書いてあるけど、
>>197 氏が知りたいのはそれらの証明じゃなく
て、「独立性検定の自由度が(m-1)(n-1)になること」の厳密な証明でしょ。
小針にも、独立な正規変量n個の和が自由度nのカイ二乗分布に従うことの証明まで
は厳密にやっていた。独立性検定での自由度が(m-1)(n-1)になることも命題自体は
は厳密な形で述べてあった。でも証明は省略されていたのか…。結局
>>198 の掴み
と同じ説明しか書かれてなかったわけね。記憶違いスマソ。
205 :
199 :2008/06/30(月) 01:44:57
補足。今手元に小針がないので記憶だけで申し訳ないが、 X1,X2,…,Xnが独立な正規変量で、bar{X}=(X1+X2+…+Xn)/nのとき、 (X1-bar{X})^2 + (X2-bar{X})^2 + … + (Xn-bar{X})^2 が自由度(n-1)の カイ二乗分布に従うことの証明までは確かにあった(一次変換でn-1個の独立 な正規変量の二乗和に等しくなることを具体的に示す)。 だから、適合度検定の自由度がn-1になることまではよい。独立性検定も、適合度検定と同じ に比率分布を先に与えるなら自由度はmn-1でよい。しかし興味があるのは比率分布でなく独 立性だけだから、比率分布を標本比率で代用するところが違う。 そこで、 横の事象がA1,…,An(度数a1,…,an),縦の事象がB1,…,Bm(度数b1,…,bm)で計がNとすると、 Aiの列だけみると、計がaiで、B1,B2,…,Bmの確率が b1/N, b2/N, …, bm/N だから、適合度 検定の定理によってχ^2_i = Σ(Xij - aibj/N)^2/(aibj/N) は自由度m-1のカイ二乗分布に従う。 全体のχ^2は χ^2 = χ^2_1 + χ^2_2 + … + χ^2_n で、これは同様にしてn-1個の(同じ自由 度の)独立なカイ二乗変数の和に変換できるから、χ^2の自由度は(m-1)(n-1)になる。 省略されているのはこの「同様にして」の部分で、本質的には適合度検定の場合の定理の系。 だから、難しいというより添字がゴタゴタするだけで事態は明らかという線形代数的パターン だから省略しただけじゃない?
207 :
132人目の素数さん :2008/06/30(月) 06:37:05
カイ二乗検定で「関連無し」だった場合 (関連無いことを表現したいのですが) 95%信頼区間とオッヅ比を併記するのは意味無しですか?
208 :
132人目の素数さん :2008/06/30(月) 11:09:09
x: 2,3,4,3 y: 1,6,9,2 の時、手計算でやると、var(x+y)=13.5になるのですが、 これって間違ってますか? 正解は、14.75ですか?
209 :
132人目の素数さん :2008/06/30(月) 13:26:03
自己レスです。 Cov(x,y)*2するのを忘れてただけでした。 手計算でやっても、14.75になりました。 失礼しました。
乙
211 :
132人目の素数さん :2008/06/30(月) 23:46:11
>>203 >>204 >>205 >>206 ありがとうございました。
>>205-206 の方々の書き込みを拝見すると、
思ったほど難しくはなさそう(いや、私にはそれでも難しいですが・・・)に思えてきました。
最尤法などを使って証明するものだと思い込んでいました。
(本で調べまくっているうちにそう思えてきたもんで・・・。根拠はあまりないですが・・・)
>211 ちゃんとした証明はRaoの本 C.R.Rao : Linear Statistical Inference and Its Applications, C.R. ラオ著 奥野忠一ほか訳『統計的推測とその応用』 に出ています。一般逆行列を見た方がいい。,
213 :
132人目の素数さん :2008/07/01(火) 23:41:57
経済、経営の領域で回帰モデルになるものはありますか? いまいち具体例が思い出せないので
214 :
132人目の素数さん :2008/07/01(火) 23:56:24
>>212 ありがとうございます。
その本を探して読んでみます。
統計を最近やり始めた者ですが、分からない箇所があったので皆さんの知恵を かしてください。 シュミレーションの分野で「逆関数法」というのがありましたが、何をしてるか よく分かりません。 私は、『「指数分布等に従う確率変数」を一様分布から乱数的に生み出す方法』と 理解しているのですが、正しいでしょうか?
>>216 ありがとうございます。
でも、イメージをつかめても具体的な問題には、まったく歯が立ちません・・
以下の問なんですが、解法をご教授してくれませんでしょうか?
ある保険会社は街の除雪コストをカバーしていて、4ヶ月の期間が対象である。
保険会社は月10000の保険料をもらう。
除雪コストは月々独立で、平均15000、標準偏差2000の標準分布にしたがう。
【0,1】区間の一様分布で以下の確率変数を得た。
0.5398 0.1151 0.0013 0.7881
4ヶ月の純支払額のシュミレーション結果は?
というものですが、これって難しいですか?
>>217 アクチュアリーのモデリングの教科書か。
>>218 そうです。あなたはアクチュアリーですか?
最近興味があってやり始めたのですが、なかなか厳しいです。
あなたにはこれは易しいですか?
>>217 正規分布で逆関数法はつかえんだろ。
計算機も分布表も何もない状態で解けと言われると大変だな。
>>217 求めたい確率変数をもつ分布関数の逆関数が分からないと、近似計算によるしかないので、正規分布の場合は表が添付されてるんじゃないかな。
>>217 俺も今年数学受けるからモデリング勉強中.
解答見ても意味わからない?
217ですが、皆さんが書き込みしてくださったのに返信遅れて申し訳ありませんでした。 あれから解法を読み直したら、とりあえず機械的には解けるようになりました。 アクのテキストでは一様分布と正規分布の組み合わせしかでていませんでしたが、 他の組み合わせでは解けるのか不安です(^_^;) 222さんも今年受けるのですか?他科目も受けますか?
224 :
132人目の素数さん :2008/07/03(木) 02:45:04
>>223 アクチュアリーのテキストには標準正規分布のテーブルは添付されてないと思うけど、解けたの?
225 :
132人目の素数さん :2008/07/03(木) 12:13:19
有限要素法の具体的な適用例なんかが載ってるWebサイトとかあったら教えてください
なんで統計学スレで?って誤爆か
>>224 217ですが、他の統計の本の標準正規分布のテーブルを参考にしました。
アクの指定図書だけでは理解が難しいので、何か参考書を買おうかと考えています。
もし、何かお勧めがあれば、ご教授お願いします。
>>227 その本教えてくれない?標準正規分布のテーブルってなかなか載ってない。
乱数やシミュレーション関係の本はかなり絶版になっています。
モンテカルロ法関連の本も数は少ないですね。
伏見正則さんの「乱数」はまだありますね。
絶版の本もアマゾンとか色々検索してみると見つかることも多い。
統計の本と言っても幅広いので
>>227 はどの程度のレベルで、どんな本を
探しているのかとか分かればレスしやすいと思われ。
>>228 227ですが、私のレベルが低かったため、あなたに勘違いさせてしまいました。
私が使ったのは普通の正規分布表です。「標準正規分布のテーブル」とは
おそらく違うのだと思います。
すいませんでした。
>>229 私のレベルは旧帝1年くらいです。アクチュアリーを目指しているので、
最終的には高いレベルまで学習が必要かなと思ってます。
マセマという参考書が分かりやすいと聞いたのですが、誰か読んだことがある人は
ご意見お願いします。
231 :
132人目の素数さん :2008/07/04(金) 06:44:14
通常掲載されているのが標準正規分布表なので 教科書的に使用される統計本には、掲載されているのが一般的なんだけど。 インターネット上でも標準正規分布表で引けばあるからプリントアウトして 使うのもいいかも。 アクチュアリの統計および使う数学知識は、文系の人でも十分手が届く レベル。もちろん勉強しないといけないですが。 入門からであれば放送大学を利用する手もありますよ。 一時に比べ統計科目の重要度が低くなってしまっているようですけど。 世の中に逆行かな。 頑張ってください。
>>230 宮廷と言っても幅が広いからね…。マセマは持っていますが、式変形の省略が少ないので確率統計の入門書としては良書です。が、ボリュームは少なく、分散分析や回帰分析の決定係数、推定値の推定・検定等はありません。ホーエルの「入門数理統計学」は大体カバーしています。
確率過程はたくさん本が出ているので書店で実際に見るのが良いかと。時系列関連は少ないですが、田中勝人「計量経済学」はダービン・ワトソン検定に触れていましたね。
ニュアンスで分かるだろうけど
>>232 一応訂正。回帰分析の推定値の推定・検定→回帰分析の母回帰係数の推定・検定。
235 :
132人目の素数さん :2008/07/04(金) 23:05:43
>>194 結論から言うと、g(θ)=exp(-θ)のUMVU推定量は、
(\frac{n-1}{n})^{\sum_{i}^{n}X_{i}}
まず、
(1)θの完備十分統計量を求める(自分で求めて)。
(2)exp(-θ)の不偏推定量を求める。この場合、X_{1}=0とした場合、
どうなるか考えてみるとよいだろう。
(3)ラオブラックウェルの定理(だったっけ?)より、(1)で求めた
完備十分統計量で条件付けた(2)の期待値が答えとなるとよ。
dependent t検定と independent t検定の差がいまいちわからない 初めから同じ母集団に対して行うのが前者で、F検定で等分散性を確認した後に 行うのが後者だと認識しているのですが、実際はどうなんですか?
237 :
132人目の素数さん :2008/07/05(土) 17:07:07
45 31 26 71 26 77 82 32 54 1 45 25 82 98 54 52 61 18 77 48 74 86 63 35 52 30 87 23 22 11 21 88 51 15 35 59 44 32 51 38 73 56 51 69 53 68 36 41 24 上記はクラスの数学の点数で、途中まで度数分布表が作られていて、「箱ひげ図」を作成しなさいが解りません。どなたか教えて下さい。
240 :
132人目の素数さん :2008/07/05(土) 22:32:57
箱ひげ図、あるいはBox plotでWebをサーチすれば 望むサンプルがありますよ。難しくないので、それを参考にしたら 良いと思いますよ。 おそらく、まるきり調べずに聞かれてますね。 すごく簡単な方法ですから。
帰無仮説について伺いたいのですが 帰無仮説を検定するにあたって右側左側両側の選択はどのような基準で行えばいいのでしょう? 標本に関して事前知識を持っていない仮定して決定するのがベストとされているように思ったのがそうした場合 全て両側で行わざるおえないような気がするのですが実際は右側や左側の方が使われており その選択における基準がいまいちわあkりません
>>241 対立仮説による。
例えばZ検定で、帰無仮説μ=10,対立仮説μ>10の場合は、
帰無仮説が正しいとき、検定統計量は右側に生ずる可能性が高いので、
右側検定。
すみません、分散の求め方がいまいち解らなので教えて下さい。
>>236 についてお願いします。
t検定についてはともかく、independent t検定についての解説が見当たらないもので…
>>244 independentがつくのはdependentとの対応のためで普通のt検定のことだと
思うけど。
>>245 つまりどちらも違いはないということになるのでしょうか?
independent の方では自由度を両者の和−1で求めたりと、
若干検定の方法に違いが見られるように思えるのです
247 :
132人目の素数さん :2008/07/06(日) 16:21:00
>>243 平均はたし算と整数のわり算だからやさしいけど、
分散にはひき算や自乗が出てくるのでむつかしいかな?
高学年になってからお勉強しなさい
すみません医療の専門学生です。 いまいち公式が解りません。
249 :
132人目の素数さん :2008/07/06(日) 19:17:21
>>248 個々のサンプルが標本平均から平均的にどれだけ離れているか
ということを表すのが分散です。
分散の公式が何かが解らなくて教えてくれたら幸いです。
すいません、質問させてください mixiのコミュニティ参加者数ってのは統計学的には信憑性が高いデータなんでしょうか? 例えばこのバンドのコミュは参加者数多いから世間でも人気が高いとか
>>252 サンプルにはなるんじゃないの。
まあ目安程度には。
>>251 分散の公式って何のこと?
一般的に使われる用語じゃないからもっと詳しい説明が欲しい。
NΣX(X2乗)-(ΣX)2乗 ――――――――― N(N-1) って書いてあるんだけど、このXが何かが解らないんです。 問題には {1 8 12 32 40 6 21 9 11}のSを求めよって書いてあります。
256 :
132人目の素数さん :2008/07/07(月) 00:29:13
>>255 では
>>255 に質問。
その式で、観測された値
{1 8 12 32 40 6 21 9 11}
はどこに入るの?
>>255 基礎からやり直したがいいよ。
高校1年程度の数学も分かってない可能性が高い。
もうね…医療の難しさで、数学の基礎とか言ってられないって。 これでも数学は得意だったんだけど…
>>258 それなら諦めるんだな。
数学は基礎をすっ飛ばして適当にやって何とかなるもんじゃない。
>>246 自由度を両者の(データ数−1)の和で求めるの間違いだよね?
普通の2群のt検定と違いはない。
261 :
238 :2008/07/07(月) 10:10:52
すまん、Rのスレと間違えた。Rで「?boxplot」と入力すると 箱ひげ図コマンドの解説が表示される。
262 :
132人目の素数さん :2008/07/07(月) 11:19:22
>>255 X_1=1, X_2=8, X_3=12, X_4=32, X_4=40, X_5=6, X_6=21, X_7=9, X_8=11
として
NΣX^2-(ΣX)^2
―――――――――
N(N-1)
を計算
>>262 Xは確率変数で、まあ数学的な変数と意味は同じ。xは確率変数Xの実現値で具体的なデータの値を取る。
265 :
132人目の素数さん :2008/07/07(月) 18:07:11
すいません.指数分布族に関して定番的な, もしくはよくまとまった教科書としてどういう書籍がありますでしょうか? 英語の書籍でもまったく構いませんのでご紹介いただけれると幸いです. よろしくお願いします.
266 :
132人目の素数さん :2008/07/07(月) 20:06:04
X〜N(0.1)→X^2〜自由度1のX^2の分布を 特性関数を使ってとけ
267 :
132人目の素数さん :2008/07/07(月) 20:15:08
カイ分布証明なんですけど ヒントだけでも教えてください。
>>264 > Xは確率変数で、まあ数学的な変数と意味は同じ。
ちょwおまw
ルベーグ積分とか、可測性とか無い世界… 確率過程は普通の関数と思えばいい。 確率微分方程式も普通の微分方程式と思えばいい。 すごいな。
270 :
132人目の素数さん :2008/07/07(月) 20:56:22
>>265 Exponential Distribution: Theory, Methods and Applications
K. Balakrishnan (Author)
Publisher: CRC (February 7, 1996)
ISBN-10: 2884491929
ISBN-13: 978-2884491921
271 :
132人目の素数さん :2008/07/07(月) 22:10:30
265>> 指数分布族がメインテーマの本なんて無いだろ。 どんな本でもある程度の事は載ってるよ。 だいたい、指数分布族が学習目的って、どういうことだよ!?
>>268 問題を解くためにイメージさせるためだけだから。
高校1年程度の数学や分散の意味が分からないという
>>243 に。
突っ込まないでくれ。
全微分の定義が分からない経済学部生に中学の1次関数の拡大版だと
言うようなものw
>>272 x_iを普通の変数だと思って計算するだけって言うなら分かるが、
Xを普通の変数だと思ったら余計に訳わかんないでしょ。
で、
>>255 の書き方がたぶん悪くって添え字を書いていないだけでは?
さらに元々小文字だったのでは?
って思うので確率変数を出す必要がないでしょ。
(まあ数学では正確に式を書かないとみんなに理解してもらえない
っていう見本かな。)
275 :
132人目の素数さん :2008/07/08(火) 06:30:45
ちょっと遅レスが、カイ二乗統計量の分布についての 証明は、東大出版の「統計学入門」に2×2の時の証明が載っていた と思う。大きい場合も、同様の手順で証明できるはず。
276 :
270 :2008/07/08(火) 12:10:01
277 :
132人目の素数さん :2008/07/08(火) 18:20:33
今統計学のテスト中誰か頼む ある商社の年間売上が 2000年 250億 2001年 275億 2002年 286億 2003年 303億 2004年 327億 2005年 377億 この間の売上高の平均増加率を求めよって問題なんだが、誰か分かる人いませんか?
278 :
132人目の素数さん :2008/07/08(火) 18:25:12
ごめんね. いまから帰るの. バスに乗り遅れちゃいけない….
279 :
132人目の素数さん :2008/07/08(火) 18:35:32
神が現れる事を信じて 抽出率 八分の一 出発点u=3 の系統的抽出法において、第五番目に抽出される標本の番号はいくつであるか? a 27 b 35 c 15 d 40
280 :
132人目の素数さん :2008/07/08(火) 19:02:27
>>277 それぞれ前年で割って、
幾何平均をとる。
増加率の平均は幾何平均、これ覚えといて。
281 :
132人目の素数さん :2008/07/08(火) 19:08:23
>>280 約108%ですね、ありがとうございます
282 :
132人目の素数さん :2008/07/08(火) 19:55:24
『概説 確率統計』(サイエンス社)ってどうですか?
283 :
132人目の素数さん :2008/07/08(火) 22:37:07
どなたかこの問題わかる方いらっしゃれば教えてください。 独立である確率変数X,Yから作られる確率変数ZをZ=2X+7YのときZの確率密度 関数p(z)をもとめその形をグラフに書け。 ただしXとY分散はともに1、Xの平均値は-1、Yの平均値は1.
できるだけsageでいこうや。
わかんねー 「火星に生物がいる確率」という表現は正しくない。 では、どのように言い換えれば正しくなるのか。火星で始まり確率で終わり、生物、いる、という2つの語を必ず使って正しい表現に言い換えなさい。 言い換える前の表現が正しくない理由、言い換えた後の表現が正しい理由を簡潔に述べよ。(その際、確率の定義を必ず述べること。)
>>280 間違いでは無いけどムダ。最初と最後の比だけから求まる
>>283 XとYの確率分布がわからないとグラフは書けない
>>285 その先生の信念とか信条を聞いてる問題だから、統計学の問題じゃない。
つまり授業に出てたかどうかで成績を決めるための問題ね
>>283 とかもそうだけど、質問する人はできるだけ問題文とかを正確に
書いてね。お願いするだ。
289 :
132人目の素数さん :2008/07/09(水) 04:55:51
>>285 確率空間を使って現象をモデリングしたときに確率が定義される
のであって、現象とモデルをごっちゃにされてもな。。。
290 :
132人目の素数さん :2008/07/09(水) 19:42:34
この時期はいつも宿題やテストの質問で一杯だぎゃ。
291 :
132人目の素数さん :2008/07/10(木) 18:30:47
対数変換するとどうして分散が安定化するのですか?
292 :
132人目の素数さん :2008/07/10(木) 23:47:08
分散が安定って?回帰か? だと説明変数や被説明変数の分布が右歪みを持ってる場合
>>291 ちょっと意味が分からないけど、回帰分析で分散不均一の場合は
加重平均を使って、分散均一にしたりする。
そうじゃなくて、回帰分析の非説明変数と説明変数の関係が線型関係じゃ
ない場合に、ロジット変換とかの線型変換することについてのことかな…?
線型変換しても分散不均一の場合もありますよ。
294 :
132人目の素数さん :2008/07/11(金) 12:47:10
>>293 「加重平均を使って、分散均一にしたりする。」
何に対して何の加重平均を使うのですか?
>>294 ウェイト付き残差2乗和を最小にするときの回帰係数の推定量を加重最小2乗推定量といいます。説明変数と被説明変数の平均も加重平均されています。ただ条件があって不均一な各分散が非確率的な既知の変数と等分散とが線型結合されている場合に使えます。
>>295 若干訂正。不均一な各分散が非確率的変数と等分散との線型結合で表されるときに使えます。
297 :
132人目の素数さん :2008/07/11(金) 15:06:57
【p値姫】 |\/\/| - |o ο o | / ̄ \ / ヽ-、 |  ̄ ノ __| /\_/\ / \ | --、 -、ヽ  ̄/ \ (| .| | |iii| iiii |=) / 丶二_ V .ヽ,!シ !シ !'_> / 0ヽ┌、, ワ ,,ノ> / r''''''ヾ゙゙`'''""、,| | / \◎ ヽ, | | ノ /^ヽノ '! \__(´`゙、> ノ、 ヽ ,,..r'\ / /、 ヽ, _ゝ,,r" .\__/ ヽ_/ <_/ i / i / / | i /| / / | i | i. / / / / i | \__ / / / i .! /ヽ / / i \ / \ / / /|  ̄|  ̄ ̄ ̄ ̄ ̄ ̄ | ヽ / !' `' - ,,,,,,,,,,,/,,,,,,,,,,,,,,,....r''"
298 :
132人目の素数さん :2008/07/11(金) 17:59:11
『概説 確率統計』(サイエンス社)ってどうですか?
|\/\/| - |o ο o | / ̄ \ / ヽ-、 |  ̄ ノ __| /\_/\ / \ | --、 -、ヽ  ̄/ \ (| .| | |>| >i |=) / 丶二_ V .ヽ,!シ !シ !'_> 1stVirtueって臭いの / 0ヽ┌、, ワ ,,ノ> / r''''''ヾ゙゙`'''""、,| | / \◎ ヽ, | | ノ /^ヽノ '! \__(´`゙、> ノ、 ヽ ,,..r'\ / /、 ヽ, _ゝ,,r" .\__/ ヽ_/ <_/ i / i / / | i /| / / | i | i. / / / / i | \__ / / / i .! /ヽ / / i \ / \ / / /|  ̄|  ̄ ̄ ̄ ̄ ̄ ̄ | ヽ / !' `' - ,,,,,,,,,,,/,,,,,,,,,,,,,,,....r''"
分からないので教えてください 標的は射撃したときの横方向の誤差Xと縦方向の誤差Yは互いに独立で、ともに標準正規分布N(0,1)に従う。 ただし、ここでXとYは符号付きで考える。 (1)着弾点と目標との距離の2乗X^2+Y^2の密度関数を求めよ。 (2)着弾点と目標との距離(X^2+Y^2)^(1/2)の平均を求めよ。 (3)3発発射したときに少なくとも1発が目標からの距離が1以下になる確立を求めよ。 お願いします。
このスレで確立はいただけない
二次元のX, Yで考えるような表現では、 平均値や分散というものを考えるのは容易なのですが、 (θ、φ)で表される点の集まりに対して平均値や分散の概念というのはありますか? 球面上のどの方向に強く点が分布しているか、 その広がりはどの程度かというのを何かの値で評価したいのですが、 単純にその点の方向への単位ベクトルの和を使ったりすると、 点が一様分布の場合にはベクトルの平均がゼロになってしまう。 何かそういうものがあれば教えてください。
303 :
132人目の素数さん :2008/07/12(土) 15:36:56
>>295 重みは、どういった重みをつけるのですか?
また、その重みの推定はどのようにして行うのですか?
3つのつぼU1、U2、U3がある。 U1には赤玉8個、白玉4個、U2には赤玉5個、白玉5個、U3には赤玉3個、白玉6個が入っている。 サイコロを投げて1、2、3の目が出ればU1を、4、5の目が出ればU2を、6の目が出ればU3を選び、2個の玉を一度に取り出す。 (1)2個とも赤玉である確率を求めよ。 (2)2個とも赤玉であったとき、選ばれたのがU1、U2、U3である事後確率をそれぞれ求めよ。 上の問題をお願いします
305 :
132人目の素数さん :2008/07/12(土) 16:37:06
306 :
132人目の素数さん :2008/07/12(土) 17:14:43
(1)2個とも赤玉である確率を求めよ。 Φ(R)Φ(R)
307 :
1stVirtue ◆.NHnubyYck :2008/07/12(土) 17:33:28
Reply:
>>299 そんなに死にたければ一人で死ね。
308 :
132人目の素数さん :2008/07/12(土) 20:12:28
「Z〜B(m,p), W〜B(n,1-p) のときP(Z=W) を求めよ」という問題で、P(W=Z=k) としてkについてシグマを取ろうと思ったのですが、 kの範囲をmとnのどちらに設定すれば良いのか分かりません。 m>n, m<n, m=n というように3通りに場合分けして解くのでしょうか? そうしたとしても、答えにコンビネーションが残るのできれいな形にならず困っています。 どなたかアドバイスお願いします。
|\/\/| - |o ο o | / ̄ \ / ヽ-、 |  ̄ ノ __| /\_/\ / \ | --、 -、ヽ  ̄/ \ (| .| | |>| >i |=) / 丶二_ V .ヽ,!シ !シ !'_> 死ぬって1stVirtueは毒ガス並に臭いの? / 0ヽ┌、, ワ ,,ノ> / r''''''ヾ゙゙`'''""、,| | / \◎ ヽ, | | ノ /^ヽノ '! \__(´`゙、> ノ、 ヽ ,,..r'\ / /、 ヽ, _ゝ,,r" .\__/ ヽ_/ <_/ i / i / / | i /| / / | i | i. / / / / i | \__ / / / i .! /ヽ / / i \ / \ / / /|  ̄|  ̄ ̄ ̄ ̄ ̄ ̄ | ヽ / !' `' - ,,,,,,,,,,,/,,,,,,,,,,,,,,,....r''"
>>302 球面上の分布としてはLangevin分布があるが、それでもパラメータ推定には
ベクトル平均を使うぞ。一様ならゼロになるのは仕方ないのでは?
(一様ならどこかに集中している訳ではないし)
>>303 重みは
>>295-296 で書いた非確率的な既知の変数になります。推定するというか上記のように不均一分散が線型結合している場合になります。ただこの場合回帰分析の前提として残差の無相関性があます。
312 :
132人目の素数さん :2008/07/12(土) 22:22:37
>>308 m ≦ n と仮定して、そうでない時は m ⇔ n, p ⇔ 1-p と記号を入れ替える。
組合せの和の方は、
mCx・nCx = mCm-x・nCx
とすれば、超幾何分布の確率の合計=1 が使えるんでない?
313 :
132人目の素数さん :2008/07/13(日) 00:49:06
>>312 ありがとうございます!それでやってみますね。
314 :
1stVirtue ◆.NHnubyYck :2008/07/13(日) 16:13:23
316 :
132人目の素数さん :2008/07/13(日) 21:06:12
甘利ってすごいの?
統計というより、人工知能や機械学習なんかで特に有名だよね まあ出来る人なんでしょう。 おれとはレベルが違うんで分からないけど
318 :
302 :2008/07/14(月) 02:34:10
319 :
132人目の素数さん :2008/07/14(月) 17:42:36
excelで回帰分析とくに重回帰分析をしたいのですが 入力Y,Xの範囲は同数でないとだめなのでしょうか?
そんなことないよ!
321 :
132人目の素数さん :2008/07/14(月) 21:32:36
322 :
132人目の素数さん :2008/07/14(月) 21:45:44
>>316 甘利はすごいけど、教え子のなかには、
理研の中原裕之などのように馬鹿が多い。
先生が偉大であっただけに、
まことに残念。。。
323 :
132人目の素数さん :2008/07/14(月) 22:49:00
多項ロジットと条件付きロジットは違うのでしょうか?教えて下さい。 また、参考書等あれば教えて下さい。
>>319-321 質問がいい加減なので勘違いしたんだろうな。
「入力Y,Xの範囲が同じでないとだめなのでしょうか?」→そんなことはない
「入力Y,Xの数が同じでないとだめなのでしょうか?」→同じでないとだめ
(片方が欠測していたらそのデータは取り除くしかない)
といったところか。
325 :
132人目の素数さん :2008/07/15(火) 01:33:29
> 片方が欠測していたらそのデータは取り除くしかない 場合によっては欠測値を補完してもよい。
326 :
132人目の素数さん :2008/07/15(火) 02:04:31
>>325 欠測値を補完すると、パラメータの推定量の分散が過小推定
されてしまうだろ。
除かないなら、欠測値自体をダミー変数として扱うとかする
べきでは。
327 :
132人目の素数さん :2008/07/15(火) 03:50:41
>>326 それは単一値代入法のときでしょ?
場合によっては、補完する、ということだよん。
欠測値を捨てるか、補完して分析するかは、
判定すればいいと思うよ。
>>327 経時測定データであるとか他の条件があるなら補完法も色々考えられるわな。
>>319 さんがどんなデータで考えてるのかわからんとこれ以上進まんな。
329 :
132人目の素数さん :2008/07/17(木) 00:04:55
正規分布に従う確率変数Xは平均-1、分散1で、このときX+1のn次モーメント E((X+1)^n)を求めなさい。求めかたはn=1〜6くらいまでのモーメントを計算して 予測がついたところで一般式を書きなさい。 という問題でn=3のとき詰まってしまいます。 もしよければどなたか教えてください。
330 :
132人目の素数さん :2008/07/17(木) 00:14:03
>>329 n=2が自分で出せたのなら、n=3はそれを使って同じやり方で出せる。
n=4もn=3の結果を使って・・・と以下同様
331 :
132人目の素数さん :2008/07/17(木) 00:16:05
E((X+1)^3)= E(X^3) + 3E(X^2) + 3E(X) + 1 のように計算して1,2のときをといたのですがここで E(X^3)の値がわかりませんのでもしよければこれをどうやって 求めればいいのか教えてもらえますか。
332 :
132人目の素数さん :2008/07/17(木) 00:17:47
ちなみにE(X)=-1、E(X^2)=2、は平均と分散で出せました。
333 :
132人目の素数さん :2008/07/17(木) 00:27:51
>>331 お受験パズルだったら知らん。
普通はE[X^2]を、分散+1じゃなく、正規分布の密度関数使って積分で求める。
積率母関数とか特性関数とか使ってもいいのなら、微分だけで出る。
334 :
132人目の素数さん :2008/07/17(木) 14:34:35
あるプログラムの処理能力について 「1ファイル当たりに掛かるCPU使用率 [%/File] 」を調べたいとするじゃん ファイル数を変えながらCPUを測定して↓な結果になったとするじゃん File数 CPU[%] 0 10.10 (無負荷) 50 14.80 100 20.00 150 25.20 今使ってる方法(=以前からの踏襲)は File数0 を基準にして 50File: (14.8-10.1)/50=0.094 100File: (20.0-10.1)/100=0.099 150File: (25.2-10.1)/150=0.10067 各値の平均を求めて (0.094+0.099+0.10067)/3=0.9789 で、最終的に 0.9789 [%/File] を結果としてるのね
335 :
334続き :2008/07/17(木) 14:35:16
でもさぁ、理想的な結果が直線になる(と予想される)場合って 最小二乗法で回帰直線を引くのが一般的だよね この場合だと x軸=File数、y軸=CPU使用率 で傾きが結果になるよね んで、Excelの関数で計算させたら、intercept(y切片)が9.95、slope(傾き)が0.101になった 今の方法の結果と回帰直線使ったときの結果で差分が出るけど、 これってどう説明すればいい? 前者の方法だとFile数0の値は正しいものとして扱ってるように見えるけど 単に重み付け平均として File数 0:50:100:150 が 3:1:1:1 で計算されてる? ってか、根本的に「グラフの傾きの平均を求める」っていう操作が 測定の結果を求めるにあたってどういう意味になってるのかがピンと来ないんだよね 自分一人が言ったところで会社のフォーマットは変わらんだろうし 今の方法でも回帰直線と極端に違わない結果は出てるわけだし 別に問題ないっちゃないんだけど、個人的にどうにもスッキリしない
336 :
132人目の素数さん :2008/07/17(木) 17:08:11
母平均の検定を求めるための検定統計量T=(X~-μ)/√(σ^2/n) って覚えたほうがいいですか?
337 :
132人目の素数さん :2008/07/17(木) 17:54:10
>>335 目的は何?
回帰直線を真面目に計算するのはめんどいから、簡易的に計算してるだけだと思う。
338 :
334 :2008/07/17(木) 20:31:38
>>337 目的は何だろう?w
自分がやってる仕事の妥当性を判断したい、のかな
>簡易的に計算
多分そうだろうとは思うんだけど
Excel使ってるから回帰直線の方が関数一発で楽だったりする
今の方法だと途中計算用に測定値と結果以外にもセルが必要だし
あと、実際にはもっと測定点は多いんだけど
もしも重み付け平均になってるとすると
0Fileが不当に重視され過ぎてるような気がする
0Fileも他の測定点も測定誤差は同じくらいなはずだから
全測定点を同等に扱う最小二乗法の方が良さそうな気がする
あぁそうか、今は感覚的に「気がする」だけなんだけど、
「0Fileの測定誤差の大小が結果にどの程度影響するのか」ってのを
定量的に判断する方法が知りたいのだな、きっと
Rスレでも質問中なんですがこっちでも質問させてください。
主成分分析について質問です。 Rのprcompで主成分分析をすると、
たぶん分散共分散行列による主成分分析の値が出てくるんですが、
この青木先生のページ(
ttp://aoki2.si.gunma-u.ac.jp/R/pca.html )
にあるpcaと言う関数の主成分負荷量とはいったい何の値なんでしょうか?
prcompで主成分分析したときの値とだいぶ異なりました。
相関行列による主成分分析の値かと考えたんですが計算したら違うようなので・・・
また、普通主成分分析をするとしたらどちらの値を指すのでしょうか?
>>338 問題は等分散かどうかだよね。
時間をおいて何度か測定した場合0Fileはそれでも常にほとんど同じ値を示し、
他は誤差が生じるなら元の方法の方が安定するのかも。
逆に0Fileでの誤差も他のファイル数での誤差もあまり変わらないなら
回帰を取った方がいいよね。
341 :
132人目の素数さん :2008/07/18(金) 15:41:51
質問させてください 1.「気象庁が『今日の東京地方の降水確率は30%です。』という予報を出したとき、 何に対する何の比率が30%なのだろうか。確率の定義に即して、分母・分子がはっきり分かるように説明せよ。 ただし説明の中で「確率」という語を使ってはいけない。 この問題の答えが分かりません 分かる人教えてください お願いします
342 :
132人目の素数さん :2008/07/18(金) 19:31:14
共分散構造分析って各項目の関係は線型という仮定は入ってますか? もし入っているならば、重回帰分析のように変数変換しなければならないということでしょうか?
343 :
132人目の素数さん :2008/07/19(土) 14:31:26
質問があります。 対応のない1要因の分散分析(条件数のデータが等しい場合)と、 対応のある1要因の分散分析とでは、SSEとdfEの求め方はどう違うのですか? わかる方いらっしゃいましたら教えてください。
344 :
132人目の素数さん :2008/07/19(土) 20:59:40
>>336 中心極限定理の証明を深く理解できていれば、
覚える必要はないだろう。
345 :
132人目の素数さん :2008/07/19(土) 21:03:17
理解できていると思うか それじゃ嫌みだろ
中心極限定理を理解しなさい、という反語表現でしょ。
348 :
132人目の素数さん :2008/07/19(土) 22:24:50
深く理解って、 一般の統計利用者で専門的にやっている人じゃなけりゃ 深く理解なんてしてないよ。
まあでも中心極限定理の証明自体は積率母関数を用いた方法が たいていどんな入門書にも載っているから、やる必要はあると思うけど。 厳密性の程度の差はあれ、証明は基本的な概念だから重要だと思う。 もちろん単位が取れればいいとか使えればいいとかいう人だったら 必要ないかもしれないけど、興味沸かない? 大数の法則とかモンテカルロ法とかあるいは微積分学との関係も深いから、とても 面白いところだと思うけど。
俺文系で数学の知識はあまりないけど 興味ある。
351 :
132人目の素数さん :2008/07/19(土) 23:01:28
>>336 積率母関数を用いた方法よりも、リアプノフ条件や、
リンドバーグ条件といったところまで理解すると、
なぜその式が出てくるか自然とわかるだろう。
だから、反語的に覚えろと言ってるということを意味するよ。
俺も初学者のころは、同じことを疑問に思ったものだ。
あんたの今後の成長を期待してるよ。
確率母関数のところで、 例えば、サイコロn個振って、目の和がkになる確率を求めようとしたときに、 {(x^1 + x^2 + x^3 +.......+x^6) ^ n }のk次の係数がいると思うんですが、 どういう風に表されるんでしょうか? 統計学というより確率に近いかもしれませんがよろしくお願いします。
353 :
132人目の素数さん :2008/07/20(日) 11:00:38
ポアソン分布について質問させてください。 単位時間tあたりに平均でa回起こる事象が、単位時間tあたりx回起こる確率がポアソン分布に従う ときに、その確率分布は具体的には f(x)={(e^-a)a^x} / x! となることはわかるのですが、例えばこのとき、事象が起こる間隔が単位時間のb倍すなわちbt以上 になる確率を求めるには、どうすればよいのでしょうか?
単位時間btあたりの平均回数が分かればポアソン分布に当てはめられる。ポアソン分布は一定の単位時間当たりの発生回数を求めたいとき。逆に待ち時間モデルなら指数分布を使う。
つか、指数分布になることを導く問題なんでないの? >事象が起こる間隔が単位時間のb倍すなわちbt以上になる確率 = f(0)^b ∴時間間隔bt以内に事象が起こる確率 = 1 - f(0)^b
分からない問題があるので、暇な人がいたら是非是非教えて下さい。 xは平均50、分散100の正規分布に従う確率変数である。(x〜N(40.256)) このとき、28<x<68となる確率を求めよ。
>>356 暇だから質問するけど
>xは平均50、分散100の正規分布。(x〜N(40.256))
はどう理解すればいいの?
358 :
132人目の素数さん :2008/07/20(日) 23:16:24
この問題、何をどうすればいいのかさっぱりわかりまてん 指数分布λ exp(− λ x)に従う母集団分布から、ランダムに大きさnの 標本を抽出して、パラメータλ をモーメント法によって推定せよ。また、中 心極限定理を用いて、λ に関する信頼水準(1 − α) の信頼区間を近似的に求 めよ。 特に前半、モーメント法について詳しくお願いしますorz
>>358 モーメント法だと標本モーメントから母集団モーメントを推定するので、
1/^λ=~X ∴^λ=1/(~X)
>>359 あ、それで良かったのかぁ・・そのまんま過ぎて裏があると疑ってしまった
thx!
361 :
132人目の素数さん :2008/07/21(月) 01:54:21
伊理正夫と甘利俊一と竹内啓のうち一番偉いのは誰でしょうか?
えらいこっちゃ
363 :
132人目の素数さん :2008/07/21(月) 14:40:24
質問です。 ある植物の亜種A.B.Cの種子の形の差について調べています。 Nはそれぞれ300前後あり、長径と短径について調べられています。 当初、長径/短径で比を出して平均値の検定をすればいいかと思っていたのですが、 そうすると大きさが無視されています。 そこでとりあえずABCに関して散布図を書いてみたところ、やはり分布に差がありそうです。 では、その分布に差があることを統計的に検定するには、どうすればよいのでしょうか? ご教授下さる方いらっしゃいませんでしょうか?
364 :
132人目の素数さん :2008/07/21(月) 16:19:54
前半は自分で出来て 後半が出来なかった ということか? とすると、出来ない理由が分からない
365 :
132人目の素数さん :2008/07/21(月) 16:43:14
散布図は資料として掲載すれば良いから、 統計的な検定をするなら、A,B,C別に求めた回帰直線の残差平方和と ABC全部一緒にした回帰直線の残差平方和を使って、 仮説「回帰直線は皆同じ」のF検定をやればいい感じ
367 :
132人目の素数さん :2008/07/22(火) 01:09:17
最近、重回帰分析で交差検証l(eave-one-outとbootstrap)を使えるソフトを手に入れたんで 喜んで試していたんだけれど、 なんだか、テストデータを分割して検証した結果と全然合わないorz いったいなにが悪いのやら。。
368 :
132人目の素数さん :2008/07/22(火) 03:05:30
単回帰分析と比較して、重回帰分析で注意点について教えてください。 試験勉強しているのだが教科書に書いていない・・・
369 :
132人目の素数さん :2008/07/22(火) 03:36:56
多重共線性でパラメータの推定値が安定しないとか。
370 :
363 :2008/07/22(火) 08:40:06
>>365 ,
>>366 さんありがとうございました。
その線で調べてみます。
なにせ、分布には差がありそうなんですが、長径と短径との関係係数は低く困りもんです。
まぁ、亜種によって長粒種が混じるって事を証明したいんだからあたりまえですが・・・。
371 :
132人目の素数さん :2008/07/22(火) 08:58:45
多重共線性はあらかじめ排除できる仕様になっているのですが、それでもダメです・・
372 :
367 :2008/07/23(水) 00:21:23
373 :
orz :2008/07/23(水) 00:22:44
>>372 元のデータと外部のデータを一緒に多変量散布図で見たら
どこかの変数で群に分かれたりしてない?
交差検証がどうのこうのよりそういったそもそも元のデータからの
予測に向いていないデータなんじゃない?
この問題…。わかりまてん。スタージェスってorz.... 『平成元年の都道府県別の経済成長率(%)は次のとおりである。 5.6, 8.1, 9.4, 8.2, 5.5, 5.2, 9.0, 5.4, 7.9, 8.1, 6.8, 7.5, 8.3, 9.6, 8.2, 6.8, 6.2, 5.7, 5.9, 7.6, 6.3, 7.6, 8.0, 5.3, 7.9, 3.5, 7.1, 7.9, 8.8, 3.5, 7.1, 6.5, 6.2, 7.9, 3.9, 5.8, 9.2, 8.5, 5.4, 6.1, 5.3, 10.0, 6.5, 9.6, 7.3, 7.0, 7.6』 Q1 データの最大値と最小値を求めよ Q2 データの範囲を求めよ Q3 階級数6とする区間幅を決定し度数分布表を作り、その度数分布表を描け Q1,2はわかりますが…。 んでも特に区間幅の求め方がわかりまてん orz 区間幅の求め方を詳しくお願いします OTL
>>375 どうして教科書に載っていることを聞くのかな?
または「スタージェスの公式」でぐぐるだけなのに。
いちお教科書じゃないが、文系の自分がこの春から統計してさっぱりなのです。 自分の見解としてスタージェスは使わないで良い気がして 区間幅がわかるば解けると思うのですが、まったくわかりまてんでした。
>>376 スタージェスの公式って、階級数を求めるものじゃなかったけ?
>>375 は所与の階級数がすでに
あるので、見当違いな助言に見えるが。
Q1とQ2は、Q3のためにあることをかんがえればよいんじゃね?
スタージェスの件ありがとうございまつ OTL 区間幅の件ですが、僕は1.1がベストではないかと思うのですが 各階級の境界上にデータが来てしまうので困ってますが orz 1.1じゃやっぱりダメなのですか? むしろベストな区間幅って何がよろしいのでしょうか?OTL
380 :
132人目の素数さん :2008/07/23(水) 13:36:07
>>379 区間幅の決定には様々な尺度があって、一概には何とも言えんのぉ。
問題が尺度を指定していないのが悪いのか、
もしくは教材に何らかの示唆があるにもかかわらず、
それを見落としている学生が悪いのか・・・
教材はないです::この与えられたプリント一枚のみなのであります。。
あと非常勤の教授の授業も独壇場ですから、意味フラワ〜orz
もしよければあなた様ならQ3 区間幅、ほかもろもろ、なんになされますか?
与えられた問題はマジで
>>735 のみです。
僕は区間幅が設定できればあと頑張れる気がします。
特に文系の人に多いんだけど宿題の問題の丸投げが目立つよね。まず自分で考えるなり、調べるなりしてから質問した方が自分のためにもなるよ。
どうせ将来も使わないだろうから理解できなくても単位だけとれれば良いのだ
まあ、いろいろ工夫して、区切り方の長所短所を知るための練習問題だと思うけどね。 いつも何にでも正解があるわけぢゃないから(ニヤニヤ)
了解しましたー。 宿題じゃないんですけど、履修したんだし解きたかっただけですね汗 もうチンプンカンプンです。 んでもとりあいず頑張ってみようと思います。スタージェスだけでも不要ッてわかっただけでも助かりますた。 みんなありがとう!
386 :
132人目の素数さん :2008/07/23(水) 18:43:14
>>381 まずヒストグラムは区間幅の決定も重要な話だが、
origin(日本語では始点というのだろうか)の決定も同様に重要だ。
考えてもみろよ、始点と幅が変われば、ヒストグラムの見た目も随分と
変わるだろう。
387 :
132人目の素数さん :2008/07/23(水) 18:55:53
>>381 極めて一般論を述べるが、
データが正規分布に近いと予測できるとき、
MISEを最適化するヒストグラムの区間幅は、
およそ 3.5×n^(-1/3)だ。
(nはサンプル数)
参考にするとよいだろう。
388 :
132人目の素数さん :2008/07/23(水) 19:10:33
>>387 訂正。
3.5×s×n^(-1/3)だった。
sはデータの標準偏差。
>
>>387 詳しい説明が。
うれしいです!
時間かけてやれるとこまで頑張ってみることにする!
みんなほんとありがとう!
390 :
132人目の素数さん :2008/07/23(水) 20:46:46
>>389 あのねぇ、同じ年頃の人間と話している感覚だろうが、
ここにいる人の中には、その道の大家(書き込みから判断する限り)
もいらっしゃるだろうから、注意しなさいよ。
学校の宿題というか、テスト前に問題をやっているのですが
混乱しているので教えてもらえると嬉しいです。
有意差検定のことなのですが・・・
有意水準を5%としたとき、
t(0.025)と表記される場合と、t(0.05)と表記される場合の
違いが分かりません。
ttp://www.asamiryo.jp/pers4.html を見る限りでは、
両側の時に前者、片側の時に後者という感じなのですが・・・
プリントの問題の複数の回答では、片側対立仮説に対する
有意水準5%の仮説検定の際、t(0.025)で表記されています。
誤植にしてはあまりに多すぎる気がして・・・
>>390 伊理正夫や竹内啓クラスがここに来てたら、ある意味嫌だけどな。w
>>391 それで合ってると思うよ。問題によっては片側か両側どちらが良いか判断しづらいこともあるから、臨機応変に。
>>393 ありがとうございます。どうやら色々調べたところ、
誤植が数箇所、自分の勘違い(片側だと思い込んでいたのが両側検定だった)が重なっていたようです。
もう一つ質問なのですが、ある問題で
標準正規分布N(0,1)の上側2.5%は1.96だから・・・という記述がありました。
教科書巻末にある正規分布表を見てウンウン唸ってみたんですが、分かりません。
教えてもらえると嬉しいです。
395 :
132人目の素数さん :2008/07/24(木) 00:01:48
>>394 1.96というのは横軸xの値だよ。
有意水準5%の両側検定だと大体2シグマ区間に入ると考えてよいだろうね。
(正確には[-1.96,1.96])
分かりやすく偏差値で言うと、母集団を正規分布と考えると、
大体偏差値50〜70くらいの人が95%くらいいるということ。
396 :
132人目の素数さん :2008/07/24(木) 00:03:42
>>395 訂正。
大体偏差値30〜70くらいの人が95%くらいいるということ。
>>394 てかテスト前でそんなのも分からないのはマズイだろ…
授業全然真面目に聞いてなかったのか?
398 :
orz :2008/07/24(木) 01:34:12
>>374 もとのdataからの予測に向いていないっつっても、大本のdataを任意に分割してtest dataをランダムになんども作成しています。
q2(loo)がでかけりゃ外部test dataもそれなりにでっかいだろう、ってのが
交差検証の有難味なんじゃないんでしょうか??
399 :
132人目の素数さん :2008/07/24(木) 21:11:07
経験人数が0人でなく、特に女性に好みのタイプがない人への問題。 日本人女性のバストサイズの母平均と母分散に関して、 あなたの性経験から95%信頼区間を求めなさい。
400 :
132人目の素数さん :2008/07/24(木) 22:06:16
自称はそんなもんだな
403 :
132人目の素数さん :2008/07/25(金) 10:13:27
うぁ、値が知、最近IMEが変です・・・
負の自己相関はないのか?
406 :
132人目の素数さん :2008/07/25(金) 11:36:15
>>403 肝心の観測値の数と実測相関係数値が無いと、
偶然変動の範囲で、不思議でもなんでもないけど。
>>406 1000個程度以上であれば、サンプリング数を変化させても常に小さくなるっぽいです。
>>405 絶対値とってます。
>>403 乱数の生成に問題は?乱数系列のCorは必ず0と言えるの?
410 :
132人目の素数さん :2008/07/25(金) 17:43:58
>>399 おれの相手した女性だと
[80,60]
ぐらいかな?
好みが偏ってるから分散は小さい。
もちろん、外れ値もあるけどねー!
>>410 対称な分布を仮定しているのか?
俺の感覚だと、右の裾が長い気がするが。
412 :
399 :2008/07/25(金) 19:31:45
ランダムサンプリングの観点から、好みに偏りがあると正確な推定ができません。 ヤリチンの人データください。
413 :
132人目の素数さん :2008/07/25(金) 22:43:44
>>408 ファイルの種類が分からないから文面だけで判断すると、
回帰より分散分析の方が良いと思います。P値(確率値)は単純にその値が低い方
という解釈で構わないかと。
>>403 乱数の方に多分問題はないけど、
ある確率変数の相関係数が、独立な変数の相関係数より
小さくなっても数学的には別に不思議ではない。
例えば、常にX(1)=X(2)=-X(3)となるような確率変数を考えると、
標本の相関係数は常に0だから、
独立な乱数より相関の絶対値は小さくなるでしょ。
415 :
132人目の素数さん :2008/07/26(土) 01:53:22
iPodとかのシャッフル再生で、全曲聞けるまでの再生回数の期待値っていくつになるんだろ。
416 :
132人目の素数さん :2008/07/26(土) 04:50:19
>>411 対称な分布じゃないですね。
スリムタイプが好きなんだけど、
スリムボディでも胸大きい女の子いたから。
ひとりずつ思い出して数えてみると、
だいたい以下のような分布です。
*
**
****
*******
ABCDEFG
カイ2乗分布の自由度について質問です。よろしかったらお教えください。 ・度数が5よりも小さいとき、まとめるのはなぜ?なぜに5? ・その時の自由度はn-3?になる? 一つ目のほうはただの疑問なのですが、2つ目のほうが講義ちゃんと聞けてなかったみたいで困ってますorz
418 :
132人目の素数さん :2008/07/26(土) 16:13:26
>>417 >・度数が5よりも小さいとき、まとめるのはなぜ?なぜに5?
二項分布の正規分布近似の条件を調べてみそ
>・その時の自由度はn-3?になる?
単位落としたくなかったら、教科書読むかググレカス
419 :
132人目の素数さん :2008/07/26(土) 17:41:15
ある製品を20個まとめて箱に詰めている。 製品1個あたりの重量(g)はN(100,16)にしたがって分布しており、 箱は中身が空の状態で1箱あたり、N(300,80)に従って分布している。 1)製品20個を詰めた状態での箱の重量は1箱あたりどのような分布に従うか述べよ。 2)製品20個を詰めた箱の重量が2340g以上になる確率を求めよ。 誰か、教えて。
420 :
132人目の素数さん :2008/07/26(土) 17:42:02
母発現率π=0.30の推定量、 推定量の期待値、分散はどうやって求めるのでしょうか?(N=9)です。 誰か、教えて。
>>418 回答どうもです。改めて調べてみました。n-3になってたのは正規分布だからで、度数は関係なかったんですね。
的外れなこと聞いてすみませんでした。度数のほうも納得いきました。ありがとうございました。
丸投げだとなかなかレス付かないと思うよ。
423 :
132人目の素数さん :2008/07/26(土) 20:13:45
>>419 その場合、製品と箱は独立しているから、
正規分布の再生性(reproductive property)から、
N(100,16) + N(300,80) = N( 100+300 , 16+80)=N(400,96)
となる。
簡単でしょ?
でも証明はすごく長くて面倒。
以前から気になっていたので質問させてください。 多くの教科書等では、確率変数はXなど大文字で書かれていることが多く、 その実現値はxなど小文字で書かれていることが多いと思います。 しかし、確率密度などは、f(x) = λexp(-λx)のように小文字で書かれていることが多い のは何故なのでしょうか?
425 :
132人目の素数さん :2008/07/26(土) 23:49:28
>>424 統計のほうは、習慣でそうなっているだけかと思います。
数式は、数学の習慣に従って書いているだけかと思います。
統計の習慣に関してはいろんな入門書に書いてあったと
思います。
慣れてしまうとどうってことないです。
>>424 確率論における確率変数の定義を考えると区別が分かるよ。
>>425 説明不足で真意が伝わってなかったかもです。ごめんなさいm(_ _)m
>>426 確率密度のxは確率変数ではなく、実現値を変数としてみている
ということで合ってますか?
428 :
132人目の素数さん :2008/07/27(日) 01:55:06
大文字小文字は、その方が教えやすいので、気分で使いわけてるだけだよ。 確率変数のままだと、微分したり積分したりするのを恐がるので、 「X=x の時」とやって、x で扱うと皆安心する。心理的なものにすぎない
確かに大文字を使わなければならない理由はないが、 確率変数と普通の変数は全然違う。全然違うことを 意識させるために大文字を使う。
430 :
132人目の素数さん :2008/07/27(日) 22:33:58
統計学を勉強し始めて、正規分布の範囲をやっているのですが、 いまいちよく分かりません。 問題が、 全体で22人生徒がいて、その平均は22才、標準偏差は2.5のとき、 1.ランダムに1人選んだとき23歳以上の確率 2.ランダムに16人選んだとき23歳以上の確率 を求めなくてはいけないのですが、どなたか解き方が分かる方いらっしゃいませんか?? 教えていただけると嬉しいです。
431 :
132人目の素数さん :2008/07/27(日) 22:38:28
430の者です。問題文打ち間違えました。すみません。 正しくは 全体の平均が22才で、全体の人数は分かりません。
それくらい教科書に載ってるだろ
>>430 以下を調べる
1..標準正規分布表の使い方
2.標本平均値の分布
434 :
132人目の素数さん :2008/07/28(月) 01:15:05
わかりました。調べてみます。 ありがとうございます。
>>430 2.は16人の「平均」が23才以上ということだろう?問題文は正確に。
436 :
132人目の素数さん :2008/07/28(月) 20:40:22
1.43の5乗根ってテスト中にどう求めるのですか・・・?計算機を超えてますよね?
統計を勉強しているので、大学在学中に 統計学の資格を取りたいと考えているのですが、 探したところあまり見当たりません。 何かご存知の方いらっしゃいましたら、ご教授お願いします。
438 :
132人目の素数さん :2008/07/29(火) 00:50:05
>>437 資格は存在するけど、そんなもの取らなくてもいいよ。
全く何も関係ないから。
履歴書に書けるけど、何の価値もない。
日本統計学会、応用統計学会、日本計算機統計学会などの
論文誌に、論文1本載せるほうがよっぽど実績になる。
439 :
132人目の素数さん :2008/07/29(火) 02:51:52
>>437 その存在するものを教えてもらえませんか?
三流大在学の私が、日本統計学会、応用統計学会、日本計算機統計学会などの
論文誌に、論文1本載せれるかどうかわかりませんので。
>>440 統計士なるものを聞いたことがあるが、価値あるものは特に無い。試験科目に数理統計学があるものとしてアクチュアリーがある。3流大だから資格で一発逆転みたいな発想なら統計より別の資格のがいいよ。
>>441 統計士(通信教育)は知っています。
統計学は重要な学問であるにも関わらず、資格が少ないというのは驚きです。
統計ユーザーの裾野を広げるためにも、資格の整備が必要だと思うのですが、
そうした資格を立ち上げる動きもないのですかね?
まぁ応用先があっての統計学なので、アクチュアリーや会計士の試験の一科目として、
扱われるのも尤もな話だとは思いますが。
443 :
132人目の素数さん :2008/07/29(火) 17:26:57
最小自乗法でパラメータの範囲を正に限定する方法ってないでしょうか? 誤差(x) + y(x) = F*f(x) + G*g(x) + H*h(x) ... 伯差(x)^2 が最小になるように F,G,H を推定したいのですが、F,G,Hはすべて正の値の範囲にして置きたいのです。 #ラグランジュの未定乗数法みたいなてっとり早い手があると嬉しいのですが・・・ #ラグランジュの未定乗数法を工夫してできないだろうか、仕組み的になんか出来なさそうな気もする・・・ #といろいろ考えて、ちょっと自分の能力を超えているような気がしたので・・・ #自分で考えるのをあきらめました orz
444 :
132人目の素数さん :2008/07/29(火) 18:25:23
>>443 不等式制約の場合は、制約が効いたパラメータは端点になるから、
結局、等式制約と同じでは?
例えば、もし制約無しで F の値が負になるなら、
「非負」の制約条件を課せば、それに一番近い F=0 が解。
つまり、f(x) を説明変数から外して推定した結果と同じだよね。
445 :
132人目の素数さん :2008/07/29(火) 19:16:04
>>442 > 統計学は重要な学問であるにも関わらず、資格が少ないというのは驚きです。
統計学ってのは、数学と違って閉じた学問じゃないからね。
扱うデータによって医療、経済、物理、生物、工業、生産、心理学
などどんな分野でも使うから、それぞれの分野で資格を取るしか
ないかもしれない。なにしろ文学でも使う。
1903年の夏目漱石の東大での講義ノートにも、因果関係に
よる数式モデルが登場するし、漱石の英国留学時には、かの
カール・ピアソンに対して、「あんたのやっていることは、おれが
やろうとしていたことだ!先にやりやがって!残念!」
と言ったという逸話はあまりに有名なんだな。
そういう具合に、誰でも、どんな分野でも使われるから、
試験するったって難しいだろうし、どういう資格でどのように認定
するか統計学の先生たちが話し合いをしたら、そりゃケンカになるだろね。
>>445 では、統計学の資格を作るという動きでさえ、
現在のところは無いという認識でよろしいでしょうか。
>>446 ないんじゃない。
ところで統計で何がやりたいの?
メーカーを目指すならQC検定があるけど。
>>445 数学も閉じた学問ではないと思うけど。純粋数学は分からないが、少なくとも応用数学は開かれた学問だと思うよ。
449 :
132人目の素数さん :2008/07/29(火) 22:49:38
どことなく、椿さんの話を聞いた人がいるような・・・・
450 :
132人目の素数さん :2008/07/29(火) 23:03:54
>>449 椿先生って、茫洋とした感じだけど、
何聞いても知ってるからすごいと思う。
ただ忙しくてなかなかゆっくり話できないけど。
451 :
132人目の素数さん :2008/07/29(火) 23:29:08
昔からあんな感じ いえ、上で椿さんの話を引用してる人がいたもので ちょっと言ってみただけ
452 :
132人目の素数さん :2008/07/29(火) 23:35:42
>>443 >ラグランジュの未定乗数法を工夫してできないだろうか、仕組み的になんか出来なさそうな気もする・・・
それがKKT(Karush-Kuhn-Tucker)
453 :
132人目の素数さん :2008/07/30(水) 03:12:58
>>451 こんな感じかな?
,,,,,_,,,,,
彡 ミ
彡. (・) (・) ミ
彡 ミ <つばきです。。。
彡 ▲ ミ 彡ミミ,.
彡彡 " ゛ ミミ彡 ,し
彡 ",,,,,.,, " 彡
彡 ミ "" ミ 彡彡彡
>>444 >>452 >それがKKT(Karush-Kuhn-Tucker)
>「非負」の制約条件を課せば、それに一番近い F=0 が解。
>つまり、f(x) を説明変数から外して推定した結果と同じだよね。
有難うございます、分かってしまいました(^^)
深く考えすぎてた、線形計画法と同じでハジッコもしくは何処かしかないですね。
要素数が増えると計算量が爆発しそうなのがちょっと嬉しくないですが・・・ここは力ずくしかないかな。
>>447 データ解析、マイニングといったことに興味があります。
純粋に統計を勉強したいという気持も少しあります。
>>455 なるほどね。
ただその方面だと就職に直接役立つという感じにはならないかな。
リサーチ系の会社に進みたいというのなら別だけど。
統計学に全く疎くて読解力もないので、このレスの言ってる事がまったくわかりません。
何を言わんとしているのか教えてもらえますか?
64 名前:名無しさん@英語勉強中 [sage] 投稿日:2008/07/31(木) 00:49:00
統計学がサイエンスであるかないかという主体の定義によって、
統計処理を踏まえた結論に対して、その解説の仕方を変えなくちゃいけないところに
多かれ少なかれ問題があるんだが、そうしたパラダイムにそって
作られているわけだから、統計学を否定するなら、
TOEICを受けなければいいよ
勿論、統計学を運用して、成立しえている一部の医学における治療も受けないで欲しいけど
---------------------------
http://academy6.2ch.net/test/read.cgi/english/1217419763/64 流れもいまいち把握できないんですが、このレス以降荒れてしまい、レスの趣旨を本人に
聞いても流されてしまって答えてもらえませんでした。
459 :
132人目の素数さん :2008/07/31(木) 02:56:58
>>458 多分言いたいことは、
「真のモデルを仮定して推定や検定を行っても、
仮定が正しいかどうか分からない以上、
推定・検定の結果も正しいかどうかは分からない。
しかし、そうした手法が世の中では
実際に役にたっているのだから、
それを認めなければ生きていけないのだよ。」
ということじゃないか。
まあ典型的な負け惜しみだわな わかったようなわからないようなことを言って煙を撒こうっていう。 統計学を持ち出されても苦笑だわ
なんで英語の板でそんな話題になってるんだw
462 :
132人目の素数さん :2008/07/31(木) 03:59:03
英語ぐらいならまだいいじゃないか。 かわいいもんだよ。 おれ、統計学やってますって言ったら、 細木数子と同じか?と言われた。 はあ?とか思ってググってみたら 細木数子は統計学を使って占っていると言ってる。 細木数子は逝ってよし!
463 :
458 :2008/07/31(木) 10:04:13
皆さん返答ありがとうございます。
TOEICは、配点方式に項目応答理論という
統計理論を応用した配点方式を採用しているそうで、
その配点方法で揉めていたところでの
>>458 のレスでした。
突然このようなレスがされて、私だけでなく文脈をつかめない人が
多く、この後、荒れまくりましたw
しかし、
>>459 さんの説明で言わんとしている事は理解できました。
スレ汚し失礼しました。
>>462 細木が統計理論を使っているか真偽の程は分からないが
時に、統計の利用は占いの一つと言っても良いかもしれない
という気もしてきた。
統計学に裏付けられた理論に基づく占い
単なる(主観の)占い
とか
経済時系列などは特にその方がいい気もする。
時系列占いかな。
この方が確率に対する誤解も減りそう。
当たるが八卦当たらぬが八卦
から
当たるが14%当たらぬが86%とか変わってくるのかな
占いにしたら、クライアントから出るお金が増えたりして。
別に奨めてるわけじゃあないからね。
細木さんは数理統計理論はど素人だよ。正規分布という言葉だけでも知ってたら驚きだよ。過去の経験から推測するという一般的な漠然とした意味で言っているに過ぎないだろう。
466 :
132人目の素数さん :2008/07/31(木) 14:57:06
あまり本気で答えないように
統計関連の査読付きジャーナルで、最も知名度の低いものって、 何ですか?
468 :
132人目の素数さん :2008/07/31(木) 20:58:01
こうじこうじー 二項分布の判断の信頼性について教えて〜 80字くらいで
469 :
132人目の素数さん :2008/07/31(木) 21:09:12
>>467 うむー、最も知名度の低いということは、
ほとんど誰もしらないジャーナルのことね。
そういうジャーナルを知っている人は
外れ値になるから、数学板なんて見てないと思う。。。orz
470 :
132人目の素数さん :2008/08/01(金) 00:14:48
日本統計学会の英文誌が2冊届いた。
一冊は赤池先生の2006年京都賞受賞記念となってる。
で、京都賞ってどういう賞かとググってみたら、なんと賞金5000万やてー!
おれも欲しいーーーーー!
5000万欲しい。。。
けど、おれには無理。。。orz
>>467 各大学の紀要かな?
紀要も一応査読付きだからジャーナルといえば、ジャーナルと
言えなくもないと思うが?
君の大学(学部)には紀要はないの?
>>467 お前が新たなジャーナルを創刊すれば、
それが現時点でもっとも知名度の低いジャーナルとなる。
ある6面サイコロをN回振って各面が出る確率が等しいかどうかを検定する場合 1. 検定にカイ二乗検定を用いることは妥当ですか? 2. カイ二乗検定が妥当な場合、自由度は6-1=5ですか? 3. 期待度数5以下が含まれる場合、2×2分割表ではイエーツの修正ということを行うべきだそうですが、 この場合1×6の分割表になり、修正方法が分かりません。どのように修正するべきですか?
473 :
132人目の素数さん :2008/08/01(金) 17:12:48
母発現率π=0.30の推定量、推定量の期待値、 分散はどうやって求めるのでしょうか?(N=9)です。
474 :
132人目の素数さん :2008/08/01(金) 17:40:07
>>472 1.妥当、2. 5、3. 30回以上振れ(多いほど良し)
475 :
132人目の素数さん :2008/08/01(金) 17:41:37
centuokeさん 母発現率とはなんですか?
477 :
132人目の素数さん :2008/08/01(金) 19:11:50
そうそう、おれも母発現率なんて初めて聞いた。 おれの勉強不足かと思っていた。(実際そうであるが) で、ググってみたら、 どうも生物学や遺伝子工学などで現象が現れる 率ということらしい(?) 生物統計やってる人でないと意味わからんかもね?
478 :
132人目の素数さん :2008/08/01(金) 20:28:17
,
479 :
132人目の素数さん :2008/08/02(土) 10:41:31
二人の人間に対してある画像に対する 10項目の印象のアンケートを5段階評価(-2〜2)で行いました。 この二人のアンケート結果の間の独立性を検定する場合 1.-2〜2の評価値を0〜4に底上げして検定を行っているのですが、 正規化する方法が正しいのでしょうか? 2.この場合の自由度は9でいいのでしょうか?
480 :
132人目の素数さん :2008/08/02(土) 11:08:51
>>479 先生が独立性を検定しろって言ったの?
それおかしいです。
まず、独立性の検定が必要なことでしょうか?
そして、まともに検定できるとお思いですか?
>>480 正確には人工知能によって予測されたアンケート結果と
実際に人間から得られたアンケート結果との間に違いがあるか?
ということを統計的に解析したかったのですが。
独立性の検定によって違いがある、ないを調べられると
思ったのですが、間違いだったんでしょうか?
467 言い方を間違えました。 「投稿して最もアクセプトされやすいジャーナルはどこですか?」 という表現に変えます。大学紀要以外でお願いします。 日本語、英語は問いません。
483 :
132人目の素数さん :2008/08/02(土) 18:52:28
>>482 粗悪品を輸出してもバレない国や通関地をネットでしつこく聞いてる商人
みたいな立場つーことね
>>484 ありがとうございます。
wilcoxon検定などやってみたのですが、イマイチ納得行く結果が
得られなかったので早速試してみます。
486 :
132人目の素数さん :2008/08/02(土) 22:35:21
479=481=485です。 有意水準について少し解らないことがあるのですが。 二つの集団の間に違いがあるか、ないかを調べたくて、 帰無仮説を「2つの集団の間に違いがない」としてt検定を行いました。 その時に有意水準5%の時と1%では、1%の時の方が 違いがある!と言うための条件が厳しくなるということでいいのでしょうか?
487 :
132人目の素数さん :2008/08/03(日) 07:10:50
480です。 やっと、わかりました。 なんかおかしいと思っていたら、 独立性ということがわかってない。 差があるかどうかの検定でしょ? 独立性の検定じゃないでしょ? もうね、びっくりしましたよ。 独立性なんて検定できるわけないですもん。
>>479 俺は、やはり独立性を検定すべきだと思うよ。
例えば、二人の人の解答値の組が、
(-1,-2), (0,-1),(1,0), (2,1)
のようになった場合も、二つの結果は
よく相関しているわけだから、
それなりに好ましい結果とみなしたいわけでしょ?
この4標本をpairwise t-test で比べたら、
「有意な違いがある」で終わってしまう。
10標本しかないので、5 by 5 table の独立性検定は
難しいかもしれないが、少し小さい表にしてから
Fisher's exact test を使うとかいろいろ考えてみるべき。
>>487 は、ちゃんとした知識がないなら
解答しない方がいいんじゃないか。
489 :
488 :2008/08/03(日) 13:26:16
仮に、本当に差の検定をしたいとしても、 10標本の5段階順序データの差をt-検定して論文を投稿したら、 真面目なレフリーだったらリバイズを要求される可能性が高いと思います。 少なくとも、差の分布が正規に近いことは示すべき。 保守的に行くなら、差を取ったあとはせいぜいbinomial test あたりでしょう。
>>477 母比率のことかな?
統計を各分野で応用している人たちって勝手に新しい言葉を作りすぎ。
統計やってる俺でも、各分野で勝手に作った用語使って言われると、
訳分からないことが多い。
492 :
479 :2008/08/03(日) 19:59:27
>>488 ありがとうございます。
標本の数によって検定方法がそこまで変わってくるとは
知りませんでした。正確には標本は23あります。
説明不足で申し訳ありません。提案してくださった手法を調べて
早速試したいと思います。
>>491 ありがとうございます。
各印象の間に連続性(?)がないと考えていたので、
相関係数を使った検定は全然調べていませんでした。
早速調べて、やってみます。
493 :
488 :2008/08/03(日) 23:46:33
>>491-492 相関係数を調べるのは悪くないと思う。
ただ、
>>492 が述べているように順序データを連続変数として
扱うことは(重要な分析ならば)批判される可能性が高いので、
Spearman やKendallなどノンパラメトリックな相関係数を
使った方が良いと思う。ただしその場合、5段階のデータなら
複数の観測値が同じ値をとる("tie" と呼ばれる)はずなので、
これを補正したテストを用いる必要がある。
494 :
479 :2008/08/04(月) 01:06:18
>>493 度々、ありがとうございます。
確かにノンパラメトリックな手法が適切だと思いました。
tieの問題の方は、観測地が複数人のアンケート結果の平均と、
人工知能による出力なので共に小数点以下まで表しています。
よって、同じ値をとることは稀なので比較的問題なく検定を行えると思います。
495 :
479 :2008/08/04(月) 07:02:50
Spearmanの順位相関係数で検定を行ったところ、 納得行く結果を得ることができました。 ご助言下さった皆様どうもありがとうございました。
496 :
132人目の素数さん :2008/08/04(月) 07:52:13
>>488 いや、もういいです。
馬鹿相手してもしかたないんで。
子供どうし遊んでてください。
498 :
132人目の素数さん :2008/08/04(月) 16:18:43
変動係数の単位って何?
499 :
132人目の素数さん :2008/08/04(月) 16:27:23
100 120 120 130 140 170 180 210 220 250 300 450 の幹葉図ってどうやって作ればいいんですか?
500 :
132人目の素数さん :2008/08/04(月) 16:30:21
身近なデータの中で、平均値の誤用例は何でしょうか?(2つ以上)
>>499 stem(c(100, 120, 120, 130, 140, 170, 180, 210, 220, 250, 300, 450))
>>500 追試?というか、救済レポート?
えーと、あるプロ野球チームのレギュラー陣の背番号の平均
503 :
132人目の素数さん :2008/08/04(月) 17:22:20
>>500 国家公務員の給与基準だろう
世の中の会社の平均ということで実は・・・・
これは誤用というより、恣意的にゆがめた利用だな。
これはもう御用だよ。
504 :
1stVirtue ◆.NHnubyYck :2008/08/04(月) 18:26:50
思考盗聴で個人の生活に介入する奴は早く永久停止したほうがよい。
505 :
132人目の素数さん :2008/08/04(月) 19:17:38
>>497 おまえ本当に馬鹿だな。
入門書もまともに読んでないってよくわかるよ。(笑
506 :
132人目の素数さん :2008/08/04(月) 19:19:21
>>497 お前が誰だか知ってるんだ。
おまえの欠点は自分の無知を絶対に認めないこと。
むかしからそうだったろ?
しねよ
487 :132人目の素数さん:2008/08/03(日) 07:10:50
もうね、びっくりしましたよ。
独立性なんて検定できるわけないですもん。
505 :132人目の素数さん:2008/08/04(月) 19:17:38
>>497 おまえ本当に馬鹿だな。
入門書もまともに読んでないってよくわかるよ。(笑
506 :132人目の素数さん:2008/08/04(月) 19:19:21
>>497 お前が誰だか知ってるんだ。
おまえの欠点は自分の無知を絶対に認めないこと。
むかしからそうだったろ?
しねよ
wwwwww
508 :
132人目の素数さん :2008/08/04(月) 22:58:55
509 :
132人目の素数さん :2008/08/04(月) 23:18:51
>>503 平均をとる対象の問題だけじゃなく、その「平均」自体が誤用かな。
家庭ごとの貯蓄額の平均とかも。
510 :
132人目の素数さん :2008/08/05(火) 00:18:29
>>508 非統計的な問題ばかり。だから、このスレとは無関係。
例えば、電話調査なんかは全くダメ。出るのは主婦が多かったり、
若者は固定電話を持ってないしあっても捉まらない。
あと質問の仕方で答えを誘導したりするし、マスコミの世論調査はマユツバ
511 :
132人目の素数さん :2008/08/05(火) 06:51:00
「独立性の検定」と「独立」というのは違いますよ 間違えてるんじゃないかしら? 冷静にね
512 :
132人目の素数さん :2008/08/05(火) 08:58:24
>>498 補足すると、標準偏差/平均 だから単位はキャンセルされるよね。
514 :
132人目の素数さん :2008/08/05(火) 12:46:09
正規分布の母平均をμ、母分散を「σの2乗」と表すことにする。日本人成人男性の身長(単位はcm)μ=170、σ=7の正規分布、日本人成人女性の身長(単位はcm)μ=160、σ=5の正規分布で近似できるものとする。男女の割合が半々とする。 1)男女を合わせた日本人の身長の期待値を根拠とともに示すこと。 2)男女を合わせた日本人で身長が184cm以上となるおおよその確率を示せ。 1)E(x)=μであるから、 170×0.5+160×0.5=165 2)P(x≧184) =0.5×{(1/7√2π)×exp[-(184-170)の2乗]+(1/5√2π)×exp[-(184-160)の2乗]} =0.003856873 ≒0.0039 でいいんでしょうか?
515 :
132人目の素数さん :2008/08/05(火) 12:55:40
正規分布の母平均をμ、母分散を「σの2乗」と表すことにする。日本人成人男性の身長(単位はcm)μ=170、σ=7の正規分布、日本人成人女性の身長(単位はcm)μ=160、σ=5の正規分布で近似できるものとする。男女の割合が半々とする。 1)男女を合わせた日本人の身長の期待値を根拠とともに示すこと。 2)男女を合わせた日本人で身長が184cm以上となるおおよその確率を示せ。 1)E(x)=μであるから、 170×0.5+160×0.5=165 2)P(x≧184) =0.5×{(1/7√2π)×exp[-(184-170)の2乗]+(1/5√2π)×exp[-(184-160)の2乗]} =0.003856873 ≒0.0039 でいいんでしょうか?
516 :
132人目の素数さん :2008/08/05(火) 15:57:12
日本語で書かれたMCMCに関する本で定番と言えば何でしょう?
標準偏差10、平均55点のテストで5点だったら偏差値0ですよね?
518 :
1stVirtue ◆.NHnubyYck :2008/08/05(火) 18:13:11
正規分布関数は0にならないよ。
ごめんなんでもない。
>>517 理論上はそうなるな。そんなテストは521だが。
524 :
132人目の素数さん :2008/08/06(水) 14:45:50
5、ある製品を20個まとめて箱に詰めている。製品1個あたりの重量(g)はN(100,16)にしたがって分布しており、箱は中身が空の状態で1箱あたり、N(300,80)に従って分布している。 1)製品20個を詰めた状態での箱の重量は1箱あたりどのような分布に従うか述べよ。 20×N(100,16)+N(300,80) =N(2300,400) 2)製品20個を詰めた箱の重量が2340g以上になる確率を求めよ。 xがN(2300,400)に従うので、 P={X≧2340}=P{U≧(2340-2300)/20} =P{U≧2} =0.0228
525 :
132人目の素数さん :2008/08/06(水) 15:02:50
6、N=10 人 の患者に薬剤を投与した。副作用の母発現率(π)が0.25と予想された。副作用の発現数を表す確率変数をXとする。 1)母発現率 πの推定量を示せ。 条件より、0.25。 2)母発現率 πの推定量の期待値と分散を示せ。 E(x)=10×0.25 =2.5 V(x)=10×0.25(1-0.25) =1.875 3)Xの第一四分位数を示せ。 分かりません・・・
526 :
132人目の素数さん :2008/08/06(水) 15:05:01
7、1万人にA、B2種類の癌検診を行い、その後の追跡調査から次のような 結果が得られたとする。 検診A 癌 正常 計 検診陽性 50 10 60 検診陰性 9930 10 9940 計 9980 20 10000 検診B 癌 正常 計 検診陽性 4990 20 5010 検診陰性 4990 0 4990 計 9980 20 10000 1)検診Aのαエラーとβエラーの大きさを求めよ。 αエラー 10/20=0.5 βエラー 10/20=0.5 2) 検診Bのαエラーとβエラーの大きさを求めよ。 αエラー 20/20=1.0 βエラー 0/20=0 3)検診AとBのいずれかを受けるべきか考えを考察せよ。 分かりません・・・ 御忙しい中、非常に申し訳ないですが、回答していただけたら光栄です。
(母のストレス)×(妹のストレス)×(父のストレス)×9990 =俺のストレス
528 :
132人目の素数さん :2008/08/06(水) 18:27:00
0.01×0.01×0.01×9990 ≒0.01
確率変数Xにおいて 分散が V[X] = E[( X - E[X] )^2] となるのはわかるのですが なぜソレが V[X] = E[X^2] - E[X]^2 と等価になるかわかりません。 式の変形によってわかるものなのでしょうか?
>>529 式の変形でわかる。E[X] は定数なので E[ E[X] ] = E[X] などとなることを考慮して
E[(X - E[X])^2] = E[X^2 - 2 X E[X} + E[X]^2] = ... と展開していく
ここは夏休みの宿題スレかよ
533 :
132人目の素数さん :2008/08/10(日) 21:38:57
このスレレベル低すぎねぇ?
>>533 宿題丸投げも多いが、スレの最初から見るとそうでもないやり取りもある。
535 :
132人目の素数さん :2008/08/10(日) 23:38:24
フラクタル次元のスペクトラムを使った時系列解析ってあるのかしら 英文でもいいからあったら紹介して
536 :
132人目の素数さん :2008/08/11(月) 16:30:03
>>535 あるよ
検索すれば沢山出てくる
複雑系なんてやるのは研究できない馬鹿ばっかり
やめといたほうがいい
537 :
132人目の素数さん :2008/08/13(水) 00:02:27
グループが N 個あり、 各グループに対して(多変量の)データを取ります。 ここから特徴量を抽出したいと考えています。 思いついた方法は2つありますが、何だか微妙です: (1) 各グループに対して取ったデータについて独立に主成分分析する。 これだと、それぞれの第 k 主成分が同じものを表しているとは限りません。 (2) 全てのグループのデータをまとめて一発主成分分析する。 これだと「グループ」という情報が捨てられるか、もしくは 「グループ」という情報に引っ張られてしまいそうです。 このようなことをする場合の定番手法は何かありますでしょうか?
538 :
132人目の素数さん :2008/08/13(水) 00:37:44
人口の増減を予測するときはどんな計算を使うのですか?
540 :
132人目の素数さん :2008/08/20(水) 17:22:56
質問させてください。 複数のグループの母平均の差が有意であるかどうかをチェックする問題で、 グループ内の分布が正規分布に従っているなら Tukeyの検定やDunnettの検定などのパラメトリックな方法、 正規分布に従わないならSteel-Dwassの検定やSteelの検定などの ノンパラメトリックな方法を使うと思いますが、 分布がポアソン分布に従うとわかっている場合の母平均の比較は どのように検定すればいいのでしょうか? TukeyやDunnettのポアソン分布版のようなものがあるんでしょうか? それともノンパラメトリックの方法でやってしまっていいんでしょうか?
541 :
132人目の素数さん :2008/08/21(木) 17:05:14
「ポアソン分布」という情報を使うのなら尤度比検定だろうね
それで多重比較はどう行うかだな。Holmの方法か。
Shiryayev-Robertsの変化点検出について簡単に教えてください
544 :
132人目の素数さん :2008/08/22(金) 19:25:51
545 :
132人目の素数さん :2008/08/22(金) 19:33:20
本人が複雑になっちゃうのね。
546 :
132人目の素数さん :2008/08/22(金) 19:37:29
複雑系じゃなく複雑係ってわけか
547 :
132人目の素数さん :2008/08/24(日) 15:41:25
まじめに勉強する気力がなく複雑系に逃げました 恩師にも知り合いの統計学者の方にも 随分と反対されました 何も価値はないから、とまで言われました 正直いいまして自分自身でも意味不明ですが わかったふりして実証研究などやると 論文はacceptされますよ 計算はソフトを購入して行いました(高いです) 実際には全く役に立ちませんが 博士号取る目的にはお薦めです
548 :
132人目の素数さん :2008/08/24(日) 16:47:15
結局分からなかったから言い訳したいだけでしょ
549 :
132人目の素数さん :2008/08/24(日) 20:02:58
550 :
132人目の素数さん :2008/08/24(日) 20:52:14
なんだかわからないから複雑系なんだよ わかってしまうようなのは単純系
551 :
132人目の素数さん :2008/08/28(木) 02:40:48
密度関数の2乗を定義域の上で積分したものって、 何か特別な名前がついてますか? そして、この値に何か意味ありますか?
552 :
132人目の素数さん :2008/08/28(木) 16:36:29
グレイモデルって使えるんスか
>>551 逆にどういう場面で出てきたのか知りたい。
554 :
132人目の素数さん :2008/08/28(木) 20:22:27
>>553 カーネル密度関数推定に用いるwindow widthの理論値に、
カーネルの2乗を積分したものが含まれてます。
これが何を意味してるのかと。。。
555 :
132人目の素数さん :2008/08/29(金) 00:27:42
質問させてください。 独立で同一の正規分布N(μ,ρ2)に従うX1,・・・,Xnで帰無仮説:H0=160、対立仮説:H1=165の検定を行うとする。 有意水準が5%の時、第二種の過誤を0.05以下にする標本数はどのようにしたら求められるのでしょう? (ρ2=15です)
556 :
132人目の素数さん :2008/08/29(金) 02:58:57
質問させて下さい。 5水準・2水準・2水準・4水準の4属性を直交表を使って割り当てたいのですが、 水準の数がバラバラのためにやり方がわかりません。 調べたところ、5水準の直交表を使って余ったところにはその属性においてより一般的な水準を あてはめれば良いとする事例がありましたが、この操作で直交性は保たれないのではないでしょうか? どなたか教えていただければ幸いです。
557 :
132人目の素数さん :2008/08/29(金) 03:58:22
>>554 よくわからんけど、多分、二乗誤差関数を与えるため?
その評価のため積分するんじゃないの?
>>555 H0=じゃないだろう。H0:μ=160か?標本平均は?問題文は正確に書いて。
560 :
555 :2008/08/29(金) 20:49:35
すみません、仮説の設定に関してはご指摘の通りです。 帰無仮説H0:μ=160、対立仮説H1:μ=165です。
561 :
132人目の素数さん :2008/08/29(金) 22:41:18
統計全く無知です、一つ質問があります。畜産業なんですが500頭の重量をしるためには何頭の標本を抽出したら正確な重量が求められますか?精度の求め方も併せて教えてください。
>>560 H0が正しい条件の下での検定統計量の式から標本平均を標本数nを用いて表す(有意水準5%で右側検定)。それを今度はH1が正しい条件の下での検定統計量の標本平均に代入して、第2種過誤の確率5%のときの検定統計量の値-1.645と等しくなるようなnを求める。
>>556 もちろん直交性は保たれませんよ。参考にしたところにはそう書かれていませんでしたか?
564 :
555 :2008/08/30(土) 01:09:39
分かりました、有難うございました。
565 :
556 :2008/08/30(土) 02:38:28
>>563 書かれていませんでした。
このような場合どのようにして割り付けすれば良いのでしょうか?
>>565 方法がないから擬水準使うんじゃないの?
直交性を諦めるか、4水準に改めて実験するしかないのでは?
あるコインを200回投げて 前半100回(表,裏)=(60,40) 後半100回(表,裏)=(40,60) だったとします このコインの表と裏が出る確率は半々か?ということをカイ二乗検定で評価できると思うのですが, どのように評価すべきですか? 1. 合計して(100,100)の結果について適合度検定を行うとχ^2=0,自由度1で100%となり,このコインの表と裏が出る確率は半々である 2. 前半100回と後半100回について2x2独立性検定を行うとχ^2=8,自由度1で0.47%となり,前半100回と後半100回の結果は同一ではない? 3. (60,40)と(40,60)の結果について(50,50)と適合度検定を行い, χ^2=(60-50)^2/50+(40-50)^2/50+(40-50)^2/50+(60-50)^2/50=8,自由度2で1.8%,1%有意水準であればこのコインの表と裏が出る確率は半々である など 単純に合計で評価すべきか、前半と後半に分けて評価すべきかがよく分かりません。
568 :
132人目の素数さん :2008/08/31(日) 22:24:19
569 :
132人目の素数さん :2008/08/31(日) 22:46:58
>>561 その500頭がどんな集まりかにもよるけど、
一般には標本調査論と呼ばれる専門分野で扱われる結構複雑な問題。
雰囲気だけ言うと、、、
例えば工業製品500箱をトラックに積むために、総重量を推定する場合を考える。
全部同じ製品なら、1箱の重量を測って500倍すれば終り。
軽重差のある2種の製品なら、軽い方と重い方を各々1箱測り、各個数を掛けて足す。
牛の場合には個体差も大きいので、各グループ(雄雌、年齢とか)に対して1頭ではなく
個体差の度合い(=群内分散)を考慮した頭数を調べるのが最適。(ネイマン配分)
精度は下がるが、各グループの頭数に比例した頭数を調べる方法もよく使われる。(比例配分)
いずれにしても、精度を求める式はかなり複雑で、分散情報を必要とする
>>567 2.と3.はどう違うの?3.の自由度2というのはどこから出てきた?
>>567 2.と3.でやりたいことはなんとなく分かったけど、3.の自由度2というのは
どこから出てきたのか引っかかる。
2.は前半後半と裏表の出方が無関係であることを調べたい、
3.は前半の表、裏、後半の表、裏のそれぞれの出方について出る確率が1/2であるかを
調べたいということだろう?自由度が2というのは?
>>570 ,571
数字にあまり意味はないのでちょっとずらすと
前半100回(60,40)
後半100回(39,61)
2は前半100回と後半100回の結果は同じかどうか?という視点で
観測度数O
60 40 100
39 61 100
99 101 200
期待度数E
49.5 50.5 100
49.5 50.5 100
99 101 200
についてχ^2=((O-E)^2/E)=8.82 横の合計100回と縦の合計99,101回に拘束されるので自由度1 →0.30%
3は前半100回と後半100回いずれもはコインが出る確率は半々というのを期待度数として
期待度数E
50 50 100
50 50 100
100 100 200
についてχ^2=((O-E)^2/E)=8.84 横の合計100回は拘束されますが、縦の合計は99,101回に拘束されないので自由度2と考えました
自由度2→1.20%
ちなみに自由度1→0.29%
駄目でしょうか?
あと、この場合は前半100回と後半100回に分けてますが,分けて評価するべきだと 50回ずつの4ブロック 40回ずつの5ブロック 20回ずつの10ブロック 50回と150回の2ブロック とかに分けて評価することもできちゃうわけで。 また,ブロックの分け方は無数にあるので,その全部の場合について検証しないといけないのでは?と考えてしまって、 そうすると,分け方のうちひとつでも確率が低くなる場合があれば,そこを取り出して「確率的に発生しにくいことが起きてる」と言えちゃうような気がして。 こんがらがってきてしまいまして何かアドバイスをいただけたらと
>>573 何か難しく考えすぎてる気がする。そもそも絶対ブロックに分けなきゃいけない理由もよく分からないし。前半と後半で投げた人が違うとか?2の2×2分割表の自由度も普通に(2-1)(2-1)=1でいいんじゃないかな。
2. H0:前半と後半で表裏の出方が等しい(半々であるかどうかは問わない) 3. H0:前半後半共に表裏が半々ずつでる m×nの分割表の自由度は(m-1)×(n-1)としてしまうと、200回試行して、表と裏は半々か?を検定するときに 観測度数O 99 101 200 99 101 200 で1×2の分割表になって,自由度(1-1)×(2-1)=0になってしまいませんか? かなりおかしな仮説ですが、前半は半々、後半は6:4という仮説を立てることはできますよね? 期待度数E 50 50 100 60 40 100 110 90 200 前半の表が出る回数を決めても、後半の表が出る回数は自動的には決定されないわけで、(縦の合計が拘束されない) 前半の表が出る回数と後半の表が出る回数の2つの変数が決められるので自由度2と考えたのですが 2.の場合は前半の表が出る回数を決めると、後半の表が出る回数も決まる(縦の合計が拘束される)ので 変数は1つしか決められない→自由度1 なので、独立性(前半と後半は無関係か?)を検定する場合は(m-1)×(n-1)自由度で、 適合度(前半と後半は共に半々の確率で表裏が出るか?)を検定する場合はm×(n-1)自由度と考えたのですが 難しく考えすぎですか
H0:前半と後半で表裏の出方が等しい(半々であるかどうかは問わない) (2.) H0は棄却(0.3%) 何らかの理由により前半と後半の表裏の出方が等しくない→この結果からは表と裏が半々かどうかは検定できない H0:表裏が半々ずつでる 200回合計(100,100)の場合、H0は採択(100%) (1.) → 表と裏が出る確率は半々である 前半後半に分けて考えると、H0は棄却(自由度1として0.3%) (3.) → 表と裏が出る確率は半々ではない と完全に真逆の結論になるのでわけが分からなくなっているのです ブロックわけをしなければいけないという強迫観念は極端な例を挙げると 表50回連続→裏100回連続→表50回連続 200回を1個のブロックとすると(100,100) →採択 100回ずつ2個のブロックにすると(50,50)と(50,50) →採択 50回ずつ4個のブロックにすると(50,0) (0,50) (0,50) (50,0) →棄却 ということになるわけで、これは極端な例ですが、 一見マトモそうにみえるデータも適当なブロックに分割するとありえない部分が出てくるかもしれないので 全部のブロックを調べなければ、どこかのブロックで棄却されるところがでてくるのではと 1回寝て頭冷やしてきます
自由度というのは平均値の制約だと考えたらよい。適合度検定だと、例えばサイコロの目の出方が同様に確からしいか調べたいとき、1×6分割表作るけど、自由度は0じゃなく5.
すみません。質問です。 回帰分析をやっているのですが、母集団からサンプリングを行わず、 100%の人々に調査票を配布して、100%のヒトから回答を得た場合、 回帰分析の係数の推定値を検定する必要ってあるのでしょうか? 素人考えですが、悉皆調査であれば、母集団との関係を問う必要がないため、 回帰分析に限らず、検定の意味がないと思っているのですが・・・。
579 :
132人目の素数さん :2008/09/01(月) 23:29:40
>>578 「使わない回帰式」ならそういう解釈もあり得るが、「使うための回帰式」では間違い。
なぜなら、従属変数のデータがあるのに、回帰式を使って予想したらアフォ。
従属変数のデータが無い状況だから、独立変数のデータを手掛かりに予想する。
つまり、「データが無い状況に回帰式を適用する」ということは、
考えている「母集団」の範囲がもっと広いことを意味している
セイバーメトリクスのような分析手法を使ってる他のスポーツって何かあるかな?
581 :
132人目の素数さん :2008/09/04(木) 22:24:22
掲示板いつも参考にさせていただいています。質問させてください。 ポアソン分布にしたがう乱数で、例えばRのrpois()などで、100個 の乱数を発生させたとします。ポアソン分布は期待値=分散になるので、 乱数の平均値を「分散」と比較すると等しくなると思います。 このとき用いる「分散」の値はは標本分散ですか?、それとも不偏分散ですか? 教えていただけないでしょうか?よろしくお願いします。
>>581 ポアソン母集団の推定や検定ってことかな。
それだったら、通常の推定検定なら標本平均を母平均=母分散の
推定値として用いるから、標本分散とかを算定することはないと
思うけど。
583 :
132人目の素数さん :2008/09/05(金) 00:42:18
585 :
132人目の素数さん :2008/09/05(金) 01:01:07
質問させてください。 板2枚を組み付けてその厚さを3σ管理するとします。 2枚の板とも正規分布にのっとるものとする。 板A:中央値10mm 目標3σは2mm 板B:中央値10mm ただしこちらは3σ管理をせずに 全数検査で実力値+/-2mm以上のモノは不良品として排除 (このとき不良率は32%とします。要は偏差σ(2mm)以上の部分は不良として排除します) この2枚の板を組み付けたとき予想される中央値は20mmですが、 3σはどのような値を持つのでしょうか? もし、板Bが3σ管理されていた場合は、答えは正規分布の加法性ですむと思うのですが。
586 :
132人目の素数さん :2008/09/05(金) 06:02:01
来月上旬に、多変量解析の無料公開講座が開催予定のようだね。
統計数理研究所公開講座 多変量解析法【講義レベル:初級】
日時 10月1日(水)〜3日(金)10時〜16時 (15時間)
講師 清水 信夫(統計数理研究所)、馬場 康維(統計数理研究所名誉教授)、今泉 忠(多摩大学)
会場 統計数理研究所
定員 80名(先着順)
http://www.ism.ac.jp/lectures/20h.html
588 :
132人目の素数さん :2008/09/05(金) 20:35:56
>586 ありがとうございます。 追加の質問させてください。 板Aの計測では3σは2mmとなりました(n=30枚計測)。 既知の厚さ10mmを計測したとき計測誤差の3σが2mmだったとします(n=30回計測)。 板Aの計測の際にも計測誤差が存在します。 つまり、板Aの厚さ計測結果による3σには計測誤差の3σが含まれた形で存在します。 この板Aの厚さの3σと計測誤差の3σをF検定で評価したいのですが この種の問題では、板Aの厚さ計測と計測誤差は独立だと言えるのでしょうか? もし言えるとするなら、理由も教えていただきたいです。
589 :
132人目の素数さん :2008/09/05(金) 21:15:49
>>588 >板Aの計測では3σは2mmとなりました(n=30枚計測)。
>既知の厚さ10mmを計測したとき計測誤差の3σが2mmだったとします(n=30回計測)。
この数値だと、もしも真の厚さと計測誤差が無相関(または独立)なら、
真の厚さのバラツキがゼロになってしまうよね。
もしも真の厚さのバラツキがゼロでないなら、真の厚さと計測誤差の間に
強い負の相関が存在することになって、
「おまいなんかヘンな測り方やってね?」と言われる。
>この種の問題では、板Aの厚さ計測と計測誤差は独立だと言えるのでしょうか?
計測方法によるでしょ。統計的には、相関があっても構わないわけで、
Var( X + Y ) = Var(X) + Var(Y) + 2Cov(X, Y)
と、計算式に共分散が加わるだけの話。
要因Aについて、例えば水準3つふってA1,A2,A3とし、等分散で無いからと 総当りでWelchのt検定をすると検定の多重性の問題が生じるというのは 判る気がするのですが、(気がするというレベルの理解度です。) 大きい製品L、中製品M、小さい製品Sの従来品1、新製品2として (L1,M1,S1は等分散で無い。) 各、L1,L2を独立2標本t検定、M1,M2を独立2標本t検定、S1,S2を独立2標本t検定、 Sは有意でなかったが、L、Mは有意なので新製品は性能が向上している 等と考えるのは多重性の問題が生じますか? 少なくとも各帰無仮説に矛盾は無いように思うのですが?帰無仮説が棄却される確率 が変化してしまうでしょうか? 教えてください。長文すみません。
>>590 どんな場合に新製品の性能が向上していると結論づけるかだな。
たとえば、両側の検定結果で「有意でない」「有意である(新製品の方が優れている)」「有意である(新製品の方が劣っている)」
に分けるとする。そこで1つ以上の検定で「有意である(新製品の方が優れている)」となり、残りは「有意でない」の場合のみ
新製品の性能が向上していると結論することにしたら、各々の検定の有意水準が0.05で各検定が独立ならそのどれも差がないのに
その結論に至る確率は0.069となり、多重性を考慮していない影響が出ている。
一方、2つ以上の検定で「有意である(新製品の方が優れている)」となり、残りは「有意でない」の場合のみ新製品の性能が向上している
と結論するのはその確率が0.0009で超保守的。
592 :
591 :2008/09/07(日) 00:22:30
>>591 計算間違いで2つ以上の場合の確率は0.0018だった。
591様 正直、おっしゃっている計算結果がどう導き出されているのか理解できないのですが、 「各検定が独立」でも「その結論に至る確率は増加し、多重性を考慮していない影響が出ている。」 事が判りました。 まずは確率について勉強してみます。ありがとうございました。
>>593 Excelなら簡単に計算できますよ。
それぞれ結果が3区分なので3^3=27通りの計算をするだけです。
両側検定で「有意でない」が0.95、「有意」のそれぞれが0.025です。
595 :
585 :2008/09/09(火) 20:10:50
>589 ありがとうございました。 585を畳み込み積分を行っていて気づいたのですが、 もしかすると、互いに独立な正規分布と任意の確率分布の和は 必ず正規分布になるのでしょうか?
596 :
132人目の素数さん :2008/09/09(火) 22:47:13
597 :
585 :2008/09/09(火) 23:00:27
>596 そうすっね、全然ならないですね。 再計算して分かりました。
それぞれpの異なる二項分布B(n, p_i)に従う確率変数X_iの 和Y=ΣX_iの分布関数P(Y > y) > 0.95となるようなnを求めたいのですが、 いまは正規分布N(Σn p_i, Σn p_i (1-p_i) )で近似して計算してます。 この近似は妥当でしょうか?(シミュレーションの結果はまずまずです) 私が使っている範囲で、pは0.01〜0.50程度、nは1〜50程度です。 また、これを近似せずに二項分布のまま計算できますか? 手計算でなくコンピュータを使った方法でも構いません。
蛇足かもしれませんが、
>>598 に具体的なシチュエーションを与えると、
当たる確率p_iのそれぞれ異なる複数のクジi = 1,...,Nをn回ずつ引いて
あたりクジが合計y個以上になる確率が95%以上になるには
nをいくつにすればよいか。って感じです。
600 :
132人目の素数さん :2008/09/11(木) 10:23:10
全国から無作為抽出した3600世帯について、年間の米購入量をしらべたところ、平均値103.0kg、標準偏差は35,kgであった。全国の1世帯あたりの平均米購入量を信頼度95%で確定せよ。
>>598 X_iがいくつあるか書かれていないけど2,3でない限り
正確な計算は組み合わせが爆発して無理じゃないか。
(単純に考えてn=50だとX_iが5つあれば51^5=345025251通りの
計算をしないと正確じゃないからね。)
その正規近似はnがある程度大きいのなら妥当でしょう。
n=1とかだとどのぐらいずれるのかは何とも言えませんね。
くだらない質問でごめんなさい。 量的データ であり質的データであるモノってなんですか?
603 :
598 :2008/09/11(木) 13:00:04
>>601 レスありがとうございます。
抜けてましたが、X_iは多くても5つ程度です。
nの目安を確認するだけの目的で、それほど精度を要する
ものでもないのでこのまま行こうかと思います。
統計とは全然関係ない学部なのに統計を使わなくてはならなくなり困っています。 男女n人ずつ実験データを取って、その結果に男女差があるかという課題なのですが… 結果の評価方法は満点が36点で0点までの減点方式です。 一応「図形雑学 統計解析」という本と格闘してはみたものの、 帰無仮説と対立仮説、有意水準あたりの大体の定義しかわからず。 とりあえず有意水準は5%だな、とかもうそういうレベル。 5%より大きいことを示せばよいのか、小さいことを示せばよいのかわからない。 しかも来週には教授の前でプレゼン、とかもうそういうレベル。 教養で統計とってない俺涙目。 誰か助けてください。 ちなみに今のところn=10なんで、無理やりな統計になりそうですが そもそもノンパラメトリックの方が良いのかそのあたりも教えてください。
605 :
132人目の素数さん :2008/09/11(木) 16:40:23
>>604 >統計とは全然関係ない学部
いまどきデータを使わない「学部」ってあるのか?
文学でも作家毎の使用語句の頻度とか調べるし、絵画なんかは
スペクトル解析まで使う。
「学科」の間違いにしても、そんな学科は哲学科と数学科wぐらいでわ
606 :
604 :2008/09/11(木) 17:31:34
>>605 確かにそうですね。
ただ、データを集めるだけなら何度もやってきたのですが、
俺も俺の周りの人も本格的な統計をやったことがないので普通に困っています。
(せいぜい平均や標準偏差程度)
メディアンなんて一昨日初めて聞きました。
教授に聞いても「教科書読め」の一点張りで。
そりゃあ、半年くらいあればなんとか知識にすることは可能でしょうが、プレゼンは来週…
>評価方法は満点が36点で0点までの減点方式 をエスパーすると、ノンパラのが良いのかな。 やり方複数あるし、検出力下がるけどね。 「統計学自習」でググってお勉強するか、 先輩からファイルを譲ってもらって手を入れる。(バレるけどね)
>606 数理統計を理解するのは無理でも、統計だけの知識なら1週間もかからんよ。 仮説検定の例なんてネット上にいくらでも転がっている。 分析する対象に近いものがググってヒットすればそこからパクればその場はしのげるよ。
>>607 おいおいn=10だって言ってるぞ。
ノンパラなら検出なんてできんやろ。
たいした大きさのデータやないんやから
ここにさらしたら誰か分析してくれるかもね。w
>>604 一番無難で簡単なのは男女ごとに点数の平均、分散を計算してウェルチのt検定かな。ノンパラでやりたいなら男女で点数の順位つけて順位和検定とか、アンケート項目ごとの差取って符号付順位和検定とか…。ググれば公式出るから意味分からんでも何とかなるかも。
611 :
604 :2008/09/11(木) 23:41:51
たくさんのレスありがとうございます。
他のスレでこんなにもらったことないです。泣きそうです。
>>607 統計学自習でググって(ちょっとだけですが)勉強してみました。
自分としてはマン・ホイットニーのU検定という結論に至ったのですが、
>>610 さんのレスをみるとどうもその方向で良いみたいですね。
男と女は対応がなくて、実験結果の数値は順序尺度ですよね?
ノンパラメトリックはサンプル数が少ないときに使用するとどこかで
読んだ記憶があるのですが、
>評価方法は満点が36点で0点までの減点方式
というところからノンパラメトリックが導き出される理由を教えていただけるとありがたいです。
>>608 一応それも考えたのですが、ググっても似たような例が見つかりませんでした…
>>609 「検出できない」というのは…?
あとちょっと
>>604 の質問のところで勘違いをしていました。
できるだけ的確なご指摘を頂けるとありがたいので、実験について次のレスでもう一度書きたいと思います。
ちなみに実験のデータは大学のパソコンにあるので今は載せられないです。
明日以降で良ければ…いや、でも自分でやった方が今後のために良いのかもしれませんね。
>>610 ウェルチのt検定はサンプル数が少なくても成り立つのでしょうか。
しかも実験結果は正規分布じゃない気が…ちょっと明日調べてみます。
順位和検定=マン・ホイットニーという認識で良いですか?
612 :
604 :2008/09/11(木) 23:55:44
実験について書きます。 実験には2種類あり、仮にAとBとすると、 1)Aを最初にやり、次にBをやるグループ(男5女5) 2)Bを最初にやり、次にAをやるグループ(男5女5) が存在します。 実験AとBはどちらも記憶の検査で、記憶の正確さが点数化され、タイムも計ります。 満点はどちらも36点、減点方式というところも一緒です。 ただし、最初にやる実験(グループ1だとA、2だとB)は記憶の検査ということを知らせずにやります。 2回目は事前に知らせます。 これらのデータを出して、そこから統計を使って何かを導き出せという課題です。 自分が考えたのは「AとBの難易度を、両グループの1回目の結果で比較する」のと、 「A、Bそれぞれにおいて男女間で結果に差がでるか調べる」というものです。 今回は後者について質問させていただきました(まあ、前者のやり方もさっぱりわかりませんが)。 男女差を調べる場合は、1回目の結果だけで比較したいのでそれぞれ5人です。 グループの分け方から、おそらく学習効果についても調べさせたいのでしょうが… あとはタイムですが、これは男女差と同じやり方でできないかな?と思っています。 ちなみに実験自体すべて終了しているわけではなく、現在すべてわかっているのは グループ1の1回目(実験A)の結果くらいです。実験と同時並行でプレゼンがあるので、 来週の頭にグループ2の1回目も出てしまうと、男女差に加えて 実験AとBの難易度についても比較しないといけなくなります(自分で考える課題なので 調べなくても良いのですが、どう考えても成績は悪くなるでしょうね…) 長文になってしまいました。すみません。
>>612 あちゃーだいぶ複雑やな。
点数の同順位がほとんどないならこりゃあ普通分散分析するやろな。
要因はAB、順番、性別として。
ただ人には対応があるのでそのことも考慮しないといけない。
そんなの自由に統計ソフトが使えるんじゃなけりゃあ無理やな。
614 :
604 :2008/09/12(金) 01:12:00
>>613 もちろんすべてを統計学的に処理するのは無理(だしたぶん期待されてない)なので、
要素(という言い方が正しいのかどうかわかりませんが)を抜き出して
1)Aにおける男女差、Bにおける男女差があるか(1回目の結果だけ使用)
2)AとBの難易度に差があるか(1回目の結果だけ使用)
3)記憶検査であることを知っているか否かで差があるか(グループ1と2のAの結果の比較、1と2のBの結果の比較)
の3つを軸に調べるくらいで良いかなと考えています。
いずれにしてもそうやって区切ると1)では男女のサンプルがそれぞれ5人、
2)と3)では実験AとBのサンプルがそれぞれ10人、ということで
1)に関しては「数が少ないのでノンパラ」という方向で順位和検定、
2)と3)に関しては順位和検定かt検定、ということで良いでしょうか?
こうすれば対応がある要素はないですよね?
>>612 タイムは、おそらくポアソン分布になる。
616 :
132人目の素数さん :2008/09/12(金) 21:22:46
初心者の質問ですまん 年代別で表示される出生率とか離婚率のデータをエクセルに打ち込む時に それぞれの変数の始まる年代がバラバラだったらどう打ち込めばよいの?
中央の値にするとか
てか、それもうパラメトリックで扱いにくいので、 0,1,2とかで
619 :
132人目の素数さん :2008/09/12(金) 21:37:02
なんか難しいなwww バカで申し訳ないwww 0.1.2.3...って番号ふっていけばよいの? そしたら年号とか気にしないでよいかな?
>離婚率 なら、分割表かなと思って。 要因のタイトル(ラベル?)は適当で良いかなと。 違ってたてら、つぎのエスパーを待て。
621 :
132人目の素数さん :2008/09/12(金) 21:53:16
重回帰っていうのに使うつもりなんだけど、よくわからなくて・・・
>>616 打ち込み時にはとりあえず元のデータを生かすべきでしょう。
処理するときに変換なり換算なりすべきではないでしょうか。
例えば、最近は5年ごとの統計があるが、古い時代は10年ごとしかない、とか
そういうことだと思うけど、古い時代の分は前後のデータの平均で推定するなんて感じ。
>>621 がんばれ。
623 :
132人目の素数さん :2008/09/12(金) 22:02:17
624 :
132人目の素数さん :2008/09/13(土) 15:08:33
教えてください。 例えばルーレットなどで的中率が20パーセントの場合 続けて外れる確率は、どうやって計算すればいいんでしょうか。
625 :
132人目の素数さん :2008/09/13(土) 17:25:54
>>624 賭けた日のシーンを沢山頭に思い浮かべる。
そのシーン中80%は1回目が外れ。
その1回目外れシーンの中で、2回目に当たるのが20%外れるのが80%。
よって全シーン中2連続外れの割合は、80%の内の80%で、0.8×0.8 = 0.64。
同様にn連続外れの割合(確率)は、0.8 の n乗。
626 :
132人目の素数さん :2008/09/14(日) 19:30:22
よろしくお願いいたします。 Bland-Altman法を用いようとしているのですが、 系統誤差についての検討なんですが、系統誤差はbiasのことで、 これが小さければ小さいほど良いということでしょうか。 とりあえずPrismでbiasまでは勝手に計算してくれたのですが、そこから先が。。。 Bland-Altmanにおける系統誤差についての記述がなくて困っています。 よろしくお願いします。
627 :
132人目の素数さん :2008/09/15(月) 18:41:50
U検定やt検定の際、帰無仮説の棄却に使用するのはU値なり、t値の表だと 思うのですが、p=0.05と対応する値より小さいか大きいかだけでなく、 実際にその値がpでいうとどのくらいの数値になるのか、簡単に求める方法はありますか?
>>627 P値のことなら分布表で求めるのが一般的だね。
ああでも分布表から求まらない場合は、直接計算するしかないと思う。
>>629 すみません、できれば具体的な式、もしくは求め方を教えていただけると
有難いのですが…
例えばU検定でn1=n2=5、有意水準0.05、両側検定の場合、棄却限界値は2ですが、
実際の値が1(帰無仮説棄却)や、3(棄却されない)の場合、P値はどうなるのでしょう?
(今適当に考えたものなので、この例でなくても構いません)
本来ならば自分で勉強すべきところなのでしょうが、事情により時間があまりなく困っています。
ご教示いただければ幸いです。
>>630 密度関数を区間に∞とって積分するしかないような気がする。あんまり使ったことないけど数式処理ソフトや統計ソフトで計算できるんじゃないかな。手計算だとしんどいね。
順位和検定の場合だと大標本だと正規近似できるからP値は求まるけど、小標本だと順位和に対する組み合わせを考えないといけないからややこしくなると思う。
>>631 >>632 やはり簡単には行かないようですね。
そのことがわかっただけでも収穫です。ありがとうございました。
かなり抽象的な質問をします。 ある二つの独立な関数を与えます。 その関数は左右対称の鐘形の分布(正規分布とは限りません)をなします。 D1(x;μ1)とD2(x;μ1)と定義します。μは平均値(中央値)。D1,D2は同じ形状とは限りません。 ±∞でD1,D2ともに0になる。 この二つの単純な積によって新たな関数Dを作ります。 D(x;μ)=D1(x;μ1)*D2(x;μ2)です。 μ1<μ2としたときμ1<μ<μ2を証明したいのです(あくまで予想)。 また、D(x,μ)の中央値mはどこに位置関係は一意に決まるのでしょうか? 例えば、μ1<m<μ<μ2だとか、μ1<μ<m<μ2だとかです。
ちなみにD1,D2ともに-∞〜+∞の積分で収束するものとします。
すみません。 統計学については全くの素人なのですが、おうかがいしたいことがあります。 個体数N1の群Aと個体数N2の群Bが、あるものを利用している割合を比べて その割合に差が出たとき、その差が有意なものかどうかを検証するには、 どんな手法を使えばいいのでしょうか? キーワードだけでもいいので教えて下さい。
>>634 証明自体を考えるより例外がないか具体例で探してみたら?要は独立な確率変数の積の確率密度を考えればいいわけでしょ?具体的に一様分布の場合とかで考えてみたらどうでしょうか。
>>634 ごめん。収束条件忘れてた。じゃあ正規分布の場合とかで例外がないか探してみたらどうでしょうか。
639 :
132人目の素数さん :2008/09/21(日) 21:38:30
640 :
132人目の素数さん :2008/09/21(日) 22:34:43
>>637 >要は独立な確率変数の積の確率密度を考えればいいわけでしょ?
違うと思うぞ。なぜなら
>>634 >D(x;μ)=D1(x;μ1)*D2(x;μ2)
なので、意味的には、例えば、2人の体操選手の鉄棒演技の採点が
同点 x になる確率のような問題。
(左辺を同採点値 x の確率密度関数にするには、同点の確率で
割る必要があるけど)
で、
>>634 の平均値関係の予想は、正しいかどうかわからん。
一様分布同士や正規分布同士なら正しいし、
結果も一様分布または正規分布なので 中央値=平均値 だけど、、、
641 :
634 :2008/09/21(日) 23:44:20
>637 >640 要は鐘形の分布を抽象化して、そこから導き出される一般的性質がほしいのです。 鐘形の定義を明確にする必要はあるのでしょうが。 鐘形f(x)を定義する。 性質1:f(x-m)=f(-x-m)となるm∈xが存在する。 性質2:max(f(x))=f(m) 性質3:lim x→∞f(x)=0,lim x→-∞f(x)=0 性質4:∫f(x)dx (-∞,+∞)=c 要は-∞〜+∞の積分で値は収束する。 (性質5):連続な関数である。 以上の性質を満たすものを鐘形として定義する。 確率密度分布でなくてもかまいません。 何故、このようなことを考えなければならないのかといいますと。 今、検討中の確率密度分布の中に g(z)=Φ(A;z,σ)-Φ(-A;z,σ) (Φ:-∞〜A正規分布の累積密度分布、z:平均値、σ:標準偏差 という式が入ってきて困っているのです。 このg(z)自身は確率密度分布ではないことは承知ですが、形状としては上記に記した鐘形の性質をもつ関数になっていると思います。 考察している確率密度分布は f(x)=α*g(x)*φ(x;μ',σ')となっています(αは定数、φは平均値μ' 標準偏差σ'の正規分布)。 g(x)、φ(x)ともに鐘形です。 では、このf(x)の分布の平均値および中央値はどういう位置関係になっているのか? これが知りたいのです。 f(x)が確率密度分布になっているのは数値計算で承知済みです。
642 :
634 :2008/09/21(日) 23:56:40
もう一つ大事な性質を忘れてました。 性質6:f(x) < f(x+Δ) (-∞<x<m) , f(x) >f(x+Δ)(m<x<∞) 要はx=mまではf(x)の値は上り続けて、mを超えるとf(x)の値は下がり続ける。 あと、最後の文章に出てくるf(x)は鐘形を定義したときに用いているf(x)とは別物です。 下記文章におけるf(x)は鐘形を満たしません。 >考察している確率密度分布は > >f(x)=α*g(x)*φ(x;μ',σ')となっています(αは定数、φは平均値μ' 標準偏差σ'の正規分布)。 >g(x)、φ(x)ともに鐘形です。 >では、このf(x)の分布の平均値および中央値はどういう位置関係になっているのか? >これが知りたいのです。 > >f(x)が確率密度分布になっているのは数値計算で承知済みです。 > ちなみに一様分布と正規分布の畳み込み積分の結果は 正規分布にはなりませんが上記の鐘形の性質を満たします。g(z)はそれに近い形になります。
643 :
636 :2008/09/22(月) 08:34:05
>>639 ありがとうございます。
頂いたキーワードを元に頑張って調べてみます。
644 :
132人目の素数さん :2008/09/22(月) 15:06:26
>>641-642 書いてることが問題・用語・概念すべてワケワカメ(死語)
もっと整理して、他人の力を借りたい要点のみ記すべし。
そもそも、自分でやれないなら、すべきでない種の仕事だと思うが・・・
645 :
634 :2008/09/22(月) 15:13:55
>644 わかりました〜〜。 とは言え、誰もやらないからやるしかなくなったですけどね。 まぁ、こんな結果になるから皆やらなかったというだけかも知れんけども。
>>642 平均(\mu_1 < \mu < \mu_2) も、
mode (\mu_1 < m < \mu_2) も、
多分解けた。
共著希望w
っていうか誰か過去に解いてるんじゃ。
>646 素晴らしいですね。。。 共著ってwww私すでに研究者じゃないもんで、あなたの成果でいいと思いますよ。 単なるしがない銀行員っすよ(統計は専門じゃなかったどころか私は工学部でしたし)。 性質1や5を取り除いた広義の鐘形までやれる嬉しいでしょうね。 独立な和の分布では式では表すことができない形が多くて苦労します。 結局は強引に数値計算だけで済ましてしまいますが。 そこから色々な定理が生まれてきたら面白いでしょうね。 >っていうか誰か過去に解いてるんじゃ。 色々、専門書やHPを見る限りでは無かったです。 ただ単にそこまで重要視されていないだけかも知れません。
>>647 g(z)は正規累積分布関数Φの差だよね?これが釣り鐘型だという証明はできましたか?
g(z)=∫[-A,A],φ(x;z,σ)dx φ:正規分布関数 正規分布の対象性から性質1を導かれることは明白(ここは詳細に証明することはできなかったです)。 dg(z)/dz=d/dz∫[-A,A],φ(x;z,σ)dx =∫[-A,A],d/dzφ(x;z,σ)dx (微分と積分の交換については突っ込みどころですがとりあえず無視で) =∫[-A,A],-2(x-z))/σ*φ(x;z,σ)dx =-2/σ*∫[-A,A],xφ(x;z,σ)dx+z∫[-A,A],φ(x;z,σ)dx =z∫[-A,A],φ(x;z,σ)dx よって、z>0のときdg(z)/dz<0,z>0のときdg(z)/dz>0で、z=0ときg(z)=0で最大値をとる(性質2,6)。 A=<zのとき以下の不等式が成り立つ 2Aφ(z;-A,σ) < g(z) <2Aφ(z;+A,σ) lim(z→+∞),2Aφ(z;-A,σ) =0 lim(z→+∞),2Aφ(z;+A,σ) =0 よってg(z)=0(性質3) ∫[-∞,∞]g(z)dz=∫[-∞,∞]dz*∫[-A,A],φ(x;z,σ)dx =∫[-A,A]dx*∫[-∞,∞]φ(z;x,σ)dz =∫[-A,A],1dx =2A (性質4) 性質5に関しては分かりませんでした、おそらくは満たすはずです。 ぱっと計算なので間違いもあるはずです。すいません、こんな低レベルで。 とりあえず、性質1,5に対して明確になればg(z)は鐘形になっているはずです。
650 :
646 :2008/09/23(火) 23:53:10
>>646 なーんだ。
論文書いてる途中で出くわした問題ってわけじゃないのね。
道筋としては、
まず一様分布に関して命題を証明し、
次に、unimodal(性質6)かつ\muに関して対称な分布関数が
両端が\mu±a (aは任意の正数をとる)の一様分布(の定数倍)
の和(*)の極限として書けることを示す。
第三に、分布関数の加重和と、平均、median の関係に
ついて調べる。
あとは、無限和(*)と期待値の順序交換とかに気をつければ
解けるんじゃないかな。
大雑把でスマソ。
>>649 ざっと読んだだけだけど、やりたいことは大体分かりました。g(z)の場合は問題ないが一般的な釣り鐘だと性質6は微分可能性=滑らかについても示す必要性ありますかね。しかし銀行員でこういう議論に迫られる場面って研究リサーチ部門でも珍しいですね。てっきり論文だと思った。
652 :
132人目の素数さん :2008/09/24(水) 11:22:11
わかんないけど、微分可能性は多分必要ないんじゃね? もちろん元になる2つの密度関数 (密度関数でなくても積分が有限なら定数倍すれば良いだけ) について、平均値の存在とかは必要だけど。
653 :
132人目の素数さん :2008/09/24(水) 12:01:14
SPSSで二元配置分散分析を行ったところ、交互作用における結果が出ず、 「Satterthwaite法を使用して適切な誤差項は計算できません」という注意書きが 出たのですが、もっとも考えられる原因は何でしょうか?
654 :
132人目の素数さん :2008/09/24(水) 12:03:46
>>649 characterization unimodal distribution
とかで検索した方がいいなじゃないの?
Continuous Univariate Distributions, Vol. 1 (Wiley Series in Probability and Statistics) (Hardcover)
by Norman L. Johnson, Samuel Kotz, N. Balakrishnan
Continuous Univariate Distributions, Vol. 2 (Wiley Series in Probability and Statistics) (Hardcover)
by Norman L. Johnson, Samuel Kotz, N. Balakrishnan
とかも見た方がいいかも。
字がたくさんあって、よくわかんね。 要領よくまとめて。
658 :
132人目の素数さん :2008/09/27(土) 00:40:53
ここで質問していいのか分かりませんが、 スレ読んでて優しい方ばかりなので、甘えさせてください。 有効数字について質問です。 具体例をだします。 人口(千人)125257、面積(km2)377829で人口密度(人/km2)を求めると、 0.332・・・・・と続きます。 この場合の有効数字はなんでしょうか? そもそも有効数字がよく理解できていません。 講師が人口密度を出して、有効数字に気をつけて 書けとおっしゃっていたので・・・ どなたかご教授よろしくお願いします。
人口(6桁)面積(6桁)で 人口密度の計算を一回するだけなら、 7桁目を四捨五入で良いかもしれない。 県別に計算して、どうかするとかなら、 もうちょっと工夫したのが良いかもしれない。 PCを上手に使うことができれば、 (演算中の有効桁数の管理ができて、かつ適切なハードとソフトがあれば) 途中の演算の有効桁数を気にしないで、 最終の結果を、好きな桁で四捨五入したら良い。
660 :
657 :2008/09/27(土) 01:49:05
>>656 '08/09/26 23:01
のところ?
%だけなら計算できね、だが、
他の数字があるみたいなので、明日考えてみる。
661 :
132人目の素数さん :2008/09/27(土) 08:03:30
>>659 ありがとうございます。
ちなみに県別比較をしています。9つの県別比較なんですが、
どういう点に注意したらよいでしょうか・・・
よろしくお願いします。
ちなみに、エクセルでやってます
662 :
132人目の素数さん :2008/09/27(土) 22:32:13
663 :
132人目の素数さん :2008/09/28(日) 07:20:52
>>662 系列3 − 系列2 の各値を観測値として
それが平均 μ=0、標準偏差σの正規分布にしたがうと考えて t 検定
大学一年必修の統計学で完全に落ちこぼれたのですが、統計学を独学するにはどの参考書が良いですか? 超簡単で尚且つわかりやすい本、大学一年でならう統計学の範囲までカバーしているわかりやすい本、それ ぞれご教示お願いします。
666 :
657 :2008/09/28(日) 13:46:50
>>662 確かに有意差はあるかどうか微妙なところだね。
ちょっと逸れるけど、時系列データなので、有意差の前に、
それぞれの系列相関も調べておくといいかもしれない。
対象が時系列データでも比較時点が同一時点であればt検定使っても問題ないので
この場合はt検定で問題もないと思うよ。
668 :
662 :2008/09/28(日) 20:48:01
>>663 >>667 ありがとうございます
細かいデータは会社にあるので、明日からちょっといろいろやってみます。
中小企業で開発をやっていると、大学と違って教えてくれる人もなかなかいない
ので大変です。
670 :
132人目の素数さん :2008/09/29(月) 13:01:33
>>669 私の実感では、
同じ県内でも市区町村ごとに学力差はかなりあるので、
県ごとに集計したデータを用いて意味があるかどうかは分からないね。
興味があるので知りたいとは思うが。
671 :
132人目の素数さん :2008/09/29(月) 17:15:46
組織率との関連が出れば出たで「関連はあった」だし、 なければないで「組織率ではなく、熱心さだ」とか 何とでも言いくるめられる。つまり反証可能性ゼロ。 「逸脱しているデータを切り捨てる」だの「ほかの変数を加えて」という風に変数を増減するような 手法が許されるのなら、いくらでも実証は可能だと思うよ。 統計学スレではなく、オカルトスレあたりの方がいいのでは?
672 :
132人目の素数さん :2008/09/29(月) 17:54:41
外れ値の処理は問題だけど、多変量化は当然だろ。 パッと考えても、基本知能レベルの違い、所得差(塾・家庭教師)、 三次産業化(学歴影響度)、地区の受験競争度、、、とか、 教師の学校授業以外にテスト学力を決定してる要因があるから
>>673 過去レス読んだ?その手の質問は何度もあった気がするけど。目的も専攻分野も理解度も人それぞれだから、実際に書店行って自分で見て決める方がいいと思うよ。オーソドックスというか一般的なのを紹介することは可能だけど、合う合わないもあるしね。
>>672 多変量化というべきか、変数を複数投入するのは当然だとしても、
仮説に合わないからと言って、むやみやたらに変数を増やしたり、
その結果うまく行ったからと言って、別の年のデータに合わなくなったら、
今度は変数を削ってつじつまを合わすような「探索的」手法はよくないと思うのだが。
日教組の組織率がだめなら、日教組OBの教育委員数(そんなもんがわかるのかどうかは知らないが)を、
それもだめなら、国旗・国歌の実施率、それもだめなら・・・
とやっていけば、いつかは疑似相関なり、偶然なりで「実証」できてしまう。
>>674 ありがとうございます。
そうですか。ケータイなので、
>>1-10 まで読まずに質問してしまいすみません。
過去スレにて既出とのことですが、このスレにありますか?初代スレから前スレまで全部目を通したらいい
でしょうか。ネットカフェに行って見てみようと思うのですが。
>>676 だからネットカフェとかで調べるより実際に書店に行って自分自身で見た方がよいと…。何か根本的に違うな。自分で探してみて例えばこの本はどうですか?みたいな感じで他人の意見を聞くのは全然ありだと思うけど。
>>669 >本格的に、日教組と学力の関係を検証してみたいな。
経験的に学力との相関関係は難しい。
こっちの方が面白そう。
組織率の高いところと、青少年非行
まず近年行われた高校生の規範意識調査で、A「先生に反発することは自由」−日本79%、
米国15%。B「親に反抗することは自由」−日本85%、米国16%という結果が出ている。
抵抗と自由が道徳と教えた日教組教育の成果は、公立高校の入学式、卒業式等に自主行動
として、学校行事に対する集団反抗として現実化している。しかも重要なのは日教組の
加盟組織率が、学校における暴力行為(いじめ、学級崩壊、校内集団暴力)などの件数と
強い相関関係を示していると認められたことだ。さらに付け加えると、これは私が長い間感じて
いたことだが、学力低下との相関も十分に考えられることである。おそらく、文部省が近年中に
実施することを発表した全国規模の学力テストを厳しい管理下で行えば、はっきり証明し得ると
確信する。
ttp://www2.snowman.ne.jp/~tb-ryo/ron/no41.html 三重県教育界の異常さが明らかになったのは、『正論』平成十一年七月号(六月一日発売)
誌上の「全国高校教育偏向度マップ」においてであった。それによれば、日教組組織率
全国ナンバーワンの三重県は、入学式における国旗の掲揚・国歌の斉唱が全国でも最低の
レベルであることはもちろん、いじめ発生率・暴力行為発生率ともに全国第二位であることが判明した。
ttp://homepage1.nifty.com/1010/newpage0.htm
考えてみれば学力テスト至上主義もおかしいよな。 まずは忠孝一貫教育でなきゃ。国・社会に忠、親・社会に孝ね なんかまるで数学板っぽくないがw
680 :
132人目の素数さん :2008/10/02(木) 11:58:05
問題文が理解できないので、質問させてください。
http://kogolab.jp/elearn/hamburger/chap2/sec3.html で、信頼区間を求めるための「標本標準誤差」を求める公式。
標本平均の分散=(母分散/サンプルサイズ)=(不偏分散/標本数)
とありますが、母分散は標本の分散を求める時の割り算をN-1にする。
それをまた標本数で割るのが、「標本平均の分散」。
となると、「標本の分散」と「標本平均の分散」とは別物になるんですよね?
どんな意味になるのでしょうか?
よろしくお願いします。
>>680 >、「標本の分散」と「標本平均の分散」とは別物になるんですよね?
んと、それを言うなら、「1観測値の分散」と「標本平均(値)の分散」かな、、、
つまり、一回だけ測った値より、複数回測って平均求めた方が、精度が良い
つーアレのこと。以下のように「精度」は「値のバラツキ=確率分布の分散」で評価できる。
1回測った値の確率分布: 平均(期待値)=母平均、分散=母分散
複数回測った平均値の確率分布: 平均(期待値)=母平均、分散=母分散/測った回数
>>681 すごく分かりやすい説明ですね。
ありがとうございました。
683 :
132人目の素数さん :2008/10/04(土) 09:20:37
>>678 米国の公立高校がどういう状況にあるか知って言ってるのか?
校内暴力や校内レイプは日常茶飯事だぞ。もう、学校としてはとうに崩壊してるんだよ。
>>683 アメリカで校内暴力なんてあったらノータイムで警察がくるよ。
Xの確率分布が X 0 1 2 3 4 P(X=x)0.1 0.1 0.3 0.3 0.2 であるとき、Xの期待値と分散がわかる人いますか?
687 :
132人目の素数さん :2008/10/05(日) 09:15:15
主成分分析って何なの?
>>689 ラグランジュの未定乗数法と関係あるんですか?
>>685 難いな
このスレ住人のレベルじゃ無理や
>>690 制約つき最大問題に定式化すれば、未定乗数が固有値になるから、
関係あるとも言えるけど
どうも
695 :
132人目の素数さん :2008/10/08(水) 17:42:49
こんばんは。 質問があります。 対応のある1要因の分散分析における、平方和と平均平方の 計算方法を知っている方がいたら教えてください。
>>695 分かるけどちょっと言葉だと長くなりそうなんで、参考文献を。分散分析については東大出版会の「自然科学の統計学」が分かりやすいと思う。
よそでも多いみたいなんだが データ持ってるけど、分析できない データの特性を説明できない データをさらせ それはできない 〆切せまる とりあえず、字を埋めて済まそう 未来を予測すると、こんな感じ
698 :
132人目の素数さん :2008/10/10(金) 15:15:24
原点周りのk次モーメントを、平均周りのモーメントのみで表示した場合、 一般的にどうあらわされますか?一般性を求めようとして、 5次で断念したのですが。
699 :
132人目の素数さん :2008/10/10(金) 17:34:25
SEMについて勉強中のもんです。 生データ: N行m列 各行がサンプルを、各列が変数を表しており、そのうち第1列には最終的な目的変数(?)としたい変数xがあるとします 加工済データ: n行m列 xの値で階級をn分割し、全m変数を階級平均に置き換えたデータ とりあえずSEMをやってみるためのパス図を描いたり、大雑把に傾向を見たいので相関係数行列を作ったりしながら思ったのですが もしかして、階級平均のデータはSEMに不適当ですか? 「あちらを立てればこちらが立たず」的な2条件を「両立」させることが「高いレベルでの目的達成」につながるという場合に、 「あちら」の影響が「こちら」の影響よりとても強いために『「こちら」を犠牲にして「あちら」を立てるのがよい』となってしまいそうに思うのです。
>>699 SEMというんだからxを単に重回帰で説明するんじゃないんだよな?
そうすると単にxで階級分けして平均を取ると他の変数は関係がつぶれてしまうん
じゃないのかな?
>>698 おそらくn次ごとに展開したりして式変形するしか原点回りモーメント-平均回りモーメント間の関係式を求めることはできないと思う。n次の場合の一般的な関係式を代数的に記述することは難しいんじゃないかな。
>>698 なおn次の平均回りモーメントを原点回りモーメントで表そうと言うのなら、普通に2項定理で表すことになるかな。強いて言えばこれが一般式と言えるんじゃないかね。
>>7 03
新聞記者は、統計学知らないで「相関」とか言ってるみたい。
散布図と相関係数を出さないで、何を言っても恣意的感想にすぎん
こりゃまた派手にやらかしたな。
まあそれでもこれだけの情報で相関を推測することはできるよ。 真ん中の都道府県が無相関だとしてシミュレーションすると 実数の相関は10回で最大-0.11,最小-0.23、順位相関も10回で 最大-0.13,最小-0.32だから、データが完全にあっても負の相関は 間違いないな。まあこの相関を大きいかどうかは別で その実数の相関は10個とも有意水準0.05で棄却されず 順位相関の方でも10個中棄却されるのは1個だけ。 元の20県だけだと実数相関-0.29,順位相関-0.36だけど データが少ないので有意じゃない。 関連がありそうだ探してきたデータでこの程度だからやはり関連はないのかな。
707 :
132人目の素数さん :2008/10/12(日) 21:32:41
708 :
699 :2008/10/12(日) 22:10:17
>>700 レスありがとうございます。やはりそうでしたか。
凄く当たり前すぎる話だけど、学力低下って様々な要因があるからな。 要因も分析手法も多様に考えられるし、日教組組織率だけを取り出しても おそらく有意差は出ないだろう。だからど素人が思想の絡む話に安易に統計的な ものの言い方すべきじゃないんだよね。断定的に言い切ったりとかもNG。 日教組を批判するなら学力低下問題より別の方面の方が良い。
>> 707
笑えるな。統計データを持ち出すなら有意でないと意味がないということすら
分かっていない。
>>709 の言うように別の切り口で攻めればいいのにね。
(世の中の大半の人も有意でないと意味がないということを知らないので
効果的に使えてしまえるところも問題なんだよな。ありもしないナンバーズ予想で
本が売れるような国だし。)
711 :
132人目の素数さん :2008/10/13(月) 01:50:57
東大出版会の『自然科学の統計学』の57ページの中ほどの、以下の 記述がどうしても理解できません。どなたか、解説していただけ ないでしょうか? ----- (I - Pi_X) X = O に(3)(つまり I - Pi_X = sigma l_i l_i') を代入するとわかるように、 l_i' X = O が成り立つので、l_i' yの期待値は E(l_i' y) = 0 である。 ----- l_i' X = Oが成り立つ理由も、l_i' yの期待値がわかる理由も 理解できません。 よろしくお願いします。
712 :
711 :2008/10/13(月) 11:27:35
前半(l_i' X = Oが成り立つ理由)は何とか自己解決しました。 しかし後半(l_i' yの期待値がわかる理由)がわかりません…
713 :
711 :2008/10/13(月) 13:54:49
後半も自己解決しました。お騒がせしてすみませんでした。
714 :
132人目の素数さん :2008/10/16(木) 18:37:04
指数分布族でない分布って何がありますか?
hyper は指数ないような。 違ってたらゴメン。
>>710 >笑えるな。統計データを持ち出すなら有意でないと意味がないということすら
>分かっていない。
では、有意水準が、5% とか 1% であるところの、
合理的な、皆が納得できる説明をして。
どうして 5% なの?
どうして 1% なの?
恣意的に決められているだけ。
>有意でないと意味がない 見事な説明ではある。
719 :
132人目の素数さん :2008/10/17(金) 10:35:37
720 :
132人目の素数さん :2008/10/17(金) 10:53:35
2ちゃんねるは統一教会が運営して個人情報を集めてますよ
「コ◆シミ◆ズ」検索 「独◆立◆党」検索 ◆はずしてを検索
与党も野党もメディアも全部朝鮮人だった。
http://jb ◆bs.l◆ivedo◆or.jp/b◆bs/re◆ad.cgi/news/20◆92/115◆7941306/
2chの運◆営の正体をリチ◆ャード・コ◆シ◆ミズが断言
http://mamono.2ch.net/test/re ◆ad.cgi/lobby/1213◆329◆871/
2chには何故か?書き込み不可能な文章
http://jb ◆bs.live◆do◆or.jp/b◆bs/re◆ad.cgi/news/20◆92/116◆9481830/
リ◆チャード・コ◆シ◆ミズが初めて公の場に登場した、ワールドフォーラム06年8月例会での講演
http://vi ◆deo.go◆ogle.com/vi◆deopl◆ay?docid=36658385◆1926860◆5080&hl=en
262 :中江さんへ :2007/01/29(月) 18:24:12 ID:???
中江さんへ 以下のリンクを参照して、2chがどういうサイトがご判断の上、
透派について、書き込みされるか、ご判断下さい。
頭のよいあなたなら、私の伝えたいことは十分に伝わると思います。
http://jb ◆bs.li◆vedo◆or.jp/news/20◆92/
http://vid ◆eo.go◆ogle.com/vi◆deoplay?docid=366◆583851926860◆5080&hl=en
http://ww ◆w15.ocn.ne.jp/~oya◆kodon/newve◆rsion/sinb◆unter◆ebiiranaiyo.htm
http://an ◆ti2ch.bl◆og61.fc2.com/
http://re ◆sistan◆ce333.w◆eb.f◆c2.com/top_in◆dex.html
264 :中江さんへ :2007/01/31(水) 05:25:05 ID:3U/nw295
なにがあった?
265 :名無しさん@占い修業中 :2007/02/01(木) 19:09:14 ID:???
自殺しました
「日本の母は息子の性処理係」毎日新聞が捏造記事143
http://changi.2ch.net/test/read.cgi/ms/1223898193/ 毎日新聞スレ荒らしは2ちゃん運営(統一教会)
http://changi.2ch.net/test/read.cgi/ms/1223995813/
>>716 まあ細かいこと言うと、有意水準を20%とか取って「有意だ!関係あるぞ」なんて言っても素人は騙せるんだよなあ…。
「R によるやさしい統計学」は、第4章での確率変数と 確率分布、ほかの抽象的な用語の説明が不十分だ。 自分だったら、どう説明するだろうと、いろいろ考えていた。 んで「有意水準」だけど、オレはこうしてみた。 コインを 10 回投げて、表が 7 回も出る確率を求める。 10C7 * (0.5)^7 * (0.5)^3 == 0.1171875 R だと以下。( まだ R に詳しくない ) > 1.0 - pbinom(6, 10, 0.5) - pbinom(7, 10, 0.5, lower.tail=F) [1] 0.1171875 コインを 10 回投げて、表が 8 回 "以上" 出る確率を求める。 Pr( X>=8 ) == Pr( X=8 ) + Pr( X=9 ) + Pr( X=10 ) == 0.0439453125 + 0.009765625 + 0.0009765625 == 0.0546875 R だと以下 > 1.0 - pbinom(7, 10, 0.5) [1] 0.0546875 コインを10回も投げて、表が 7 回ぐらい出ても、 たまたまだと思えるが、8 回以上も出るならば、 そのコインは歪んでいると思うでしょ。 それが有意水準 0.05 だな。
ところで、われわれは、サイコロを 10回振って 3 の目が何回以上出たら、 「このサイコロは、世界のナベアツ仕様です」と思うのだろうか? 「サイコロに細工しているだろ、八百長野郎!」と怒り出すのか? コインのときみたいに、約 0.05 以下(有意水準)の出方だな。 Pr( X>=4 ) > 1.0 - pbinom(3, 10, 1/6) [1] 0.06972784 Pr( X>=5 ) > 1.0 - pbinom(4, 10, 1/6) [1] 0.01546197 ということで、だいたい 4 回以上表が出たら、コインのような歪みを感じる。 連続的なものは、ルーレットでもいい。 ナイナイの番組「ゴチになりました」で出てくるルーレットで、 第一象限に入る確率は 1/4 であり、 確率密度関数は、定数関数の pr = 1/360 だ。 たとえば、10度から 70 度の間に入る確率は、(70-10) * (1/360) = 1/6 だ。 ということは、サイコロと計算は、同じなので、 10回ルーレットを回して、10度から 70 度の間に 4 回以上入ったら、 そのルーレットは、歪んでいるとみなされる。( 有意水準 0.06972784 ) # 確率密度関数は、磁石入り、歪んだルーレットを使って説明できるよな。
724 :
132人目の素数さん :2008/10/17(金) 22:31:13
有意水準5%を判断の境目によく使うのは、 正規分布で±2σ(より正確には1.96σ)つーキリのいい値に なってることも大きいと思う。
おいらは、違ったのを聞いたことがあるよ。 正規分布の計算がむずかしい(とても手間かかる)頃に、 近似式が、1% のところと 5% のところでクロスするんだそうな。 おいらが、産まれる前のことだから、よくわかんない。 テレビの番組については、あれは見せ物なので・・・ 他に八百長の件もあるように、盛り上げるための必要悪と思う人もいるのでしょう。 放送法(名前変わったかな)には、嘘の内容を流してはいけないことになっているが、 コメンテーターを設定して、この人がこのように喋りました、と流せば、 内容はともかく、局は放送法にひっかからない便利があるんだそうな。
手早くざっくり学べる統計学の基礎のおすすめ参考書、テキストってありますか?
統計とか、確率、でググれば、山ほど出るのに。 あ、山から選択できない人か。 学問に王道が無いのは、幾千年の昔から。 興味の持てるところから、どんどん齧るべし。
731 :
730 :2008/10/20(月) 22:56:05
>齧るべし。 → かじるべし。 べし、で思い出した。 ちょっと前の有名人で、 名詞はともかく、動詞はひらがなで。 と、主張したおじさんは、べしを漢字で書くので、 ちょっと、つつかれたそうな。
732 :
132人目の素数さん :2008/10/22(水) 11:34:52
大学の統計での課題なのですが、 750ページの本の中に1000個のミスプリントがあるとき、ミスプリントが無いページがどのくらいあるか? っていう問題です。教えていただけないでしょうか。
733 :
132人目の素数さん :2008/10/22(水) 15:02:47
その問題にミスぷりは無いと仮定 していいのかな?
734 :
132人目の素数さん :2008/10/22(水) 19:56:36
AグループとBグループそれぞれの平均と分散が分かっていて、さらに 確率密度関数とモーメント母関数が分かっているとき AとBの1人が出会った時の値の大きさを比べるためにはなにをしたらいいの?
735 :
732 :2008/10/22(水) 20:16:08
>>734 何についての平均分散で何の値を比べるのか。グループ間の有意差を調べたいのか。
737 :
132人目の素数さん :2008/10/22(水) 22:01:02
>>736 例えばAグループの平均体重とその体重のばらつき
のような感じで無作為にAから一人、Bから一人選んだ時にAの人がBの人より
体重が重い可能性はどうやってだすの?
日本語おかしくてごめん
>>737 A,Bの確率変数の差の確率変数が従う確率密度を考えてみては?サンプルが少なければ数え上げる方法もあるが。
参考書についての質問があり、お聞きします。 今、尤度比検定に興味を持っています。 これについて、数学的に厳密に議論している参考書はありますか? (現在は「数理統計学」稲垣. を呼んでまして、より詳しいことが知りたいです)
>>716 >有意水準が・・・どうして 5% なの・・・
昔からの慣習に過ぎないのでは?仮説検定創始者がキリのよい5%を採用しただけで。
日本では成人年齢が19でも21でもなく、20歳とされているのと同様に。
半導体業界などでは、10%か20%が標準値でなかったかな?
>>724 >±2σ(より正確には1.96σ)つーキリのいい値・・・・
1.96σがキリのいい値というのは、苦しいだろ。事象の確率基準と±2σは無縁だろ。
>>740 でも俺も2σ区間に落ちる確率が約95%だからという話は聞いたことはあるな。本当かどうかは知らない。
742 :
132人目の素数さん :2008/10/24(金) 20:01:11
頭が混乱してしまったので、どう考えればいいか教えてもらえると助かります。 多重比較法によると、t検定を何回もしてはいけないというのは理解できます。 分散分析と重回帰分析が、統一的に扱えるというのもわかります。 わからなくなっているのは、重回帰分析で変数選択をしますが、たくさん選んで おいて落としていく(逆もありますが)って方法をとりますよね。 でも、そういう変数選択の方法で変数を選ぶと、「多重比較の問題に引っかかる」 のではと考えてしまっています。 つまり、たくさんの変数を選んでくれば、偶然意味がありそうな結果をもたらす 変数を選んでしまうことがあるので、問題があるのでは?ということです。 重回帰分析において、F値を見て全体で意味があるのを確認するのはいいとして、 各変数については多重比較を考慮したきびし目の基準で評価する必要はないので しょうか? それとも、変数選択の段階でF検定をすることで、その部分のチェックはすんでいる のでしょうか?
変数選択ってモデルの推定であって検定ではないんだよね。 ベストを探しているだけでしょ。
744 :
132人目の素数さん :2008/10/24(金) 21:47:03
>>742 です。
>>743 ありがとうございます。
(以下は743に回答して下さいということではないです)
例えば、重回帰分析やパネルデータの分析で変数ごとの有意性を乗せて、
「この変数は有意だから...」といった説明を目にすることがあるの
ですが、この時の個別変数の有意というのは何だろうか?に単なるt検定
をしてていいのだろうか?と悩んでしまっています。
パネルデータ(個体ごとの時系列データ)を利用した分析の場合、とりあえず
変数を入れて推計して、有意でない説明変数が並んでいるものを見かけます。
(変数が過小よりは、過剰の方がいいという理由からだと思います)
ただ、そういう結果を見ると、個別の変数が有意となっているものもモデルの
フィットをよくしてはいても、変数の効果としては信用できないのではと思って
しまいます。
多変数の場合、個別の変数の信頼区間とかどう考えればいいのかというのがモヤモヤ
してる感じでしょうか。
(考えすぎのような気もするんですが、アレっト思ったらはまってしまいました)
>>747 まず検定とかの分析はあくまで方法論なので完全に正しいとか完全に間違いとかはあまりない。それでマルチコリニアリティだけど、これはどうしようもないんじゃないかな。まあ説明変数間に完全に線型関係が成り立つことは稀だとは思うんだけど…。そんなに気にしなくていいような…。
>>744 ごめん。マルチコに限定してるわけじゃなくて説明変数の選び方自体が疑問なわけね。これはあなたの言うように個別にt検定しかないんじゃないかな。
例えば分散分析の交互作用みたいなこともあるから、個別に有意でない説明変数の入ったモデルがあってもおかしくはなさそうだけど。時系列ならなお系列相関も考えないといけないからね。
個別の変数の有意性は他の変数で結構変わるよね。 だから個別に見ても意味ないと言うことでAICなどを使ったモデル全体をみる変数選択が 研究されてきたんじゃないかな。
イギリスの哲学者 デビット・ヒューム
「原因と結果の関係は、人間が恣意的に決めている」
これに思い悩んでしまったドイツの哲学者 イマニュエル・カントは、
純粋理性批判を展開し始めた。
ニワトリが鳴いたら、朝日が昇るのは、相関係数が 1 に近い。
「うまい説明変数を選択できた」と喜んでいても、
「地球の自転」ではなく「ニワトリの鳴き声」を選択しているかもしれない。
説明変数の選択は、本来は実証科学の助けが必要
ttp://cruel.org/econthought/profiles/humebio.html > でもヒュームは、これが誤解のもとだと警告した。ニワトリが鳴くから朝日が昇る
>のか? 歴史的に言って、ニワトリの鳴き声は日の出に確かに先立つので、とても一
>貫性のある予測現象となはる。でも、そこに因果関係が見つかると考えるだろうか?
751 :
132人目の素数さん :2008/10/25(土) 10:38:21
>>742 、
>>744 です。
コメントありがとうございます。
AICなどでモデル全体のあたりがよくなったかを判断するというのはやっています。
個別に効果がでなくても、変数全体として効果がある場合もありますね。
個別で見ても意味がないとなると、結局は重回帰で変数ごとの有意性を問題にして
個別の変数をとりあげて議論しても余り意味がないということなのでしょうか...
(ここは、質問というよりも独り言に近いです)
研究報告などで、個別の変数について取り上げて、有意だったから云々と説明したり、
有意じゃないから云々とコメントするのをみますが、統計学的に考えると、そういう
ことはあまりしない方がよさそうですね。
>>751 です。
>>751 の話は、システム自体を探さないといけない社会科学の話で、
自然科学だと、また違うとは思います。
753 :
132人目の素数さん :2008/10/25(土) 11:02:16
>>750 単に、相関関係と因果関係を混同してるにすぎない。
>>752 社会科学であれ、自然科学であれ、AICで変数選択したなら
個別の変数の有意性は無意味でしょう。
(0.05という値に特に意味がないということの現れだと思います。)
>>753 間違いとは書いてないだろ。
「必ずしも完全な正解とは言えない」だ。
詳細のところを見に行ってもどういった点が完全ではないのか
分からんな。
「モンティホール問題」として大騒ぎとなった原因は、ルール(3)と(4)について司会のモンティが何も説明しなかったからである。 と書いてある。 それから、 この前提なしでは、プレイヤーにとってルールが定まっていないのと同じであり、 「ドアを変更してもしなくても同じ」が答えになる。 従って、数百人の数学教授を含む約一万の読者が、「彼女の解答は間違っている」 と投書したことは必ずしも間違いではない。 何故なら、ホストのモンティがやったことは、プレイヤーが第1のドア選択をした後、 他の2つのドアのうち1つを開け、ヤギを見せただけだからである。 ホストのモンティは、もし、他の2つのドアの両方ともヤギだった場合は コインを投げてどちらかのドアを決めるなどとは一言も言っていないのである。 とも書いてある。 やっぱり、間違いは、マリリンのような希ガス。
>>755 >>752 のように書いたのは、AICの部分ではなくて、個々の変数の部分について
です。
社会科学だとインプット自体が不明な場合が多く、さまざまな変数をもって
きて試した結果、こういうことにしておこうとなるのが多いからです。
モデルを設定はしますが、説明変数自体を探索しているところがあります。
自然科学系の場合は、実験計画法などでインプットを制御できますので、
交差効果などの影響はあるにしても、個々の変数の選択においては、社会
科学よりも適切に行えるのではと思います。
759 :
132人目の素数さん :2008/10/26(日) 12:28:07
ポアソン分布で条件付確率P(X=x|X+Y=z)を求めるとき。 P(X=x|X+Y=z) =P(X=x,X+Y=z)/P(X+Y=z)←ここの分子でX+Y=zが出で来ることや =P(X=x,Y=z-x)/P(X+Y=z)←ここの分子がY=z-xとなってるのはなんで?
>>758 そもそも最初にモデルに入れる変数自体に取捨選択が入っているのでは?ということですね。
それなら分かる。それでも持ってきた変数すべてを使って変数選択するならまだいいと
思うんですけど試行錯誤で一部の変数を選んでから変数選択とかしているのかな?
>>757 マリリンの正確な投書を見ないと分からないが、たぶん推測として
(3)と(4)のルールを考えたのだろう。
# 番組を見ていると必ずヤギの入ったドアをモンティが開けるとしたら
# その推測はほとんど正しいだろう。後ろにあるルールの変更例でも
# それさえ守られれば確率はマリリンの指摘したものになる。
# ちなみに(4)はコインなど投げずとも適当に選ぶという程度で十分。
そうだとするとモンティがそれを認めなかったと言うだけで確率の推定は
なんら間違いではない。また、そういった見えないルールを推測できる
プレイヤーの方が推測できないプレイヤーより正しい確率を導き出せるのは
世の中の他の現象でもよくあることだ。
># ちなみに(4)はコインなど投げずとも適当に選ぶという程度で十分。 君は、確率については素人だね。 プレイヤーが選んだドアが当たりである事前確率と モンティがはずれのドアを開けた後の事後確率が ともに1/3と変わらないのは、ルール(4)を前提としているからなのだよ。 ちなみにコイン投げとは、 仮にプレイヤーが当たりのドアを選んでしまった場合、残りの二つの(はずれの)ドアのどちらを開けるかを確率1/2で決めるという意味。 このルール(4)が最も重要。
>>758 試行錯誤で選んでるというよりも、社会科学の場合は、使えるデータが限られているので、
あるもので何とかしないといけない部分があります。
それでも、それなりにばらついた変数の組み合わせ入れれば、分析は成立して
しまうので、そのあたりは怖いなと思います。
ファクトファインディングと言い訳してもいいし、それらしい理由はあとから
つけれちゃいますしね。
>>762 ほうほう、じゃあ教えてほしいんだけど、
モンティがどうやら中身を知っていて必ずヤギの入ったドアを開けてくれる
という情報のみが与えられていて、正解のドアを選んだ場合は
どちらか適当に開けているらしいと知っていたとき、
プレイヤーの選んだドアが正解である確率はいくつ?
月、平均3回故障が起きる工場で、1ヶ月にせいぜい2回しか故障が起きない確率 (1か月におきる故障の数は、ポアソン分布にしたがう) という場合求めるのは、 P[X≧2]-P[X≧3]と1-P[X≧3]とどちらが正しいのでしょうか。 「せいぜい2回しか」というのは、0,1回もはいるのですか?
767 :
132人目の素数さん :2008/10/27(月) 19:30:43
>>「せいぜい2回しか」というのは、0,1回もはいるのですか? ゆるされても、2回までという意味。ようは2回以下。 日本語として、間違っていないだろうが、おじいさん世代から 統計学ではこういう使い方をするみたい。 「起きても、せいぜい2回まで・・・」とか 「せいぜい、頑張ってください」のような使い方が「せいぜい」 についての、美しい日本語使用法だうけど。 偉い先生が使っちゃたんだろうな。
768 :
132人目の素数さん :2008/10/27(月) 19:34:13
ところで、考えてみれば 「せいぜい」より「たかだか」が一般的じゃないだろうか? まあ本質の話じゃないけど
770 :
132人目の素数さん :2008/10/27(月) 20:21:55
「回帰分析」また「多項式近似」とは簡単に言うとどのようなものなのでしょうか? また2次多項式より3次の方が厳密な曲線になるのでしょうか? 教えてください。
>>720 多項近似の方が精度は上がるよ。
テイラー展開とかでやったでしょ。
そういう観点で見るなら回帰分析は
説明変数を増やすことでモデルの
フィットネスは上がるけど、問題もある。
違う観点から言えば回帰分析も
分散分析その他の色々な検定も
要は線型モデルを設定して説明変数
(独立変数)と被説明変数(従属変数)
の関係を調べる手法だけどね。
773 :
ははは :2008/10/27(月) 23:03:23
>>765 じゃあ、数学音痴の君にもわかるようにやさしく教えよう。
ルール(4)だが、
仮に、プレイヤーが選んだ当たりのドアをAとした場合、司会者がBのドアをxの確率で開けるとする。
(Cのドアを開ける確率は当然1ーx)
この条件(ルール)のもとで、Aが当たりである確率(事後確率)を計算すると、以下のようになる。
(ベイズの定理ぐらいは勉強しておくといい。)
(xかける1/3)/(1/3+(xかける1/3))=x/(1+x) (1)
(1)式は、司会者がBのドアを開けた・・・という情報が得られたときにAのドアが当たりである確率を意味する。
この(1)式からわかることは、xによって、すなわち、
「Aのドアが仮に当たりだったら、司会者がBのドアをどのような確率で開けるか」
によって、
(xが0から1まで変化するとしたら)
Aのドアが当たりである確率は0から1/2まで変化するということ。
逆に言えば、Cのドアが当たりである確率は1/2から1まで変化する。
ちなみに、xが1/2のとき、すなわち、
・選択したドアが当たりだったら、コイン投げで(確率1/2で)開けるドアを決める。
ときにかぎって、(1)式の値は1/3となる。
要するに、この条件(x=1/2)が満たされたときに限って、Aが当たりである事後確率が事前確率と等しく1/3となり、Cが当たりである確率は2/3となる。
だから、君の言った
# ちなみに(4)はコインなど投げずとも適当に選ぶという程度で十分。
というのは数学的にナンセンス。
>>768 そうかな?
せいぜいのほうが口語的で、たかだかは数学的文脈でしか聞いたことがない気がする
世代や地域によって違うかもしれんけど
あ、「一般的」というのは、統計学の文脈において、という意味か 読み違えたかも
776 :
132人目の素数さん :2008/10/28(火) 13:22:10
そう。統計学の場合ということです。
>>773 ふーん。だから?
xが未知の時はどうなるの?
聞いてることの答えになっていないんだけど。
778 :
ぷーっ :2008/10/28(火) 20:54:57
>>777 おおラッキーセブンじゃないか
君は、数学音痴というより、単に頭が悪いだけのようだ。
>xが未知の時はどうなるの?
未知だからXとしたのだよ。(爆
>聞いてることの答えになっていないんだけど。
君の頭は国宝級だな。実におめでたい。
さすがにラッキーセブンを当てただけのことはある。
>>778 へー、じゃあ先の条件の確率にx入りで答えるんだね。
それって応用上意味あるの?
もちろんベイズ確率は知ってていてるんだよね?
780 :
ぷぷっ :2008/10/28(火) 21:25:24
>>779 ルール(4)が明確でなければ、2つのドアのうち一方を選択する確率は0から1まで変動しうるとする以外にはなかろ。あんぽんたん君。
応用上意味があるかって? 知るかそんなこと。自分で考えなさい。(爆
>もちろんベイズ確率は知ってていてるんだよね?
おお、「ベイズ確率」という言葉だけは覚えたか。偉いぞ、ボク。
>>780 なぜ君はさっきからバカの相手をするのかね?
普通にスルーしろ
king様jに言いつけるぞ
>>780 応用を無視した確率厨だったか。
社会では使えんな。
>>780 なんだベイズ確率知ってるんじゃん。
無条件で事前確率を与える場合、そのxはいくつか分かるよな?
>>781 ごめん。バカをからかうと面白くて。
これからはちゃんとスルーしよう。でも我慢できるかな。ぷっ
谷岡一郎っていう人の「ビジネスに生かすギャンブルの鉄則」 っていう本を読んでるのですが、 何回読んでも意味が分からない所があるんで、 質問よろしいでしょうか? 意味が分からないのは、89ページの以下の部分です。 仮に九割(主観的に絶対)確実な賭けを五回行ったとすれば、一回以上 負ける可能性は四割を超える。もし十回行えば負けずにすむ可能性は 三分の一にまで落ちる。つまり三回に二回は負ける。 これの、「〜は四割を超える。」の「四割」と 「〜三分の一にまで落ちる」の「三分の一」っていうのが どうやって出てきたのかが分かりません。
>>785 統計学でもなんでもないが勝つ確率は0.9で五回勝負で一回以上負ける確率は1-(0.9)^5
>>786 ありがとうさんです。
こういう式知らないと絶対に分からないね。
一生懸命文章を読んで考えてたわ。
788 :
KingMind ◆KWqQaULLTg :2008/10/29(水) 17:38:29
ここで終わったらこのスレでやっていた意味がないので少しだけ書いておく。 事前情報がないときのxの事前分布は一様分布。後は考えてくれ。
ん?
>>761 って「マリリンが推測していたルール」の推測なんじゃないの?
> # ちなみに(4)はコインなど投げずとも適当に選ぶという程度で十分。
これもマリリンが「モンティは景品のあるドアを知っていて必ずヤギの入っているドアを開ける」
と考えていたなら「両方ともヤギだった場合」の選び方を推測する必要なし
つまり「マリリン自身もこう考えただろう」って意味でしょ?・・・違う?
何か
>>762 のレスからおかしな言い争いになってるように見える
>>790 おかしくも見えるけどマリリン自身の考えに対する反論として
意味があるのか付き合ってみたわけだ。
確率スレでもよく出ていた議論の流れだったんでどう進むのか
興味があったんだけど最後まで行かずに投げ出されたよ。
このスレとしてはじゃあどういう統計情報があるといいかという議論まで
行けたらと思ったんだけどね。
792 :
132人目の素数さん :2008/10/29(水) 21:30:00
holt-winters法が計量経済学で馬鹿にされる理由を教えて下さい。
以前にもネタなのか本気なのか分からん酷いのがあったな
>>69 とか
>>794 761=791だ。ちなみに790は別人だ。
>>795 本気で気になって本家の英語のページも見に行ったけどマリリンが
正確になんて答えたのかは分からなかった。
ただし、マリリンの解いた問題自体に条件のもれがありそれが問題だった
と考えると追加条件を入れたら正しいと言える。
さてその追加条件だが、本家ではコインを投げて1/2とは書いていなかった。
ランダムにとだけだった。(まあ方法を問わないのは自然。)
本家でも1/2からずれた場合については書かれていなかった。
ベイズ流の解答があることを期待したのだが。
条件4を入れるならドアを選ぶ確率がいくらであれマリリンので正解
残ったドアそれぞれが外れである確率と、 ホストがドアを選ぶ確率は無関係なんだから当然だ。
話が戻ってるな…。
>>798 条件4には1/2で選ぶということも含まれるのだが、
それは外してもよいと思っているのか?
外せるかどうかで延々と議論したのだが…。
>>799 無関係じゃないよ。
>>773 の議論はxが分かるなら正しい。
xが分からないときはどうすればいいかを議論したのだが…。
>>800 わからないから未知数なんであって、それがxだろ。
確率なんだから最低は0、最高は1。それだけ。
ったく小学生かよ。
ふー。
自分で考えてやっと一つの考えに行き着いた。
>>798 ,799の考えは分からないではなかったためつじつまがあってほっとした。
----
>>773 をベースに考える。
「司会者がBの扉を開ける」という事象をB、「Cの扉を開ける」という事象をCとおく。
また、開けた扉に関係なく「初めに選んだ扉を切り替えたときに賞品が当たる」という事象をSとおく。
>>773 の結論は
Pr{S|B}=1/(x+1)
である。
>>798 ,799は扉を開ける前のことを考えているようである。
すなわち、Pr{S}=Pr{S|B}*Pr{B}+Pr{S|C}*Pr{C}=1/(x+1)*(x+1)/3+1/(2-x)*(2-x)/3=2/3である。
# そもそも扉を開ける確率が同じでないことがポイント。
問題は扉を開けた後(仮にBとする)だが、xが分かっているならPr{S|B}=1/(x+1)である。
しかし、xが未知なら扉を開ける前よりなんの情報も得られない。そう考えると
>>798 ,799はその場合も正しくなる。
一方、事前情報がないのでxの分布は一様分布であると考えるベイズ流だとPr{S|B}=1-log(2)となる。
以上。
knn法でユークリッド距離を使う場合は、 各グループに属するベクトルと1つずつ距離計算して、近い距離k個で多数決って感じで求めると思うんですが。 マハラノビス距離の場合はどうなるんですか?
・自分は必ずAを選ぶ。
・司会者は必ずハズレを選ぶ。
・もし残りが両方ともハズレの場合、司会者はBをx、Cを(1-x)の確率で選ぶ。
>>773 の結果になるのは
「司会者がBを選んだ(選べた)場合のみ」を計算した時に正しい答え。
上記のルールであっても、
ゲームを繰り返した場合(BやCがアタリの場合も含める)は
「選択を替えればアタリを引く確率が2倍になる」が正しい答えです。
>>804 どの扉を開けたという事実を使うと違ってくるぞ。
すなわち、「司会者がCを選んだ場合のみ」を計算すると(1-x)/(2-x)となり、
選んだドアによって正しい答えは異なると考えるのが出てくる。
(事実xが既知ならそれがまさに正しい。)
Aを選ぶは一般性を失うことなく仮定しただけなので次のように変更できるから
繰り返しにも耐えられるし。
・司会者はプレイヤーが選んだドア以外のうちハズレを開ける。
両方ともハズレの場合、左側の扉をx、右側の扉を(1-x)で開ける。
もちろんどの扉を開けたという情報を使わないなら開ける前の確率と同じなので
>>802 に述べたとおりだけどね。
結局条件4の1/2ずつというのはどういう状況でも確率が変わらない
(新しい予測をさせない)ために必要なルールだったみたいだね。
確率の問題としてはそれで十分だけど現実ではモンティがそれを認めないという
ことで破綻する。それでどうしたものかと思って考え始めたんだけどね。
Bを20%Cを80%で計算するとどうなる?
>>806 ん?入れて計算するだけだけど。
Bを開けられたとき、それでもAが正解の確率は0.1666となり、
Cを開けられたとき、それでもAが正解の確率は0.4444となる。
# 全体でBが開けられる可能性は0.4で、Cが開けられる可能性は0.6となるから
# 開けた扉の情報を使わないと0.1666*0.4+0.444*0.6=0.3333となる。
じゃあその要領ですべての事象からAが正解の確率を計算するとどうなる?
>>808 すべての事象という定義は?確率空間は何?
>>809 面白いな。w
まだこのスレの本質である統計的な話に入れないという点を考えるとかなり迂遠な方法だ。w
残ったのが、ヤギ2個の場合、開けるドアをコイントスで決定するとある。 裏表は別として、コイントスをしたか、しなかったかを知ることができれば、 回答者は正解率100%。 (コイントスをすれば、1回目が正解なのでそのままま、 コイントスしなければ、2回目に変更する) 残ったのが、ヤギ1個でも(あるいは、2個でも)コイントスをして、 裏表にかかわらずヤギのドアを開ける、としたら、 回答者の正解率50%。 これは、回答者がルールと確率を理解している場合。 たいていの場合、ホストもゲストも視聴者もよくわからんので、 アハハ と笑って番組は終了する。
812 :
811 :2008/10/31(金) 01:37:16
>回答者の正解率50%。 は、平均ね。 1回目のまま変更しなければ 1/3 2回目に変更すれば 2/3
話がかみ合ってないな。
コイントスは予めしておけばいいので目の前でやる必要はない。
また、ヤギが1個の時にまでコイントスで開ければ必ずヤギの扉を
開けるというのに反する場合が出てくる。
ところで
>>802 でベイズ流の場合一様分布と書いたが、
まず確率計算を取り違えてた。Pr{S|B}=log(2)=0.6931だ。
さらに、そもそも非対称に扉を開けるという情報を使っていないことに気づいた。
そうすると想定する事前分布は確率密度f(x)=2(1+x)/3だ。
これなら他に事前情報がないとき事後確率はベイズでもPr{S|B}=2/3となる。
情報が得られればこれから変更していけばよい。
やっと全部すっきりした。
4−1:モンティは必ずハズレのドアを開ける。 4−2:もし残りが両方ともハズレの場合、片方のドアをx=1/5の確率で開ける。 4−2の条件をプレイヤーが知っていれば意思決定的に選択ができる。 4−2の条件をプレイヤーが知り得なければ考えられる事は限られる。 xを0%〜100%まで偏りなく仮定して計算していく。 するとモンティが片方のドアを開ける確率は1/2に収束する。 つまりコイントスなど関係なく1/2が出てくる。 #一様分布として1/2にするのと同じ事。 これならプレイヤーがドアを変更すれば2/3の確率で景品を当てられる結果になる。 モンティが片方のドアを開ける確率は不明。 そして多数のプレイヤーを相手に解答するなら、 「ドアを変更すれば2/3の確率で景品を当てられる」として当然。
せめて、ウィキペディア(Wikipedia)の「モンティ・ホール問題」を嫁。 ルール変更のまとめ 以上のことから、この問題の答えが「開けるドアを変更する」となるにはルール (3) と (4) が定まっていることが重要であることが分かる。 実はもう一つ重要な前提がある。 それは、この問題のルールをプレイヤーが知っているということである。 この前提なしでは、プレイヤーにとってルールが定まっていないのと同じであり、「ドアを変更してもしなくても同じ」が答えになる。 従って、数百人の数学教授を含む約一万の読者が、「彼女の解答は間違っている」と投書したことは必ずしも間違いではない。 何故なら、ホストのモンティがやったことは、プレイヤーが第1のドア選択をした後、他の2つのドアのうち1つを開け、ヤギを見せただけだからである。 ホストのモンティは、もし、他の2つのドアの両方ともヤギだった場合はコインを投げてどちらかのドアを決めるなどとは一言も言っていないのである。
3囚人問題 この問題も、モンティホール問題と同じであり、看守が「Bは死刑になる」と答えた理由が重要である。 仮に囚人Aが恩赦になる場合、看守が、死刑になるB、Cをどのような確率で選択するか、そして実際にどちらの名前を言うかによって、囚人Aの助かる確率は0から1/2まで変化する。 B、Cをコイン投げ(1/2の確率)で選択したときに限って、囚人Aの助かる確率が1/3のままと変化しないことに留意すべきである。 モンティ・ホール問題と異なるのは、看守がどのような回答をしたとしても、Aにはその回答を変える(AからCへと立場を変える)ことができないという点である。
817 :
132人目の素数さん :2008/10/31(金) 10:59:14
すみません BICはlog(標本数) × (パラメーター数)が足されていますよね 標本が増えるほどモデルが劣化するのでしょうか? それって何故ですか?
>>815 それどれ宛てのレスで何が言いたいの?
>>753 から話がでてきたんだしみんな読んでると思うが?
819 :
結論 :2008/10/31(金) 12:07:55
Marilyn vos Savantのほうが間違いとわかれば桶。
>>819 何でそうなるんだ?
>彼女の答えは間違いではないものの、必ずしも完全な正解とも言えない。
じゃないのか?
きちんと状況を設定しないかぎり数学の議論にはならんってことでしょ
>>820 その記述は変だね。
「完全な間違いとも言えないが、少なくとも正解ではない。」
と書くべき。
>>815 ,819 とりあえず英語の方のWikipediaのページを読め。
# 英語にはどこにも数学教授など出てこない。
確率の問題としては条件3,4は外せないのは確か。
英語のページでもベイズ解析と題した部分でさえ等確率に置いている。
そしてこの問題は無条件の確率を考えるか条件付確率を考えるかで
変わってくると書かれている。すなわち、
>>802 のまとめの通り。
そして条件4のうち等確率の部分を外しても
>>813 のように考えれば
2つの扉が選べるときの確率が不明な場合もOKとなる。
現実問題では条件3,4が確認できないので統計的に処理することになるだろう。
条件3について。これは番組をかかさず見ていた人なら誰でも確認できる。
条件4の前半のヤギを見せることについて。もし中身を知らないで毎回適当に
開けるなら賞品の扉を開ける可能性が出てくる。賞品の扉を開ける可能性は1/3
なので8回連続で賞品に当たらなければ司会者が有意に中身を知っていると
推察される。
というわけで少し安全サイドで見ても1クールぐらい毎回扉を開けてヤギを
見せることが続けば、統計的には司会者が明言しなくても条件3と4の前半は
満たされていると言えるだろう。(逆に条件4の後半は本人が言わない限り
実証するのは困難であるが、上記のベイズ流の考えにより誰もが簡単に
分かるような癖でない限り気にしなくてもよくなる。)
>>823 >条件4の後半は本人が言わない限り実証するのは困難であるが、
その条件が最も重要なんだぜ。
だから、他の2つのドアのうち一方を選ぶ確率をxとおいて計算するしかないだろうが。
x=1/2のときに限ってマリリン解が正解となる。
>上記のベイズ流の考えにより誰もが簡単に分かるような癖でない限り気にしなくてもよくなる。)
気にしないでどうする。
ベイズ確率を計算すれば、 プレイヤーの選んだドアが当たりである確率 x/(x+1)は、 x=1/2のときに限って、1/3となる。 すなわち、プレイヤーが選んだドアが当たる事前確率と 司会者がはずれのドアを開けて見せたあとにプレイヤーの選んだドアがあたりである事後確率が ともに1/3となる。 ウィキペディア(Wikipedia)にもちゃんとそう書いてある。
>>824 あのさぁ
>>804 の
>・自分は必ずAを選ぶ。
>・司会者は必ずハズレを選ぶ。
>・もし残りが両方ともハズレの場合、司会者はBをx、Cを(1-x)の確率で選ぶ。
このABCを変数として考えろ
残ったドアのどっちがBでどっちがCか区別付くのか?
>>827 Wikipediaは素人が書いたものだよ。何すがってるの?
間違いや記述足らずは至る所にあるよ。
使うのはベイズ確率(ベイズの定理)ではなくベイズ統計学。
事前分布やベータ二項分布などで検索して自分で考えてみたら?
>>829 場合II-2は自分も考えていたが、記述してあるのは初めて見た。
それでもここもxが未知だったら範囲で終わりだね。
ベイズ統計学は使われていない。
>>832 それって↓の事?
>どちらの扉をより多く開く癖があるか不明の場合。
左から順にZYXと書かれた3つのドアがあって
Yを選ばれたドアAにするな
で残ったZはBなのかXがBなのか?
その区別付かんだろって事だよ
>>833 よく読んでみてよ。どちらをBにしても同じ答えになるから。
区別できなきゃプレイする側が計算できないって意味でしょ。
計算はできてるよ。必要なのは偏っているという情報だけ。 もちろんその偏り度合いの確率が分からないと正確に計算できないのは 変わらないけどね。 結局まとめると、確率派の人は答えが確率の範囲であるかルールを全く知らないかの 二択に持ち込もうとする。統計的に考えるとモンティが扉を選べるときの確率のみが 分からず他の条件はすべて満たされるなら範囲ではなく答えが出せるのでは ということなんだけどね。その確率が分からないんだから条件付でない確率の2/3だろう という単純解答に対応して出てくるのが扉を区別しないでも偏っていることが分かれば やはり範囲という上記の解答なんだよね。さらにそれに対抗するためにベイズ統計学を 持ってきたわけだ。
確かに条件3と条件4の前半は推測可能。 条件4の後半も確認できないのだから、1/2で選んでいるとしてもいい。 実際は赤1本と白4本のクジで決めていると知らされていても、 赤を引いた場合どちらのドアを開くのかが不明だとどうしようもない。 ===仮想プレイをしてみる=== 左からA、B、Cの順でドアが配置されている。 自分はAを選んだ。 モンティはBを開けた。 もしCに景品があれば、モンティはBしか開けられない。 もしAに景品があれば、モンティはクジでBを選んだ事になる。 仮に赤を引けばBだとすると、Bが開けられる割合は40%。 Aが当たりである確率は16.7%になり、Cが当たりである確率は83.3%になる。 白を引けばBだとすると、Bが開けられる割合は60%。 Aが当たりである確率は44.4%になり、Cが当たりである確率は55.6%になる。 これでA、Cそれぞれの当たりである確率を計算してみる。 A = 16.7% * 40% + 44.4% * 60% = 33.3%。 C = 83.3% * 40% + 55.6% * 60% = 66.7%。 Cに変更すると当たる確率が倍になる。
>>840 それがベイズ流の考え。事前確率として40%vs60%を使っている。
>>829 の場合II-2はベイズ的に考えないためそれを等確率として式を出している。
それでもってそのベイズ的考えを扉の選択確率が未知な場合に広げたのが
>>813 。
何らかの癖があるかもしれないが確率が不明という場合でも2/3が導き出せる。
>>841 みんな
>>840 みたいな事は理解してそうだよね。
書き方が違うだけで同じ内容に見える。
>>813 も
>>814 も同じ事でしょ?
何が話をややこしくしてるのか・・・。
マリリンは間違いと言いたい人?
xの値が重要でx=1/2のときに限ってマリリン解が正解と言いたい人?
ドアの区別が付くと仮定してる人?
>>842 >>813 と
>>814 は似て非なるものだよ。
何も情報がないときは変わらないが、番組を何回か見た場合、
ベイズ統計学だとその情報により確率が更新できる。
(本当に癖があるならデータを集めることでより正確な確率が予測できる。)
まあこの問題の場合、正確な確率が予測できてもそれは1/2を
またがないため戦略が変わらないのであまり意味がないけど、
現実では重要なことだよ。
固執している人は真ん中のタイプと思う。
xが正確に1/2でなくてもそれらしくありさえすればよかったって事を認めたく
ないんだろう。
ベイズ統計学って、「作業仮説として適当な事前分布を(主観的に)仮定して、客観的デ ータでそれを更新することにより適切な推測に結び付けていく統計学」と理解しているけ ど合ってる? モンティ・ホール問題で、xの推測にベイズ統計学を使うという議論はここで初めて見たけど、 xが(確定はしているが)不明な場合に、ベイズ統計学で「扉をスイッチすれば2/3で当選」と いう結論になるという話は、別に「数学的演繹的に導ける」とかいうことではなくて、 「ベイズ統計学でよく使われる作業仮説を使うならば」xの情報がない場合の出発点として 「扉をスイッチすれば2/3で当選」と仮定して行動(しデータを収集)するのが(xの推定 の出発点としては)ベストと思われる、というだけのことではないの? ベイズ統計学に詳しい人がいるみたいだから、もし間違ってたら分かりやすく教えてもら えると嬉しい。
基本的にその理解でいいと思うよ。
ただし、情報がないとき「扉をスイッチすれば2/3」というのは
>>840 のようなごく自然な考えから
出てくるので無理に最初にそう仮定しているわけではないよ。
# 扉を開ける前の状態でxに一様分布を仮定し、扉が開けられたことのよって
# f(x)=2(x+1)/3という分布に変わるというのが正確だろう。
データが得られて更新するということがなければベイズ統計学まで考えなくても
>>840 の考え方で十分だし、分かりやすくまとめてくれているよね。
マリリンの解答ってどんな結論だったのかよくわからんな ドアを変えた方がいいって程度なのか倍になるって断言したとか
847 :
132人目の素数さん :2008/11/02(日) 01:28:24
既刊書「確率の理解を探る」で 色々な角度からの見方が書かれてるよ
848 :
132人目の素数さん :2008/11/02(日) 08:22:39
マリリンは当たる確率を、「ドア変えない: 1/3」「ドア変える: 2/3」と 正しく答えたんだよ
マリリンへの質問はこれだしな Suppose you're on a game show, and you're given the choice of three doors. Behind one door is a car, the others, goats. You pick a door, say #1, and the host, who knows what's behind the doors, opens another door, say #3, which has a goat. He says to you: 'Do you want to pick door #2?' Is it to your advantage to switch your choice of doors?
>>847 その本には1/2は特に要らないって書かれてるの?
>>849 それだと「必ずドアを開けるのか」と「正解のドアを開けて残念でしたということはないのか」
という部分が曖昧ということは言えるが、そこさえ補えば扉が選べるとき1/2で選んでいる
ということのみが残り、それが不要となるとマリリンは正しかったということだね。
>Is it to your advantage to switch your choice of doors?
ここから考えるんだからwikiにあるルール3と4は満たされているわけだw
コイントスの事も
>>840 の考え方で解決するし
>>848 のとおり正解だったんだね
853 :
132人目の素数さん :2008/11/02(日) 13:10:42
Generalized Inverse Gaussian 分布の3つのパラメータの推定法を 教えていただけないでしょうか?
>>852 おもしろいね。反論したのは数百人のアカデミー会員と数学者というのが出てくるね。
で、この中には1/2が重要だなんてことはどこにも出てこない。
>>853 密度関数が分かっているから最尤法で求めるんじゃないの?
856 :
132人目の素数さん :2008/11/02(日) 15:52:22
>>855 返信ありがとうございます。どうにかやってみます。
>>856 最尤法は初期値が大事だからまずInverse Gaussianで近似してから
行うといいかも。
>>847 ,
>>850 認知科学モノグラフの市川氏の本でしょ。三囚人問題をメインに心理学の立場から
研究した本だけど、ベイズ確率についてはWikiと同じで、xの値が決定的に重要で
あると強調している。(「いろいろな直観的説明にはすべてバグがあり、どこまで
も看守の選択確率がついてまわるのがこの問題の難しさ」とかなんとか)
特に事前確率を1/3ずつでなく非対称にした場合に事後確率が「減少する」ケース
の問題(彼らは「変形三囚人問題」と呼んでいる)を作ったことで有名だが、その
場合でもxによって事後確率は増加したり減少したりするとちゃんと書かれている。
(事前確率が1/3ずつの場合にx=1/2と選べば事後確率が1/3,2/3になるのと同様に、
事前確率を1/4,1/4,1/2とした場合は、x=2/3と選んだ場合に限り事後確率を1/4,
3/4とできる、つまり推論者自身の釈放確率を不変にできる。これはある意味自然で
数学的に美しい結論ではないか、と)
ちなみに彼らは、変形三囚人問題を被験者に提示するにあたり、数学的に問題不備に
ならないよう、「看守が返事を選べる場合の選択確率を1/2と仮定する」という文を
入れていたが、事前確率を非対称にした変形三囚人問題であっても「この文を入れ
ていなくてもそのように仮定する者がほとんどで、しかもその仮定の重要性に気づ
けない」とある。看守の選択確率の影響が直観的にピンとこないことが、三囚人問
題が心理的に難しい理由ではないかという感じだ。
(自分にもそういう感じはある。よく「100本のくじ」に拡大した話が紹介されているが、
98本の外れくじを意図的に除外してもらった後、残った一本と最初に引いた一本の当り
確率が99:1であることは直観的に明らかだけど、ベイズの定理で計算するときにその比
が出てくる直接の原因が、「最初に引いた一本が当りだった場合」(その場合であるこ
とはほとんどないのに!)に、司会者が残り99本の中から98本のくじを選ぶ自由度から
出てくるというのが微妙に不思議だ。)
859 :
132人目の素数さん :2008/11/02(日) 19:49:08
でも、一様でない事前分布を考えるのは 「ショーの準備中にドアCの後にクルマのバンバーらしきものが見えた」 とか、何か「別情報」がある場合に限るよね。客観的には、、、 でないと、「単純無作為抽出された標本」つまり母集団から等確率で 抽出された各観測値、を前提に統計量の確率分布を考えることも 許されなくなってしまう。 これは母数の事前分布を考えるベイズ流統計学でも同じ
wikiのモンティ・ホール問題の解説も冗長で紛らわしいって感じだよね。
問題も
>>851 の指摘のままで、ホストが当たりを開けた場合なんて考える
必要はないし事前情報も得られないしね。
3囚人問題を書いてるのもおかしいと思う。
変更不可能という違いもあるけど、
>>858 が書いてるような
x(変形3囚人)の問題など、A・B・Cの囚人名とそれぞれが恩赦に
なる確率が定まってる(区別がつく)違いもあるのだから。
これでxが重要と解説されていれば、モンティ・ホール問題の方も
xが重要だと勘違いしてしまう人もいるでしょう。
>>859 事前分布は一様分布だよ。
片方を開けたことにより事後分布が変わるだけだ。
x=1/2でなければ開ける確率が左右で違うんだから。
>>860 そういうことだね。
xが分かっていればそれは重要だけど、分からないんだから
関係ないんだよね。
wikiのモンティ・ホール問題も最初の扉をグループにする説明だけで
十分だよね。その説明には1/2などどこにも出てこない。
862 :
132人目の素数さん :2008/11/02(日) 22:36:05
すみません、ベイズ統計学初心者です。 事前分布φ(θ)、真の分布q(x)から得られたデータをXn = {x1,x2, ,,, ,xn}とすると事後分布は p(θ|Xn) = φ(θ)Πp(xj|θ) /Z (ただしZは規格化定数)・・・・・・・・・・・(1) と書けるところまではわかるのですがこれを p(θ|Xn) = φ(θ) exp(-nH(n)) / Z' (ただしH(n) = Σlog(q(xj)/p(xj|Xn))←経験カルバック情報量)・・・(2) というボルツマン分布の形に書きなおせるのがなぜかがわかりません。 式変形のヒントを教えていただけないでしょうか。 とくに(1)で真の分布q(x)がでてこないのに(2)でどうやって出てくるのかがわかりません。 よろしくお願いいたします。
すみません経験カルバック情報量は H(n) = (1/n)Σlog(q(xj)/p(xj|Xn)) でした。
865 :
132人目の素数さん :2008/11/03(月) 00:06:33
確率が収束していく時のグラフはどう書くんですか? 1/180と1/250で当たるクジのどちらかを3000回やった時1/200だった この時どっちの確率のクジをやった可能性を確率で答えてください 1/200のクジを1000回と5000回の時の収束の信憑性はどのくらいですか?
>>861 xが分かっていても重要じゃないよ
Aがアタリなら司会者はBをxで開ける
Bがアタリなら司会者はCをxで開ける
Cがアタリなら司会者はAをxで開ける
(ドア記号は変数じゃなくドア名)
こんなルールが分かっていればxが重要になるんだよ
>>866 そりゃあそうさ。
けどそのルールはいただけない。
数学的にはサイクリックだといいたいのだろうけど
実際そのような癖があるとは思えない。
残りのドアの左側をxで開けるとした方がまだいい。
# 司会者が右手でドアを開けやすいとすると左右で非対称な
# 癖があるかもしれないから。
# 癖ではなく意図的にそうするというのなら分かるが。
>>862 ベイズに詳しいわけではないが、単に数式として見た場合。
(2)式がまだ微妙に間違っていると思うが…。
どちらにしても直接は書き直せないと思う。
元々情報量は比較によって生じるので
この場合は真の分布と事後分布の比較によって
求められてるんだと思う。それが片方の分布に一致する
とは思えないんだが。
# (2)式の左辺が分布の差の間違い?
>>860 モンティ・ホール問題と三囚人問題は, 数学的には同型だよ.
ドアにはA,B,Cという文字が書かれているとして構わないし, ドアのスイッチが実際に
許されているかどうかはどうでもよくて, Bのドアが開けられたあと, AとCのそれぞれの当選
確率を数学的に評価する問題なんだから. (AとCのどっちの確率が「大きいか」だけを問題に
しているという差があるともいえるが, 三囚人問題だってそのようにもできる)
三囚人問題でも, Aが釈放の場合に看守がB,Cを選択する確率xが「Aにとって不明だから
BとCはAにとっては対称的」という議論が成り立つ.(自分にはその議論はまだよくわからないが)
最大の違いはむしろ, モンティ・ホール問題の設定が何度でも実験できるタイプなのに
対し, 三囚人問題が一度きりの話になっている点じゃないかな. 後者では統計学は無力だ.
>>861 B,Cをグループにする説明は不完全. なぜなら, xの値によらずに事前/事後でAの
当選確率が変化しないという「バグのある定理」に基づいているから.
変形三囚人問題と同様に, A,B,Cの当選確率が異なる「変形モンティホール問題」
を考えた場合, その説明方法だと破綻する.
たとえば, A,B,Cの当選確率がそれぞれ60%,5%,35%だったとする(そういう番組があ
ったって別に構わないだろう. 少なくとも数学の問題としては設定できる).
最初はB,CをグループにしてもAの確率が大きい. しかしAを選んで, 司会者がルール
1〜4に従ってBあるいはCを開けたあとの確率の変化は,x=1/2だとするとCが開けられ
ればA>Bだが,Bが開けられればA<Cだ.
>最大の違いはむしろ, モンティ・ホール問題の設定が何度でも実験できるタイプなのに そんな考えを持ち込む人がいて話が噛み合わなくなってるんだよな 同じルールでの試行をくりかえし行えるか観測できるなら ベイズも統計も使えて情報の更新も可能になる まずマリリンと同じでプレイヤーは皆平等 景品が残ってて扉を替えるか替えないかを選べるだけで 統計情報などは一切得られない プレイヤー全員の結果から統計を出せば 替えなかったら≒1/3で替えたら≒2/3になる ゲームのシステムで条件別に統計を出すのとは違う
>>868 もとい分布の比だった。
そして
>>862 で一致する場合が存在はするのに気づいた。
q()が恒等的に1の場合。それに意味があるのかは知らないが。
# 経験カルバック情報量のp(xj|Xn)がp(xj|θ)の誤りとしてな。
>>869 統計学については
>>870 が書いているので省く。
三囚人問題との違いは運命が変えられるか変えられないかの違いだけ。
賞品確率が不平等だとしてもそれが公開されていなければ結局同じ。
# 60%,5%,35%だけどそれがどの扉かは分からないとして計算するか
# シミュレーションしてみれば分かるよ。
公開されているならその情報を使えば計算が変わるのは当たり前。
>>867 >数学的にはサイクリックだといいたいのだろうけど
じゃなくxで開けたドアがどれか分かってなきゃxは重要にならんって言いたいだけ
…癖とか書いてる所をみると統計ありで考えてるんだよね?それは別問題だから…
やっと流れが読めてきた. というか
>>802 〜の言っていることがわかった.
>>802 と同様に, Sを「扉を必ずスイッチするときに当る」事象とする. A,B,Cをそれぞれの
ドアの当る事象とし, P(A)=a, P(B)=b, P(C)=cとおく. (a+b+c=1)
選んだドアAが当りだったときに司会者がB,Cのドアを開ける確率をx,1-xとする.
ベイズの定理により, P(S|"B")=c/(ax+c), P(S|"C")=b/{a(1-x)+b} ("B","C"はそれぞれのドアが開けられる事象)
だから, Aを選んだ時点で考えたSの確率は
P(S)=P(S|"B")P("B")+P(S|"C")P("C")=P(S|"B")(ax+c)+P(S|"C"){a(1-x)+c} = b + c
>>802 が言ってるのはこの計算のことで,
>>840 はa=b=c=1/3, x=1/5の場合の例をあげてみせただけ.
しかし「扉を必ずスイッチする」のなら, 当る確率が(xによらずに)1 - a = b + c に
なることはほとんど自明. 情報事象に関係なく必ずAを捨てるのだから.
xによらないのだから, xに「ベイズ流に」一様分布を仮定してももちろんP(S)=b+cになるに決まっている.
しかし, モンティ・ホール問題で問われているのはP(S)ではなくあくまでもP(S|"B")だ.
P(S|"B")は上の計算でも使ったようにc/(ax+c)であり, これはxの値に(や変形問題ではaやcにも)
依存する. この式が「答え」であり, それ以上でも以下でもない, というのが
>>773 や,
>>858 の
市川氏の本などでの解説だな.
(つづく)
さてxが「確定しているがわからない」ときに, むりやり行う自然な(?)設定に次の2つがある:
(1) わからないからx=1/2 (いわゆる「無差別の原理」)
(2) わからないから, ドアが1つ開いても情報はゼロ. したがってP(A)=P(A|"B"), P(S)=P(S|"B")のはず
BとCをセットにして考える解説は, (2)に基づいている.
>>802 が
>>798 ,
>>799 を正当化した考え方もこれ.
[;
通常の設定(a=b=c=1/3)では, (1)と(2)は同じことになる.
しかし変形問題では, (1)と(2)は相容れない. 「変形三囚人問題」はこのことを強調するために考えられた.
だから変形モンティ・ホール問題では, 賞品確率は公開されている場合を考えている.
>>872 の指摘は的外れ.
そこでこのスレでの流れの問題点は次に集約される:
「a,b,cが具体的にわかっているが, xはわからないとき, (2)の考えは正しいか?」
>>845 で「自然な考え」と言っているが, 結局は(2)を証明抜きに認めているだけではないか?
xが不明な以上, 何も「証明」はできないわけだし, ベイズ統計学の事前分布は結局そういうものらしいし.
しかし
>>858 の市川氏の本にあるように, a,b,cに応じて(2)が成り立つxの値がただ一つ存在する.
(たとえばa=1/4, b=1/4, c=1/2のときはx=2/3)
(2)を仮定するということは, (1)のかわりに特定のxを仮定していることになると思うのだが(ベイズ
流の自然な事前分布から出るというのは(1)と(2)が同じになる設定だったから言えただけ),
xとa,b,cは本来無関係に設定できる値であり, 連動させる根拠はない.
というのが現時点での自分の意見.
>>869 ごめん。書き方をマズったね。
3囚人問題の中で、モンティ・ホール問題も同じでxが重要って解説を
するのはどうかなって事です。
どちらも事前情報がxだけじゃ計算結果は2通り(
>>840 )だしね。
事後確率が変わるのは確かだけど、予測する側の立場からは期待値的に
確率は同じままだし、誤解を生む解説じゃないかなと思いました。
>>875 >>872 は何が的外れなのか
>公開されているならその情報を使えば計算が変わるのは当たり前。
とあるのに的外れなんだよな?どゆこと?
>>875 元の問題とは異なるわけで変形には興味ないのだが、
もし等確率でないのを明言する番組があったとして
書いておく。
ベイズ統計学を使うと言うことはもちろんxは定数などではない。
a=1/4, b=1/4, c=1/2という設定でプレイヤーがAを選んだ場合、
扉を帰る前のxに一様分布を仮定し、扉を開けるという情報が
得られたらそれにより事後分布がf(x)=2(x+2)/5となるだけ。
この状態でもxは0から1まで取り得る。
このときベイス流にP(S|"B")を求めると4/5となり、
(1)を仮定するのと確率の結果だけ見ると同じになるが、
xは固定しているわけではない。
ちなみに(2)の仮定は賞品が同じ確率で隠れていると考えられるときの考え
なので上記のように違うならそれを死守する謂われはない。
>>878 情報が不正確だと言われたらなんなので自己フォロー。
> 扉を開けるという情報
"B"の扉の方ね。
> 事後分布がf(x)=2(x+2)/5
正確には確率密度関数がf(x)=2(x+2)/5 (0≦x≦1)の分布ね。
結局, 「わからない」のに確率が決まるという幻想をもつことが間違ってる.
ベルトランのパラドックスと同じ.
[;
xがわからないなら, P(A|"B")=ax/(ax+c)もP(S|"B")=c/(ax+c)も「わからない」
としか言いようがない.
「ベルトラン」でピンとこないかもしれないから例をあげる.
「碁石が2つ入っている袋がある. 碁石だから色は白か黒だが, 白と黒が1つずつである確率は?」
答えは「わからない」. たとえば碁石をランダムに2つ選んで袋に入れたのなら1/2だが, 黒2個を
入れた袋・白2個を入れた袋・白黒1個ずつ入れた袋を1つずつ作って, この3袋からランダムに選ん
だのなら1/3だ. 結局, 「その袋をどうやって準備したのか」に依存する. それがわからなければ
答えは出せない(決まらない). もちろん同一の状況を何度も実験することはできないとして.
xがわからないなら,
>>875 の(2)も((1)と同じに)根拠のない仮定にすぎない.
一様分布も「わからない」とは違う. 明確な仮定だ.
881 :
875 :2008/11/04(火) 04:28:11
>>877 a,b,cを変えれば「計算」が変わるのは当然だが, a=b=cであるかないかで「論理」
が変わるのはおかしい.
通常のモンティ・ホール問題でも, a=b=c=1/3という情報は公開されているという
前提になっている. a,b,cが同じか異なるかは,
>>875 の(1)と(2)が同値になるか
どうかには影響するが, いずれにしろa,b,cの情報はxがわからないときxを知る助
けにはならない.
以上の文脈を汲んでないように見えたので「的外れ」と言った.
さすが統計スレだな。 数学としての確率論だけからは言えない結論を、 やや飛躍した論理と帰納的推論でなんとか出してしまうわけか。 でもそれって数学じゃないよね。考え方もひとつじゃないし、哲学?
>「ベルトラン」でピンとこないかもしれないから例をあげる. その例をあげてる事にピンとこないw ドアを変更するか?と言われた後2つのドアには何がある? 景品とヤギの組み合わせ以外もあると? 最初に選ぶドアの割合も1/3とは限らんとかも言うんだろ?
>>883 ドアを変更するか?と言われた後2つのドアにある景品とヤギの確率は何で決まる?
ふたつにひとつだから1/2だとか?w
>最初に選ぶドアの割合も1/3とは限らんとかも言うんだろ?
だからWikiのルール1〜4のようにすべて明記してはじめて数学の問題になるんだよ。
最初に選ぶドアの割合はルール1として明記してあるだろ。数学やる前に眼科行け(←どっかのスレで見たセリフw
xという決定的なパラメータが「不明」だったりして、確率空間が定まらない場合にまで、
恣意的な仮定をこっそり持ち込んで確率が一意的に定まったと誤解するのがベルトランパラドックスだ。
ピンとこないなら確率空間から勉強し直す必要ありだな。
いかん釣りだったか?
>>884 >黒2個を 入れた袋・白2個を入れた袋・白黒1個ずつ入れた袋を1つずつ作って
>この3袋からランダムに選んだのなら1/3だ
モンティホールはこれと同じ条件になってるとわからない?
ドアに景品がある比率はなんであれ1つは必ず景品
そんでその3つのドアから自由に選べるんだしな
例あげて「わからない」を強調してるがそれとは全く別の問題
a=20%, b=30%, c=50%, x=20% この変形モンティでシミュレーションしてみても変更しない=1/3, 変更する=2/3になるのだが・・・
共分散行列の求め方を教えてください
>>888 ほのぼのするなあ。w
正式には分散共分散行列な。
確率の場合かデータの場合かで違うけど
計算式は初等的な本に載ってると思うがな。
ここでのパラドックスは勝手にx=1/2としてしまうことを指している と思われるが、xを固定しないベイス統計まで否定している確率の 専門家がいるのか?専門家は範囲外のことには興味がないと思うけど。 経済問題などでもこの手のパラドックスは出てくるが、 その場合分からないと答えるのが目的ではなくてより詳細な情報を 集めることが肝心であるという風に進むんだけどね。
>>887 そのシミュレーションってxの確率の方の扉を開いた場合と(1-x)の確率の方の扉を
開いた場合で分けてる?分けてないなら無条件の場合なので1/3になるよ。
分けたとしたら確率は変わるはず。
(もちろんa,b,cだけ教えられてそれが具体的にどの扉か分からないなら
全部のパターンで等分に置くしかないので条件付でも1/3になるけどね。)
>>879 まで読みました。要するにこういうことだと思います。
>>878 が言っているのは、
>>875 の(1),(2)の他に
(3) わからないから, xは一様分布する (ベイズ統計学でよく使われる仮定)
があるということでしょう。
また、(1)と(2)はx=c/(b+c)のときにのみ同値になるから、x=1/2 ⇔ b=c (aは関係ない)。
これは何を意味するかというと, 要するにAを選んだときにドアBとドアCに対称性があれば、
司会者がどちらのドアを開けても関係ないということ。つまりP(A|"B")=P(A|"C")=P(A)。
変形問題(b≠c)では対称性が破れているから、xのほうを調節してそれを相殺しない限り、
どちらのドアが開けられたかが重要になり、いずれにしろドアが開く前のP(A)=a, P(S)=b+cと
事後確率は異なってくる(増加したり減少したりするから、スイッチするべきか否かは場
合による)。
(1)、(2)、(3)がそれぞれ異なる仮定だという指摘は重要ですが、いずれもドアBとCに何
らかの対称性を仮定するものです。
(
>>878 はb≠cの場合には(3)が(2)でなく(1)と同じ結論になるという話ですね。(2)は盲
目的に仮定するものでなく結論として出すほうがふさわしい性質だし、一様分布の平均は
x=1/2なのだから対称性から言ってそれは当然でしょう。一様分布でなくても平均が1/2で
あればいいんじゃないかな? b≠cのときにベイズ流に(2)を回復するには、x=c/(b+c)が
平均になるような分布を仮定すればいい。)
エラーになったので、ここで分割します。ここからが本論なんですが。
ですから、b=cのときは、Wikiのルール4が「xが全くわからない」という設定になったと
しても、(別に(1)や(3)のような具体的な仮定を持ち出さずとも!)(2)すなわちどちら
のドアが開いてもAの確率はaのまま、Sの確率はb+cのまま)が成り立つ、としてよいは
ずです。なぜなら、「わからなさ」は対称性を破らないから!(この論理は数学的には少
し苦しいかな?)
>>873 とかの「ドアの区別がない」という議論や、
>>876 の「モンティホール問題ではxは
重要でない」という議論は、そのことを直観的に言っているのではないでしょうか。
(別にモンティでなく三囚人問題でも、Aから見て囚人BとCが対称的なら同じことが
言えるはずなので、三囚人問題を併記することには問題ないと思いますが。)
BとCをグループにする直観的説明も、BとCの対称性を強調すれば別に不完全ではない。
(この説明方法にxが出てこない理由は対称性から説明できる。)
以上です。
>>893 の訂正です
>これは何を意味するかというと, 要するにAを選んだときにドアBとドアCに対称性があれば、
>司会者がどちらのドアを開けても関係ないということ。つまりP(A|"B")=P(A|"C")=P(A)。
↓
これは何を意味するかというと, 要するにAを選んだときにドアBとドアCに対称性があれば、
司会者がどちらのドアを開けても関係ない(つまりP(A|"B")=P(A|"C")=P(A))ためには、
司会者の選択にも対称性が要求されるということ。。
>(1)、(2)、(3)がそれぞれ異なる仮定だという指摘は重要ですが、いずれもドアBとCに何
>らかの対称性を仮定するものです。
↓
(1)、(2)、(3)がそれぞれ異なる仮定だという指摘は重要ですが、いずれも司会者に対し
ドアBとCの扱いに対称性を要求するものです。
釣りかもしれんが,
>>886 は目下の議論対象がA,B,Cの事前確率の話でなく
司会者のドア選択確率の話だと言うことが全く分かってないな.
もっと簡潔に書いてくれ。数レスに跨って書くほどの内容でもなかろう。
>>890 ベイズ統計を否定というより, 理由なく一様分布を仮定することを否定してるんだろう.
>しかし, 一様分布の仮定は, どのΘも値も同じくらい確かであるという知識のもとで
>はじめて正当化されるもので, 無知であることから導かれるものではない. ラプラス
>はこの不確かな前提「無知ゆえの一様分布」の上に帰納論理としての確率論を築いた.
>ラプラスの権威ゆえ, この誤りからの脱却には50年近くを要した.
(釜江哲朗, 「ラプラシアン,確率」, 数セミ2005.5より)
>>896 わかってるから
>>883 でこう皮肉ったんだ
>ドアを変更するか?と言われた後2つのドアには何がある?
>>886 は
>>880 の例に対してモンティホールとは全く別の問題だと言ってる
「最初の選択」でも「司会者のドア選択確率の話」でもな
>>899 は司会者のドアの選択確率がわからなくても、最終的な確率は定まると言いたいの?
3つの扉の内、アタリは1つ、ハズレは2つ。 このルールを分かっていながら、 母集団が不確かな場合の考え方を持ち出すのは間違ってる。 xが登場するのは、プレイヤーがアタリを選択した時だけ。 残りの扉は両方ともハズレで、そうなるのも100%。 xに関わらず、ハズレである2つの扉の内1つが開けられる。 なのでプレイヤーからすれば、1/2で開けられたのと同じ。 xを仮定して計算した場合のアタリの確率や、 xが1/2に収束する等の説明は既出だと思うので省く。
>>900 司会者のドア選択率がわかれば最終的な確率が定まるみたいな言い方ですが…そうなんですか?
>>902 Wikiのルール1〜4(ルール4は「プレイヤーがアタリを選択したとき司会者は
ハズレである残りの2つの扉の1つを確率1/2で開ける」と読む)がすべて満たされる
なら,確率は定まる.
>>901 は,
>xに関わらず、ハズレである2つの扉の内1つが開けられる。
>なのでプレイヤーからすれば、1/2で開けられたのと同じ。
この部分こそが,「2つに1つだからとにかく1/2」という短絡思考の産物だということに気づいてない.
「xに関らず」ってwww
xの定義がわかってないのか
>>902 補足
ルール4を「プレイヤーがアタリを選択したとき司会者はハズレである残りの2つの扉
の1つを確率○○で開ける」に変えても, ○○の数値が具体的に指定されていれば, 確率は定まる.
>>904 「2つの扉の1つを」じゃどっちの扉かわからないからだめだ. 「右側の扉を」とかに
しておかないと揚げ足を取られる.
>> 898
確率論としての一様分布とベイズ統計の事前確率の一様分布は考え方が異なるのじゃないかな。
無知だからではなく無情報だからだ。
もちろん何人かの人に実験してもらい、人はどのような確率分布で扉を開くのか
情報を得るべきだというのは正当だけどそんな手間はかけなくても
ベイズ統計は更新することに意義があるんだから初めの分布が正確でなくても
大して問題ないでしょ。
>>893 どんな分布でも平均が一致すれば同じというわけじゃないよ。
たとえば、x=1/2を確率1でとるというのも分布だけどそんなことしたら
データが得られても更新できない。逆に言えばデータが得られれば
分布は更新できるのでこだわる必要はあまりない。
xについてなんら情報がないから一様分布にしただけ。
情報が何もないということは2つの扉は対等なので最初はx=1/2に結果的に対応するが、
b=cは仮定していない。したがって、開けた扉によって異なる確率を得る。
(a,b,cとxは無関係だというのはそちらの主張のはずだったんだけどね。)
そしてデータが得られたらデータが対称でない限りx=1/2とも対応しなくなる。
>>904 [2]-どっちのドアをxで開けるかわかってる人
[1]-どっちのドアをxで開けるかわからない人
あなたのは[2]の立場ですよね?そして確率が定まると…
[4]-ドアの中がわかる人
[3]-コイン投げとかxに関わる動作を確認できる人
この[3]や[4]の立場からすればあなたのも定まった確率じゃないと思いますが…
>>907 [1]の人は、確率論を使うことが全くできない。
[2]の人は、確率論を使って確率を定めることができる。
[3],[4]の人は、確率論を使う必要自体がない。
ゆがんだサイコロを壷に入れて振って壷を伏せた。丁か半かの確率を考える。
[1]-そのサイコロの特徴をまったく知らない人
[2]-そのサイコロで何度も実験して、丁の出る割合を知っている人
[3]-壷の中をこっそり覗いた人
[3]の人を想定できるから、[2]の人の確率は意味がない?
>>901 は、プレイヤーが選んだドアがアタリの場合は司会者が右のドアを
確率1で開ける場合でも、「それは残りが両方ハズレのときだけの話だか
ら、どっちでも同じことで、プレイヤーからすれば1/2で開けられたのと
同じ」とか言って、どっちのドアが開けられてもスイッチするんだ。
2/3で当ると信じて…
>>906 >ベイズ統計は更新することに意義があるんだから初めの分布が正確でなくても
>大して問題ないでしょ。
そうなんだよね。ベイズ統計ってそういうものなんだよね。
逆にいうと、一回限りしか実験できないときは使っちゃいけない気がする。
911 :
132人目の素数さん :2008/11/05(水) 22:36:00
>>893 そんなに形式化しなくても、普通の表現でわかると思うんだが、、、
例えば、モンティ(司会者)には、残った2つのドアを左から開けるクセがあるとする。
もちろん、残った2つのドアの左がクルマなら、モンティは右を開く。
そうすると、モンティのクセを知ってる人なら、もしモンティが右のドアを開いたら、
「残った2つのドアの左がぁゃιぃ!」
と、すぐにピンとくるわけだ。
しかし、モンティのクセを知らない人の場合、モンティが左右どちらを開くかは
何の手掛かりにもならない。つまり情報価値ゼロ。
その場合の当たり確率は、普通の「ドア変えない:1/3」「ドア変える:2/3」になる。
912 :
132人目の素数さん :2008/11/05(水) 22:47:12
>>909 は他の奴と違って理解力も読解力もあるみたいだけど確率って何か理解してない
所は同じなのがもったいないなぁ
んなもん個人じゃなく複数のプレイヤーがランダムにやれる場合で算出するもんじゃん
だから実際に実験しても仮想でシミュっても推定値通りになるんだよ
ポアソン分布しそうでしてないものを無理に(?)あてはめる方法ってありますか
>>913 しそうでしないっていうのをもう少し詳しく説明できない?
単に平均と分散が一致しないというだけなのか
それとも局所的にはポワソン分布と思われるけど
たくさん集めると合わないという状態なのか。
>>914 どうもすみません T T
平均と分散は一致せず、平均<分散 です。
>局所的にはポワソン分布と思われるけどたくさん集めると合わない
データ範囲が広く、まさにそんな感じですが、
0〜10を抜き出しても従いません。
ポリアエッゲンベルガー分布で出す期待値は近い値に見えますが
検定した有意確率は非常に小さいです
見当違いのことを言ってるかもしれません。すみません T T よろしくお願いします。
916 :
132人目の素数さん :2008/11/07(金) 12:24:07
>>915 >平均と分散は一致せず、平均<分散 です。
そうゆう時は、まず負の二項分布というのが定番だけど、やってみた?
モデルとしては、各観測値が平均の異なるポアソンで、平均がガンマ分布に
したがうケースだったっけ、、、
>>916 ポリアエッゲンベルガー分布 ≠ 負の二項分布 でしょうか?
>>915 データの範囲を絞るのではなく、入手されたデータを入手した順に区切ったら
ということ。(経時的に得られたデータを想定。)
>>917 異なるが、ポリア・エッゲンベルガー分布は負の二項分布を含んでいると言える。
そうなると上の質問はあまり意味をなさなくなるね。
>>916 の言うようにそういった場合、ガンマ分布でポアソンの母数を説明することが
考えられてそれは負の二項分布になるので。
919 :
132人目の素数さん :2008/11/07(金) 20:20:01
>>915 ポアソンより裾広な部分を説明するために
極値分布でガンベルとかフレッシェとか当てはめてるのを
見たことはある。
全域でのフィットじゃないけどね
ベーテ自由エネルギー
化学系だと、対数変換
922 :
915 :2008/11/10(月) 14:01:08
皆様ありがとうございます。 いただいたキーワードをヒントにまた格闘してみます
突然、スレッドの趣旨を折り曲げてしまうかもしれませんが、 よろしければ、どなたか回答願えないでしょうか? 私は、仕事で統計学が必要なのです。必要レベルはかなり高いです。 経済の金融分析とかにですが。 しかし私は、高校でも大学でも統計をさっぱりやったことがないのです。 大学でも線型代数や解析はある程度はやりましたが統計はやりませんでした。 確率は、高校のときにだけやりましたが。そして、お勧めの本はありますか と聞いたら、東京大学の「統計学入門」を勧められ、これが分かれば、まぁ とりあえず、多分、大丈夫、といわれました。しかし、この本、入門と書いてありますが、 はっきり言って分かりません。やっぱり 解説が詳しい問題集形式の本を 解いて一つ一つ身につけるというのも 必要だと思いますので。 教科書は「統計学入門」で良いとしまして、どなたか、 良い問題集をご存知でしたら、どうかお教えいただけないでしょうか? 以下のようなやつだとありがたいです。 ・統計学入門者でもついていける内容 ・業務で使うのは経済関連なので経済をやる人が使う統計 みたいなやつだとなお良いです。どうぞよろしくお願いします。
>>923 そもそもなんで全くの素人が
そういう仕事に就くことになるのか
人事が理解しかねるが…。
大学時代に解析や線型代数の基礎を
学んでいて、東大出版の「統計学入門」
が分からないというのも信じがたい。
SPSS等使うだけならそれに特化した
本が沢山ある。理論は分からなくとも
分散分析や回帰分析を使っている人は
沢山いる。要は目的次第だな。
あえて挙げるなら同じシリーズの
「人文社会科学の統計学」
も見てみるとよいかも。数理面で
初心者向けなのはマセマ。
925 :
132人目の素数さん :2008/11/12(水) 13:12:19
>>923 小説読むのに問題集形式を求めてるようなもの。
だって入門ってガイドブックだよ
>>923 問題集は自分は使ったことないが、
藤田岳彦「穴埋め式らくらくワークブック
確率統計」(だったかな?)とか、
国沢清典「確率統計演習」とか…。
ただ本当は他人に聞くより自分で
書店に行って、自分の目的に合った
本を実際に見て探すのが一番だよ。
>>923 「入門」が分からないということでみんなが薦めるのは「確率・統計」関係に
なるけど、はっきり言って実務で使えるようになるまでは遠い。
早さが必要なら
>>924 の言うように特定の統計ソフトを勉強する形式の方が
よいかも。(仕事でというのなら統計ソフトは決まっているのでは?)
実際の分析というのは千差万別で結局「習うより慣れろ」だし。
928 :
132人目の素数さん :2008/11/12(水) 22:51:39
実務での必要性から統計学を勉強するのなら、
>>927 さんが言うように実務で出てくる例の易しいのから、
自分で統計ソフトを使ってみるというのは、いい考えだと思う。
で、そこに出てくる指標や図を理解ために、
その分析結果や分析法について書いた本を読む。
そこで出てくる統計学的な用語や概念を理解するために、
それを説明している基礎的な本などを読む・・・
とまあ、ネットで知らない分野の問題を調べる時の芋づる式の
アプローチを取る。そうすると、一見わかりやすそうな本が役立たずで、
敬遠してた本が凄く良い本だということがわかる次第w
経済学板いって 経済統計スレみてみそ。数学苦手の経済学の学部学生がたくさん。 そのレベルならついてけるでしょ。
930 :
132人目の素数さん :2008/11/13(木) 01:05:30
>>923 は釣りだと思うぞ。
だって上司や同僚に聞いた方が早いだろうが?
931 :
132人目の素数さん :2008/11/13(木) 01:25:15
ずっとカイ二乗検定ばっかりしてたらなんだかすごく単純なことがわからなく なってしまいました…。 ある問題の回答者がA○人、B○人、C○人、D○人だった場合、 統計的に各選択肢の間に差があるということを言いたい場合、 何を使えばいいのでしょうか。
933 :
132人目の素数さん :2008/11/13(木) 01:46:04
≫932さん カイ二乗でよかったんですか!? 何だかトンチンカン質問してしまいすみませんでした…。 AとB、CとDという意味での2×2という解釈で問題ないでしょうか?
>>931 >統計的に各選択肢の間に差があるということを言いたい場合
>>933 >AとB、CとDという意味での2×2という解釈で問題ないでしょうか?
っていうのはサイコロ問題を解く時みたいに、4つの選択肢A,B,C,Dの理論値
をそれぞれ1/4として、実際に各選択肢を選んだ人数(実測値)との差を
みるということではないのかな?
935 :
132人目の素数さん :2008/11/13(木) 02:13:00
≫934さん ありがとうございます。何だか頭がこんがらがっており、 いろいろ考えすぎていたみたいです。 アドバイス通りやってみます!
全選択肢の回答率が均等になる問題というのを 仮説としてでも考えてみる状況の方がわからん
>>936 考えようとしては、「全選択肢の回答率が均等になる」ってのは、「選択肢が無意味」
ってことなので、意味のある設問かどうかの検定にはなってると思うよ。
>>937 果たして回答者は問題が全く分からないときに均等に回答するのか
自体の検定になってしまうのでは?
>>936 テレパシー実験とかで使うでしょ。
「ただいまからテレパシーで選択肢A〜Dの4種類の図形のうち1つを皆さん
にテレパシーで送ります。頭に浮かんだ図形をA〜Dで答えて下さい。」
941 :
132人目の素数さん :2008/11/14(金) 05:57:46
>「全選択肢の回答率が均等になる」ってのは >「選択肢が無意味」ってことなので、 誤り。 「選択肢が無意味なら全選択肢の回答率が均等になる」 は正しいが、逆は真でない。
942 :
132人目の素数さん :2008/11/14(金) 13:37:46
>>941 >「選択肢が無意味なら全選択肢の回答率が均等になる」
>は正しいが、逆は真でない。
ダウト!
一番最後の選択肢は避けるとかの傾向アリアリ
一瞬,「逆は真でない」が偽なのかとオモタ
統計工学のZは何を表してるんですか? 教科書見ても載ってません。Me=メディアンでS=平方和でV=分散だし Zだけ載ってないんです
Z値じゃねーの?
Zは一般的には標準化変量かね。 標準正規分布。
WとZで相関の有無を区別するケースがよくあるような
わからない問題はここに書いてねスレッドに質問を書いたんですが なんだか荒れていて空気読めてなかったみたいなので、こちらにかきます。 よろしくお願いします。 ある地区におけるAさんの支持者の割合を推定するのにその推定値の誤差を 0.90の確率で0.03以下に推定したい場合を考える。 もし真の割合がほぼ0.4であることを知っているとして、 どのくらいの標本をとればよいか。
正規分布っぽいけど大分ばらつきがあるデータに対して どの程度正規分布に従っているかというのを評価する手法には どんなものがありますか? データを昇順に並べて正規分布と仮定した場合との2乗誤差をとる とかいうやり方(名前は知りません)を聞いたことがりますが、 他にどういう手法があって、どういう場合に使えるといったことが知りたいのです。
950 :
132人目の素数さん :2008/11/16(日) 16:12:15
>>948 教科書に式が出てるから、それのどこがわからないかを書けば
ヒントくれる人が居るかも。問題丸投げはダメ
951 :
132人目の素数さん :2008/11/16(日) 16:57:57
統計学を習い始めたばかりの人間です。質問させてください。 今相関係数あたりを習ったのですが、この相関というのは 「●と×は関係がある」というのを証明するくらいしか使い道は無いのでしょうか。 例えば、犯罪による合計被害金額と窃盗の件数の相関が高いと考えて、 その相関の大きさから「窃盗による被害金額はおよそどれくらいか」というのは 導き出せないのでしょうか。 関係がある、ということだけ証明するのも微妙だなあと思ったので 質問させていただきました。
>>952 線型モデルを置いたりして
そういったことを導くことも
可能だよ。ただ相関係数と言っても
色々種類あるからね。ピアソンの
積率相関係数やスピアマン順位相関係数
とか。大まかに言えば分散分析や
回帰分析とかも、詰まるところ
独立変数と従属変数との関係性
を調べる手法だから、学習が進めば
「相関性」というのが凄く重要な
概念だとわかってくると思う。
>>953 回答ありがとうございます。導こうと思えば出来るものなんですね。
線形モデルはまだ習ってないのでちょっと自習してみようと思います。
>>948 ググれば出てくるサイトで計算すると、必要なサンプルサイズは722。
計算式もそこの下に書いてあります。
うちのPCには、直接計算する能力がないようなので、
サンプルサイズを変えながら計算すると、737となりました。
URLを教えてもらえませんか?
957 :
132人目の素数さん :2008/11/17(月) 21:16:45
>>956 んとさ、信頼区間を設定する時に、サンプル数が出てくるでしょ。
そこから逆に、サンプル数について解けばいいだけだよ。
普通は確率とサンプル数から平均値との誤差の区間の幅を計算するでしょ。
てことは、確率と誤差の幅からサンプル数が計算できるってこと。
ありがとうございます。 やってみます。
959 :
132人目の素数さん :2008/11/18(火) 13:16:21
960 :
132人目の素数さん :2008/11/19(水) 19:55:16
おまいら教科書見ないでt分布のpdf書けるの? 俺は無理。カイ二乗も無理。
>>960 そらで覚えてもあまり役に立たないしな。
962 :
955 :2008/11/19(水) 22:14:01
>>957 フォロー、ありがとうございます。
>>956 ググるとき、複数の単語を入れてます?
1ページ目に出てくるんだが。
>>955 で数字が違うのは、式がちょびっと違うから。
母比率が0.5から離れると、誤差が大きくなるような。
実際のところ、どちらが正確かは知らないのだけど、
個人的に、こちらが良いかな、と言うのは滲み出るもので、
それで、URL 張りにくい。
因みに、コードは自分で書いているので、ときどき怪しい。
間違ってたらごめんね。
>>960 PC に R をいれとけば、教科書無くても大丈夫。
R のマニュアルは手元に必要かも知れないけど。
実際のところ、R の作図の機能は羨ましい。
『今夜家に誰もいないのw来てw』と言われ、 行ってみたら本当に誰もいなかった
相関係数の検定は無相関検定で行えるけど、 これって単位の異なるもの同士の相関も検定できるの? 例えば%と円という別々の単位のものの相関とか。
965 :
955 :2008/11/19(水) 23:34:10
1日1レスを心がけておりましたが、 無事、次スレも立って、こちらは、埋めモードですね。 複数のアプローチがあることについて。 1.計算しにくい式が多い。ので、計算しやすいので間に合わす。 2.理解しにくい式が多い。 3.統計は手段に過ぎないので、よく分からんけど、適当なところ(古い)から引っ張って来る。 なのかなと、思っております。
>>966 標準化しなくてもいけるよね。ありがとう。
順序ロジットの説明変数にダミー変数って使えますか?
>>968 ダミー変数は質的データを量的データに
変換するための変数なので、ロジット
モデルにだけ使えない理由はないんじゃ
ないでしょうか。
質問させてください。例えばある金額があったとして、 その金額の内訳みたいなのを推測することってできるんでしょうか。 (例)株取引で得た利益●●円→そのうち成行注文で得た利益=▼▼円 指値注文で得た利益=■■円 これの▼と■の部分の推計って統計学で可能なんでしょうか。 注文方法の重要度とかをAHPで決めてそれを利益に乗じればある程度 正しいのかな、と個人的には考えてるんですが。
>>971 「内訳の分かっているデータがある程度はある」というのじゃないの?
百八十日。
>>972 レス遅くて申し訳ない。内訳に関する情報がまったく無かった
場合です。予測とか推計だとやはり信頼性は低くなりますかね。
975 :
132人目の素数さん :2008/11/23(日) 02:46:49
コインを3枚同時に投げる時、表の出たコインの数をXとする時Xの確率分布を求めV(X)を求めよ
……(^ω^; )
>>974 AHPで重要度を決めてもその通りかどうかの確認ができないんじゃ
信頼性なんか全くないよね。
978 :
132人目の素数さん :2008/11/23(日) 19:28:40
直感的な質問で申し訳ないですが、 通常、サンプル数は少ない(多い)と分散は大きく(小さく)なるものですが、 サンプル数が少なく(多く)ても分散が小さく(大きく)なることはあるのでしょうか。 また、あるとしたならば、それは良くあることなのでしょうか。
サンプル数多くして分散が小さくなるのは分布が平均付近に偏っている場合だけ
980 :
132人目の素数さん :2008/11/23(日) 22:08:08
>>978 つか、統計的には、サンプルサイズと分散の大きさに関係はないぞ。
何か特殊な分布を持つデータについてのわずかな経験を、
一般則のように思ってると思われ。
>>978 補足だけど自分で適当な
数値で実験して
みればいい。平均付近
では、
サンプル数多いと平均と
等しい値も多くなり
相殺されて0になること
が多くなる。
>>979 の言うことだよ。
あとよくあることか
どうかは比較対象が
ないと何とも言えない。
分散のでかい分布と
小さい分布とかね。
982 :
132人目の素数さん :2008/11/23(日) 23:46:43
測量で度から度分秒への変換プログラムを作ったのですが、 どのくらいのデータ数でテストを行えばよいのですか?
983 :
132人目の素数さん :2008/11/24(月) 05:37:25
>>978 の言ってるのって、中心極限定理の話じゃないの?
うろ覚えで理解してて、「サンプルの平均」が抜けてると思われ。
それを言うなら大数の法則
985 :
132人目の素数さん :2008/11/24(月) 10:02:52
>>984 サンプルの平均が母集団の平均に近づくだけなら大数の法則だけど、
>>983 は分散の話をしているので、分布を問題としているから中心
極限定理の正規分布の形状の話じゃないのか?
上の考えで間違ってたら、指摘してくれ。
>>982 50.138度→50度8分16.8秒とか?
プログラムが正しいかということならそんなに複雑なものじゃないだろうし
少し適当な値で確認すれば十分じゃないの?
>>978 >>985 が正しい。標本の平均μはサンプル数nを増やせば母集団の平均に収束する。また、標本平均はサンプル数を増やせば正規分布に収束する(母集団の分布に関係なく)。
標本の分散(不偏分散)はnを大きくしても母集団の分散に近づくだけで小さくはならない。全数調査すれば母集団の分散と標本の分散が一致することを考えれば自明。
>>987 母集団の分布に関係なくはないだろ。
まあコーシー分布以外の例外は知らんが。
母分布に関係なく というのが中心極限 定理の特色だと 思うけど。どんな テキストにもそう書いて ない?
標本の平均と分散なのか 「標本の平均」の平均と分散なのか
>>989 普通は「ある種の条件を満たす分布なら」と書いてあるでしょうよ。
たとえば平均と分散が存在するとか。コーシーは最も有名な反例。
>>985 標本平均 X~ が
E[X~] = μ, V[X~] = σ^2 / n
という性質を持つ話だから、μ や σ が有限ならOK。
で、サンプルサイズが大きくなると共に、標本平均の
標準誤差が小さくなること:
V[X~]=σ^2 / n → 0 (n → ∞)
は、大数の法則つまり確率収束
plim(n → ∞) X~ = μ
を表す。
この話では、中心極限定理つまり X~ の漸近的正規性は不要。
993 :
132人目の素数さん :2008/11/24(月) 20:44:04
>>992 了解した。正規性が余分てことね。
確かに弱法則でも、分散あつかえるしね。
ありがとう。
>>991 書いてないと思うけど。
例えば東大出版会の
「統計学入門」とか…。
少なくとも自分が読んだ
本の中では分布の条件
については書かれてなかった
ような。むしろ分布に関係なく
が強調されてるような…。
読み落としてる
かもしれない
から確認はしてみるけど。
コーシー分布は平均分散はないけど、
コーシー分布だと中心極限定理が
成り立たないということ
だよね?
今、ウィキで確認したら 確かにコーシー分布だと 成り立たないようだ。 一般には「分布に関係なく」 と説明されてるけど、 例外があると言うなら 厳密な表記じゃない ようだね。
>>994-995 > 一般には「分布に関係なく」 と説明されてるけど、
どこの一般か知らんが、そんなのはまともな数学の本じゃないね。
y/2
999 :
132人目の素数さん :2008/11/26(水) 01:37:15
(´ ̄ ̄ ̄`ヾ 、 ___ ):〉 , - '´: : : : : : : `ヾ--、 _/: : : : : : : : : : : : : : : : : :.\ , '´: : : : : : : : : : : : : : : : : : :ヽ : : : ヽ /: : : : : : / : : : : : : : : : : : : : : : :\ : : ', / /: : /: : : :{: : : : : : !: : : : : : : ヽ: : : :.', : : ', / /: : / : : : : |: : : : : :.|\: :ヽ\: :_:ヽ: : !: : : ! /: :/ i: : : :! 小: : : : : | \ハ/\:.|: : :|: : : ! | /|: :|: : : :|」__ \: : | イrそテト、|: : :ト、: : ! レ' |: :|: : : :| rえト、ヽ| トしr} |: : :.|} |: :| ヽ:.N: : :V〈 V ハ 弋少 |: : : |/: : :! \|\:ハ、 Vツ :::::: |: : : |: : :.ハ 八: :|: :ハ :::::: ' ノ: : :从: : : | /: :乂|: : 人 , / : : : : : : : ノ (: : : : 从: : : : >- 、_ イ: : : : __:厶:∠ __ 1000よ `>' ⌒` ー‐r-ミ: :ノ ,厶:匕彡'´ /⌒ヽ / |/ ` ミY彡 ´ / | / ̄ / / ! |.:.::: √  ̄`<_ ´ ̄⌒ ー‐ ⌒ヽ |/ \ |:::√ >===‐-- 、  ̄ ̄ ̄ ̄ \/ ! _/7´ f '´ \, -― 、 ヽ _:::: | ムへ 匕 ` 、 ` ー 、 _/::::::::::\/ ./ / /_匕 -― ' ¨  ̄ \ ` 、\)「::::::::>-、::::| : : / / / \ ` ‐< X . / / ,. ' \ \ |\ . | , r \ |: : \ . |__,. ‐: ': : :/ }ヽ、 | \: :\ : : : : : : : : : : / |: : : : > 、_ _ノ: : : : ヽ: :\
1001 :
1001 :
Over 1000 Thread このスレッドは1000を超えました。 もう書けないので、新しいスレッドを立ててくださいです。。。