統計学なんでもスレッド

このエントリーをはてなブックマークに追加
1
大型書店の数学書コーナーの半分は,統計学だ!
棚割は統計的にいっても,社会のニーズを反映している
しかるにここでは,あまり議論されていない
語るがよい.偉大な統計学を...
2132人目の素数さん:02/02/04 09:23
3132人目の素数さん:02/02/04 09:36
>大型書店の数学書コーナーの半分は,統計学だ!

眼科逝け。
4132人目の素数さん:02/02/04 10:53
統計学を数学にいれるのはやめようよ
5132人目の素数さん:02/02/04 11:45
このスレッドに書きこむのやめようよ



終了
6132人目の素数さん:02/02/04 12:07
統計学は大切だと思うが、1が最低。
7132人目の素数さん:02/02/04 13:30
ネタ振りしない1は最低
8132人目の素数さん:02/02/04 14:17
統計学専門なら数学板の引篭もり院生&学生の率を教えてくれ
91です あ:02/02/05 13:21
>>大型書店の数学書コーナーの半分は,統計学だ!
>眼科逝け。

昨日,東洋一の新書売場面積を誇る,池袋ジュンク堂で調査してきました.
数学書コーナーの半分は確かに統計学(データ解析)関連でした
ところが別の階の「経済」「心理」「生物」「医学」「マーケティング」
「製品開発」「食品学」のコーナーの数学書は,殆ど
 す べ て 統計書でした.
大体数学書のうち棚割の8割は統計学(データ解析)関連書籍でした


>>9
わざわざ調べたの? 悔しかったんですか?
_( ̄▽ ̄)ノ彡☆ばんばん!ばくばく〜〜爆笑!
11132人目の素数さん:02/02/08 00:05
統計は人をだますのにもってこいの道具だね
12132人目の素数さん:02/02/08 01:13
す、すみませーん。わざと騙してるわけじゃ、ないんですぅーー(T-T
1の書き込みを見たとき
「そーいや、ジュンク堂の数学書コーナーは
 統計の本やたらと多かったなあ…。」
とか思ってしまった俺は逝ってよしですか。
141です あ:02/02/08 11:41
>13 さみしいから逝かないで

芳林堂(池袋)も旭屋(池袋東武デパート内)も「数学」コーナー
の半分は統計学ですよ.そして「経済」「心理」「生物」「医学」
コーナーの数学書はほとんど統計学です.私は池袋のことしか知ら
ないけど.マーケティング的には数学書の売り上げの多くは
統計学だと思うな.ちなみに池袋という町は新書売り場面積は日本1
です.
15文系:02/02/08 19:48
つーか。その手の統計学は数学ではないというのが
このスレの意向のような気もする。
しかも、書き手は数学科を出てない人では。
…最近寒い書き込みが多いなぁ……夏にしてよ…そういうの。
17卵の名無しさん:02/02/09 09:01
ある集団で胃癌が15人、大腸癌が2人、食道癌が1人、肝臓癌が1人
だったとき、胃癌が有意に多いですよ、ってことを検定するためには
何検定を使ったらいいのですか。
素人なので、すみません。教えてくださいませ。
181です あ:02/02/09 09:15
比率の差の検定で,多重比較します.
オムニバス検定は情報を取り出しにくいから
2つの水準の比較のできる方法のほうがイイヨ
19卵の名無しさん:02/02/09 12:31

すみません。せっかく教えていただいたのに、
申し訳ないのですが、“2つの水準の比較できる方法”
というのはどういう検定方法なのですか。
今までstudent t-test とχ2しかやったことが
ないのでスマソ。
            __,,,,_
            /´      ̄`ヽ,
            / 〃  _,ァ---‐一ヘヽ
         i  /´       リ}
          |   〉.   -‐   '''ー {!
          |   |   ‐ー  くー |       _________
           ヤヽリ ´゚  ,r(、_>、 ゚'}   /
         ヽ_」     ト‐=‐ァ' !  <  さげ
          ゝ i、   ` `二´' 丿    \ 
              r|、` '' ー--‐f´          ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
         _/ | \    /|\_
       / ̄/  | /`又´\|  |  ̄\
     
21康煕帝:02/02/10 03:14
統計学の本が多いというより、
数学の本が少なすぎるのだね。
普通の人は読まないし…。
22132人目の素数さん:02/02/10 06:26
統計っていっても一般向けのものは、簡単な検定や推定に関する物
がほとんどだね。多変量解析なんて、あんまり一般人はよまんわな。
ましてや、時系列解析なんて・・・。
23名無しの研修屋:02/02/10 14:49
>>22
昔に比べると多変量解析の一般向けの解説書は随分充実してきていると思う。
パソコンの普及と関連があるのだろう。
24駄文:02/02/11 00:46
>>23
パソコンとWinMX
25132人目の素数さん:02/02/13 06:24
>>19
χ2検定で対比較。
胃癌がもとから多そうだとわかっていたら危険率/3,
そうじゃなかったら危険率/10の限界値で。(分母は比較の数)
Bonferroni(綴り不確か)不等式の利用(Dunnの方法)。
つー方法ではだめですか?
26nanasi:02/02/13 11:36
すいません。おじゃまします。統計初心者です。
n=70名程度の、BMIが平均25だったのが、半年間の運動後に23.5まで下がりました。
この場合の検定をする場合、独立した2群となるのか関連した2群となるのか教えてください。
お願いします。
27132人目の素数さん :02/02/13 11:44
>26
関連した2群(対応がある場合の2群の平均値の差の検定)だぴょん
28132人目の素数さん:02/02/13 13:22
>22

時系列解析って役にたつの?
株価・為替・景気
何とか総研とかで,計算機ぶん回して
今年の予測とかいうけど,あたらんよ
29nanasi:02/02/13 23:56
>27さん。ありがとうございました。
もうひとつ恥ずかしい質問してよろしいですか。そうすると、F検定の必要はないって
ことですか。
30132人目の素数さん:02/02/16 12:03
>29
ないよ
31どらむすめ@:02/02/16 21:32
皆さん初めまして!私はこの春、大学生になる者です。
どうやら、うちの大学は1年で統計解析をやるようで、
ちょっと予習しとこうかな??って思っています。
何かいい本・やり方などありましたら教えてください。
(統計解析の公式って、高校数学の確率分布とカブっていませんか?
間違っていたらごめんなさい)
sage
33132人目の素数さん:02/02/17 01:05
初歩の統計学は高校数学の確率分布ともちろんかぶっているよ。
僕はちゃんと読んだことがないけど、ブルーバックスの
「推測統計 はじめの一歩」でも読んでみてはいかがでしょうか。
ちゃんと勉強するのにはともかく、寝ながら読むのには楽しそうな
感じの本です。

そういえば、昔、鈴木義一郎先生のブルーバックスの
赤池情報量基準に関する話の書いてある本読みかけたことが
あったけど、あの本なんでしたっけ?多分今は絶版になっていると
思うのですけど。鉛筆持ちながら読んで、誤植が多くてちょこちょこ
修正入れた記憶があります。
34132人目の素数さん:02/02/17 08:04
>>29
ただ単純に>>27の方法を取らないほうがいいことがある。
たとえば変化の度合いが前値に相関するうようなとき。
こういう時は比をとってそれが1ではないかどうかしらべる。(のだったような)
35高校2年生:02/02/17 08:12
>>28に乗じて

高校数学の各分野って 現実社会で何に役立つか教えてください。
36132人目の素数さん:02/02/18 19:30
(Ω,F,P) : 確率空間
X_k : Ω→R^n,(k=1,2,3,・・)
X : Ω→R^n
らを確率ベクトルとします.
ここでX_kがXに分布収束するとは
P(X<x)の任意の連続点xで
P(X_k<x) → P(X<x) (k→∞)
となることです.
しかしこれはX_kやXが確率ベクトルであるからこのように定義できるのですが、
ではX_kやXをヒルベルト空間への写像であるように定義したら分布収束の定義は
いったいどのようになるのでしょうか?
これは「統計的漸近理論」を勉強していたときに思いついたことです.
37132人目の素数さん:02/02/19 08:33
>36
「統計的漸近理論」は,遠からず滅びると思われ...
38132人目の素数さん:02/02/19 11:24
>37

なぜ?
39132人目の素数さん:02/02/19 12:28
>>35
スレ違いだと思うが、一応いっておくと
「高校数学の各分野って 現実社会で何に役立つか教えてください。」
という質問に対しては
「あらゆる分野で役に立っている」
といえる。君がネットにつないで2chでこんな質問ができる
ようになるまでにPCの基盤設計からネット上の圧縮技術etcまで
どれだけの数学が用いられているかを考えてみればわかるだろう

でも多分君が聞きたいのは「俺が今数学を勉強して
俺にとってどれだけ役に立つのか教えれ」ということだろう

んなもんは君がどんな人生を選択するかによるわな。
そして何をもって「役に立つ」と定義するかにもよる。
役に立つ=金銭収入を獲得する手段
ならば
別に数学にスの字のわからんで年収1億超える大リーガーに
なるならいらんだろうし、理系研究者になるなら嫌でも必要
役に立つ=騙されないようにする
という意味なら、数学的思考を持ってるといろいろ便利だろうな
統計のウソを見抜くことができるようになる

以上、あとはあんたの問題
「高校で部活動をやって現実社会で何に役に立つのか」
と対して答えは変わらんと思うよ。
40132人目の素数さん:02/02/19 13:31
いま39がいいこといった
4137:02/02/19 15:10
>38

純粋数学としては美しくない・深みも無い
応用数学としては,役に立たない
42132人目の素数さん:02/02/19 16:19
>41

なぜ?
43132人目の素数さん:02/02/19 16:23
部活程度の関わり方では、という条件が付けば、

「純粋数学としては美しくない・深みも無い
応用数学としては,役に立たない」

というのは真実ではないでしょうか。
44132人目の素数さん:02/02/19 16:36
なぜ?
45132人目の素数さん:02/02/19 16:47
応用数学として、高校生程度の対象者に好まれない理由は、簡単な統計処理が既に普及しきっているため、
労働市場でのその個人の価値を高める感じがしないからだと思います。逆にファイナンスの分野などで、
それが理解されたり必要とされているかがややあやふやな感じもしますが、
ルベーグ積分などが高く評価されている傾向がある気がします。

純粋数学への入り口としては、数学史的な位置付けが曖昧なのか、解析や幾何と異なり
ややドラマに欠ける紹介の仕方がされる面があるようです。

個人的には、エントロピーの凸性などと、カントールなどの議論とは、
物理的なイメージさえ払拭すれば非常に近い対象を議論している様に思えるので
アマチュアファンの関心も今後広がっていくと思っています。
46132人目の素数さん:02/02/19 17:01
でっ?
47132人目の素数さん:02/02/19 17:04
確かに今から「統計的漸近理論」ってやってみようとは思わないな。
分野として成熟していそうだから、いまからはじめても最先端の内容に
追いつくまでに沢山勉強しなきゃいけなさそうだし。
統計的漸近理論ってブームは20年前(80年代)でなかったけ?
竹内−赤平先生の高次漸近理論とか。

結局、かつての統計学の研究された蓄積が、計算機の登場ですっかり
変わってしまい、大量のデータが扱える昨今においては検定論は使えないし
(検定論自体、とーーーっくの大昔に研究分野として終わっている。
しかも勉強してもつまらなそう)、分布論の漸近展開はブートストラップ法が
考え出されてすっかり下火になってしまったそうです(豊田秀樹氏の著書による)。

統計的漸近理論に限らず、現在流行のゲノムと金融工学も何の成果も出ずに
いずれ滅びるのではないかな。俺はやらんが。
48名無しの研修屋:02/02/19 20:06
>>33
「先を読む統計学 〜『情報量基準』とはなにか」でないの?
鈴木先生の講義を十数年前直接受けたことがあるよ。
49nanasi:02/02/20 01:42
議論の腰を折るようですけど
ありがとうございましたー。
50132人目の素数さん :02/02/20 08:12
>統計的漸近理論に限らず、現在流行のゲノムと金融工学も何の成果も出ずに
>いずれ滅びるのではないかな。俺はやらんが。

おれもそうおもう とくに金融工学なんて
素人にはわからない目くらましで,素人から金をまきあげる
ことにしか,現時点では貢献?してない.ほとんど犯罪だ
そのうち「難しい金融商品はかわない!」といわれて
ほろんでいくだろう

>>43
部活程度ったって高卒ですぐエースになるやつもいるしなあ。
53132人目の素数さん:02/03/30 15:04
さらしあげ
54132人目の素数さん:02/04/01 21:45
この板、初めてみたけど、「132」に引っかかってね。

http://www.y-tamaru.co.jp/book_2/index.html
1994年に株で132連勝したって話。
内容は知らないが、(多分真実ではないと思うが)
単純に132連勝って確率的には、もう2度と起こりえないくらいの確率と思う
みんなどう思う?
55132人目の素数さん:02/04/02 03:21
>>22
古い話に戻るけど、
最近、多変量解析を使う人が増えたのは
RとかSystatとかのお手軽なプログラムのお陰だと思う.
理解できていない内から結果だけは出せるから、
使ってるうちにわかってくるんだよね.
Vistaみたいに3主成分の3Dをグリグリ廻したりできると
分布の様子もよくわかるし.

その点、時系列分析の方は馴染が無いんだけど…
誰か紹介して下さい.(教えて君ですまんが)
56132人目の素数さん:02/04/02 23:30
数学者(関係者)がつまらないといっている統計と実務者が役に立つといっている統計学には少々隔たりがありますねぇ。

研究分野として数理統計学がどのように面白いかは私にはよくわかりません。
もちろん未解決の問題もありますし、発展も続けています。

しかし、統計としての面白さは実際の問題へ応用するというデータ解析のツールになった時だと思います。
この板にある癌の話だったり、BMIの話だったりする時に、仮定をチェックするということも統計をデータ解析へ利用する時に必要な作業です。
χ2検定であってもt検定であっても仮定があります。数理統計を勉強しておくとどんな時にχ2検定が利用可能であって、どのような時にχ2検定がだめになるかということがわかります。
研究テーマとしての数理統計学は私には評価できませんが、勉強するにはとても有用な分野ではないでしょうか。

後、データが大量に採れるようになっちゃったので、一部の領域では分布すら使わなくなってしまいましたね。
そんなんで、「この領域で使われている情報処理技術は統計か?」ということもあります。
漸近論はコンピュータのお陰で色あせてしまいましたね。
ブートストラップもコンピュータが高速になったお陰で気軽に使えるようになりましたしね。
57132人目の素数さん:02/04/03 05:55
BMIってナーヌ?
Body Mass Index のこと?
58132人目の素数さん:02/04/15 20:12
ageちゃおう。  えへ
59132人目の素数さん:02/04/15 23:04
多変数量解析ってあんまり ナウじゃない?
60132人目の素数さん:02/04/20 20:16
統計のPCソフトなんか使っているのある?


おれっち?
おれっちは、貧しく表計算そふと。
もっと貧しくR(GNU S)
62132人目の素数さん:02/04/20 20:28
数学部の人だと。CとかFortranとかで
バリバリしちゃうんすかねえ。やっぱり。
GNUは使い方がよくわからない(泣
>>62
寒い寝たふり止めれ
64132人目の素数さん:02/04/21 11:42
貧者のS子 R子でしょ
65132人目の素数さん:02/04/29 23:55
まともな数学科で統計なんてやってる所ってどこ?
66132人目の素数さん:02/05/01 22:38
ないの?
67132人目の素数さん:02/05/02 00:00
標本x_1,x_2,…,x_nに対して、標本中央値が
f(a)=1/n納i=1,n]|x_i-a|
を最小にするaとなることを示せ。但し、nは奇数とする。
さて、どうやって解けばよいですか??
68132人目の素数さん:02/05/02 00:12
x_1,x_2,…,x_nを小さいもん順に並べたのをw_iとして
y=f(x)=培x_i-x| のグラフを考えると
y=f(x)ってのはx=w_iのところで折れ曲がる下に凸な折れ線になる。
グラフの頂点は当然(n-1)/2で。

こんな感じでいいのかなあ。
↑自分で書いといてなんだが、むちゃくちゃだな。
でも面倒くさいのでw、がんばって解読してね。

でもグラフの頂点は(n-1)/2じゃなくてw_((n-1)/2)でした。
70132人目の素数さん:02/05/02 00:29
>>68
ありがとうございます。
>y=f(x)ってのはx=w_iのところで折れ曲がる下に凸な折れ線になる。
のところがいまいちわかりません。標本中央値なので、
頂点(最小値)がn=2k-1とした場合は(2k-1)/2になる、というところまでは
わかりましたが・・・。

y=f(x)=培w_i-x|
だよね。

x<w_1のとき、y=f(x)=(w_1-x) + ... + (w_n-x) でこの直線の傾きは n ね。

xがもっちょい大きくなって w_1 < x < w_2 になると
y=f(x)=(x - w_1) + (w_2-x) + ... + (w_n-x)
で傾きは(n-2)になるよね。

こうやってxが増えると直線の傾きがどんどん増えていくんでこのグラフは下に凸な折れ線になります。
ゴメソ、大嘘。

× x<w_1のとき、y=f(x)=(w_1-x) + ... + (w_n-x) でこの直線の傾きは n ね。
○ x<w_1のとき、y=f(x)=(w_1-x) + ... + (w_n-x) でこの直線の傾きは -n ね。
~~~

× で傾きは(n-2)になるよね。
○ で傾きは(2-n)になるよね。
73132人目の素数さん:02/05/02 00:56
>>71
はい!!先生しつもーん!!
傾きが増える??なんで??
あと、>>67を普遍的に示すとしたらどのように記述しますか?
>傾きが増える??なんで??
w_i < x < w_(i+1) のとき、Σの中のn個の項のうち、
i個の項のxの係数が(+1)になり
(n-i)個の項のxの係数が-1となるので、
f(x)のxの係数は(2i-n)。
xが増えることはiが増えることだから当然係数も増える、と。
もちろん係数はxの増加にしたがって連続的に増えるのではなく、
x=w_iの地点で離散的に増えるのよ。

>あと、>>67を普遍的に示すとしたらどのように記述しますか?
「普遍的」をもっと詳しく述べよ。

眠くて仕方ないのでてにをはが変なのは勘弁してくれ。
多変量解析って何冊が読もうとしたが、どうしてもよくわからない。
わかりやすい本があったら教えてください。
7675:02/05/04 22:12
追加。ブルーバックスの「複雑さに挑む科学」ならやさしいのかと思ったら
わかりにくかった。助けてくれーーー。
77743:02/05/05 00:02
> 75,76
多変量解析について、どういうことを知りたいのか、何がしたいのか?

例えば、単にパッケージソフトが使えるようになりたいのか、
それとも、もっと深く理解してプログラムが作成できるように
なりたいのか?

いろいろレベルがあるだろう。

それがわからないと、アドバイスも出来ないと思われ。
78132人目の素数さん:02/05/05 00:02
>>75
「図解でわかる多変量解析」(日本実業出版社)がおすすめ↓。
http://www.amazon.co.jp/exec/obidos/ASIN/4534031858/250-2293735-0715454
私大法学部出身の私でもよく理解できた。
ブルーバックスの「複雑さに挑む科学」は分かりにくい上、致命的な誤植がある。
7977:02/05/05 11:31
> 75

多変量解析の本は何冊か見たけど、
わかりやすかったのは;

『多変量解析入門―自由自在に使いこなすコツ』
http://www.amazon.co.jp/exec/obidos/ASIN/4496027526/qid=1020565330/sr=1-26/ref=sr_1_2_26/250-1973991-3253010

かな。

わかりやすいと思ったのは、代表的な分析手法に的を絞った上で、
きちんと式を導きつつ説明しているから。

『複雑さに挑む科学』は未見だけど、
著者の柳井はこの世界の有名人らしい。

柳井の別の著書(『多変量データ解析法』、朝倉書店)は持っている。
コンパクトな本だが、さまざまな手法が紹介されていて、
便利そうではあるが、初学者にはわかりやすいとは言い難い。
80132人目の素数さん:02/05/05 13:20
わは
8175:02/05/05 22:35
77さん、78さん、親切にありがとう。

 マーケティング関連の仕事をするようになってあわてて多変量解析
が必要になってSASを使わなくてはならなくなったんだが、
多変量解析の教科書がみなわかりにくくくて困っているわけだ。
 
 俺は文系だから高校数学までしかやっていないが、はっきりいって
数学は得意だったから、何の不安も抱いていなかった。ところが
実際に見るとブルーバックスですら実にわかりにくい。
 
 例えば、今手元にある別の入門書で言うと、重回帰分析で回帰係数
を出すところまではなんとか分かった。ところが、そのあとの
検定がわからない。何の説明もなく自由度とかF分布とかがいきなり出てくる。
なんじゃこりゃ。初心者向けの入門書を書くのは実に難しいとよく
言われるが、実際にそうなんだろうなあ、と実感した。

82132人目の素数さん:02/05/06 03:07
>>81
入門書については、大学の教員が高校卒業生の持っている知識をそれほど
把握しているとは言いづらいし、ページ数の制限があることなどから難しい.

81で問題になっているあたりはたぶん学部教養向けの統計の本、
例えば「統計学入門 東大出版会」あたりを読めばその辺の知識はつきます.
8377:02/05/06 07:06
> 75
なるほど。

82さんも書いているけど、統計の基礎についての知識はあった方が
良いと思います。教科書は、やはり、東大出版会の『基礎統計学I 統計学入門』
シリーズをお勧めします。この際だから、『基礎統計学』のシリーズを
3冊とも備えておくと、後々まで重宝するでしょう。

あと、数学のレベルですが、上記のシリーズにしても、
先日御紹介した本にしても、式の導出については、大学の教養程度の
数学、具体的には線形代数と解析学(微分積分)の知識が
前提になっています。

文系であっても、経済学などでしたら、履修済みの範囲だろうと
想像しますが、必要に応じて補うことで、理解が豊かになると思います。

使い方は手早く、原理はじっくり勉強するのが(当たり前ですが)
お勧めです。
8477:02/05/06 07:09
訂正&補遺

> 東大出版会の『基礎統計学I 統計学入門』シリーズ

『基礎統計学』シリーズですね。その第1巻が『統計学入門』です。
第2巻には、多変量解析(因子分析とか多次元尺度法)が紹介されています。
また、第3巻では、回帰分析のやや詳細な説明があります。
85132人目の素数さん:02/05/06 10:42
>81
統計はやたらと分布とかを覚えろ覚えろって感じ。
なので、数学科の人も嫌がる傾向あり。
上級になっても分布として載っているだけ。
高校の世界史の教科書とかじゃあるまいし、事項だけ覚えろってのか。
8677:02/05/06 11:36
>84

確かに、統計学の教科書では分布の話がたくさん出てくる。
それは、分布を特定した方が、解析がしやすいからだ。

しかし、上級の(大学院向け以上の)テキストでは、特定の分布を
想定できないケースの解析のための、ブートストラップ手法や
ノンパラメトリック回帰なども扱われる。
8785:02/05/06 13:41
>86
84でなくて85でないのContextからして。
イヤそういう意味でなくて、どういうことらかそのような分布が
出てくるとか考え方が示されていないとか。
導出の仕方が省かれている書物が多いということ。
8877:02/05/06 14:19
>87
確かに、84ではなくて85さんに書いたものです。

導出の仕方が省かれている書物が多いのは、ご指摘の通りですな。
(さきのレスでは、85氏の指摘を読み損なってるな)

きちんと導出するのは結構大変なので、
手を抜いている本が多いんだと思う。
# しかも、「わかりやすい」とかうたっている本に、
# そういう傾向が多いように思えるんだが…。
8987:02/05/06 14:24
>88氏
やさしい本に暗記型が多いように思えます。
もともと数学が嫌いなひとに、ますます嫌気が差すように作られて
いるような気がする。
漏れが見た中でそうでない本は。
国沢清典『確率論とその応用』
竹内啓『数理統計学』
ぐらいだけど。まあ、辞書として使うのだけど。
他にもあったら参考までに教えてください。
9077:02/05/06 15:34
>89さんへ
ぼくが読んだ範囲(斜め読み含む)では、

柴田 文明,"確率・統計", 岩波書店

が、細かい式の導出もしていて良かったです。
あと、古めの本では、

小針 あき宏, "確率・統計入門", 岩波書店

も、いちいち式を導出していました。
(が、冗談の部分が多いので、個人的にはスカン)

あと、未読だけど、

鈴木 武, 山田 作太郎, "数理統計学", 内田老鶴舗



柳川 尭, "統計数学", 近代科学社

は、更に本格的なレベルへの統計の入門書として、
そのうち読みたいと思っています。

(もちろん、87さんが挙げている2冊も定評のあるものだと聞いております。
『確率論と〜』は、フェラーの本ではなかったかな?)
9189:02/05/06 16:08
77さん。
挙げられた本のなかで知らないのは。
>柴田 文明,"確率・統計", 岩波書店
>鈴木 武, 山田 作太郎, "数理統計学", 内田老鶴舗
です。ちょっと図書館辺りで見てみたいと思います。サンクス。
あと、国沢さんの本は名著と云われるフェラーと同名の本です。
ちなみに岩波全書です。
>>85 を読んで勇気付けられた。
やっぱりみんな苦手意識 (というか嫌悪感というか) 持ってるのね。
93132人目の素数さん:02/05/06 20:34
>>85
そういう人には情報幾何学が良いのではないかと.
9475:02/05/06 21:19
 amazonははやい。「図解でわかる多変量解析」は今日届いた。77さんが
挙げてくれた「コツ」の本も即座に注文したので近日中に届くはず。「図解」
を見るとなるほど分かりやすそう。でも付録の検定のところでF分布とか
自由度とかやっぱりいきなり出てくる。皆様のアドバイスどおり、
ここらへんは要するに統計学の教科書で学ぶしかない、ということなのかな。
皆様親切にありがとう。
 
 ところで俺はここで話しているうちに大きな潜在需要を感じた。
数学に得意意識をもっている俺ですら(かなり偉そうな言い方だが)
ヒーヒー言ってるんだ。マーケティング担当なんて文系出身の人間が
多いはずだが、そいつらの中には数学なんて見るのも嫌な人間だって
かなりいるはず。そんな連中にいきなりシグマなんかがどんどん出てくる
本を見せたらそりゃアレルギー起こすよ。
 マーケティングの現場に即してわかりやすく多変量解析を教える本なり
講座なりを企画したら大ヒットするんじゃないかな。
少なくともまだそういう本や講座は相当不足していると見たね。
例えば「やさしいマーケティングのための多変量解析」(清水功次著)
なんて本があって、書名に惹かれて買ってしまったが、中身はとてもわか
りやすいとはいえないものだった。
 
 ところで77さん、「複雑さに挑む科学」の誤植ってなんですか?
柳井氏というのは学問的な業績は俺がわかるわけないけど、啓蒙書を書く
のはうまいとは言えないんじゃないかな。乱暴な断定だが。 
集合論は奥が深い
9678≠77:02/05/07 00:07
>>94
私の手元にあるのは大分古いので(1989年12月5日第23刷)最近のは直っているかもしれないが、164ページのベクトルの意味の説明でベクトルOHとベクトルOFの説明が逆になっている(159ページの図の説明と違うので注意してみればすぐわかることだが)。
9778:02/05/07 00:32
あと「統計的方法のしくみ」(日科技連)↓は統計学を学ぶ上でつまづきやすい点(自由度等)について詳しく説明してある。
http://www.amazon.co.jp/exec/obidos/ASIN/4817102942/250-2293735-0715454
もっとも大学で数学を専攻しなかった文系にとっては決して易しいとは言えないが。
経営畑出身だけど
むしろ、マーケティングの連中のほうが
統計解析をしてるんじゃないのかなあ
おれもやったし
99132人目の素数さん:02/05/11 20:14
確立ってはやり、マイナーかんな。
本でもあんまり取り上げにかな
>>99
は〜っと。
P=何たら、ってまさに確率そのものなんですけど。
101132人目の素数さん:02/05/14 00:39
>85
まじめに勉強すると統計的分布論はかなり深みのあるテーマだと思います。
ピアソン分布系、対数正規分布、逆ガウス型分布、楕円型分布などなど。
多変量解析だろうと時系列解析だろうと全ては分布論に帰着する。
102132人目の素数さん:02/05/14 00:40
統計的分布論は10年の冷や飯を覚悟しなければならない。
103132人目の素数さん:02/05/14 12:28
洋書で、統計学の最強書を教えてください。
104132人目の素数さん:02/05/14 12:51
>>103
ワラタ
10585:02/05/14 18:05
>101
その辺りを直観的に説明してくれる本がないような気がする。
正規分布の証明に必要なスターリングの公式の証明が
結構スゴクてビックリした覚えがある。
106103:02/05/15 06:57
ワラテナイデオシエテヨ
107103:02/05/16 07:00
age
108132人目の素数さん:02/05/16 14:18
>>105
>スターリング

フェラーの確率の教科書にいい説明なかったかな?
109132人目の素数さん:02/05/16 21:21
>108
フェラーは高いよぉ〜。
110132人目の素数さん:02/05/16 22:31
30分5000?
ソビエト連邦?
112112:02/05/22 19:02
「心理学のためのデータ解析テクニカルブック」って
どんな感じ?
113743:02/05/22 21:24
> 112

心理関係では割と評判は良いと聞くので、もっている。
が、ほとんど読んでいない。

読んだ範囲で言えば、数学的な統計の本と言うよりは、
数値例(計算例)を出して、読者を納得(≠理解)させようという感じ。
公式は出ているが、その導出までは載っていない。

数学板の住人にはあんまり受けないと思う。

# 心理板にある、心理統計スレッドで聞いた方がいいかも。
114132人目の素数さん:02/05/22 21:32
>113
つーか。統計ってそんな本ばっか。
115112:02/05/22 21:45
>>113
ありがとうございました
116132人目の素数さん:02/05/22 22:45
国の機関に統計なんたらってあるよね。
あれって何?
117132人目の素数さん:02/05/22 23:15
>>116
総務省統計局のことか?
ここは国勢調査や物価統計などの国の指定統計を実施している現業官庁だよ。
来年には独立行政法人になる予定。
文部科学省の統計数理研究所のことならこの板にスレ↓があるよ。
http://science.2ch.net/test/read.cgi/math/1005729178/l50
>>117
統計数理の方でした。
情報ありがとう。
見学行こうかなぁ。
119132人目の素数さん:02/05/26 21:46
経済企画庁は?
120132人目の素数さん:02/05/27 01:24
こんな本はどうかな

多変量解析の基礎 : 培風館 (1992-01-20出版)
http://bookweb.kinokuniya.co.jp/guest/cgi-bin/wshosea.cgi?W-NIPS=9920019119

多変量解析序論
http://bookweb.kinokuniya.co.jp/guest/cgi-bin/wshosea.cgi?W-NIPS=9975302521

StatView多変量解析入門
http://bookweb.kinokuniya.co.jp/guest/cgi-bin/wshosea.cgi?W-NIPS=9974655269

統計ライブラリー 初等多変量解析 朝倉書店
http://bookweb.kinokuniya.co.jp/guest/cgi-bin/wshosea.cgi?W-NIPS=9972213072

パソコンで学ぶ多変量解析の考え方
http://bookweb.kinokuniya.co.jp/guest/cgi-bin/wshosea.cgi?W-NIPS=9971260832

多変量解析の歴史 :現代数学社
http://bookweb.kinokuniya.co.jp/guest/cgi-bin/wshosea.cgi?W-NIPS=9970106740

ロータス1‐2‐3による多変量解析入門 : 日本経済新聞社 (1991-10-25出版)
http://bookweb.kinokuniya.co.jp/guest/cgi-bin/wshosea.cgi?W-NIPS=9910694093


121132人目の素数さん:02/05/27 21:35
そのものずばり、線形代数との橋渡し

統計解析のための線形代数  :三野 大来 (著)
http://www.amazon.co.jp/exec/obidos/ASIN/4320016777/qid=1022500444/sr=1-6/ref=sr_1_2_6/249-3894865-7608327

ありますな
122132人目の素数さん:02/05/29 01:25
俺は薬学出身なんだが、最近統計が必要になってきた。
自分でやるわけではないんだが、統計解析屋さんと喧嘩できるレベルになれなどと無茶なことを上司に言われ、
学生時代に使った薄っぺらい教科書を出してきて読んでみたもののさっぱりわからない。

このスレで紹介されているものを少し見てみようと思います。
ああ数式の羅列を見ると吐き気がする。
>統計解析屋さんと喧嘩できるレベルになれなどと無茶なことを上司に言われ、
 なんか、納得できる。
 なるほど統計解析屋さんか
125132人目の素数さん:02/06/15 02:29
分野別スレage
126132人目の素数さん:02/06/22 23:38
標準偏差から、変動率を出すにはどういう計算をするのでしょうか?
インターネットで検索しても株のサイトしか出てきません。
127132人目の素数さん:02/06/25 01:11
分野別スレage
>>126
変動係数という意味なら標準偏差÷平均値だよ。
129132人目の素数さん:02/06/26 21:28
分野別スレage
130132人目の素数さん:02/06/28 19:59
131132人目の素数さん:02/06/29 01:20
統計学において、データの数が少ない時にその統計の正確さを表す公式を
教えていただきたいんですが。
自分は統計学を学んでないんでよく分からんのです。
132132人目の素数さん :02/06/29 12:53
1羽の鶏が産む卵の重さは正規分布に従うとする。ある鶏が産んだ10個の卵の
重さ(g)を
測定したところ
68.1 70.4 71.5 67.6 70.2
74.5 68.6 70.3 71.2 69.6
であった。この母集団の平均をm1とする。
 この鶏に1週間あるビタミン剤を混入した飼料を与えたところ、6個の卵
を産み、その重さは
72.7 69.4 74.2 70.6 69.0 72.5
であった。この母集団の平均をm2とする。
@このビタミン剤は、投与前より5グラム重い卵を産むような効果があるかどうか
検定せよ。
 ヒント 等分散の検定(有意水準5%)を行い、等分散と見なす場合はt-検定を行
う。
t値のなかに、m2−m1=5(前回はm2−m1=0)を代入する。
Am2−m1を、信頼率95%で区間推定せよ。

これはどうやって解いたらいいんですか?
133でーらー:02/06/29 13:42
>>131
正規分布なんかでよく出てくる(
 もしくは m-1.96σ/√n

σ/√n
で見る
>>132
@等分散の検定は、F分布を使う。
Am+t(n)*σ/√nの mをm2−m1に変える。σは、10個の時の分散と6個の時の
分散を加重平均したものを使う。

統計を学ぶときの入り口としての演習書なら
明解演習 数理統計 小寺平時著 共立出版
を漏れは薦める。

134132人目の素数さん:02/06/30 22:40
>>132 これは統計学入門の名著である、小針「確率・統計入門」岩波書店
1973年 に掲載された例題 (p.204 および p.210)。しかし、原著には
ビタミン剤の商品名を特に「コケコッコー」としているのに、上の引用
では省略されている。引用が不誠実。よって、回答は教えない。
136132人目の素数さん:02/07/01 12:42
最尤法の尤度がよくわからないです。
分布がy=x~2だったりすれば尤度関数はどうなるのですか。
137132人目の素数さん:02/07/16 23:20
確率変数Xは正規分布(10,3^2),Yは(5,4^2)に従い、互いに独立です。
Z1=X+Y Z2=X-Y Z3=XY とすると
Z1,Z2,Z3の期待値と分散、Z1とZ2の共分散、Z1とZ3の共分散を求めなさい。
誰かこれの答えを教えてもらえませんか?
よろしくお願いします。
138132人目の素数さん:02/07/17 11:36
age
139132人目の素数さん:02/07/17 21:24
137です
誰かこの問題を教えていただけませんか?
できれば具体的な数字で答えをしりたいのです。
お願いします。
140132人目の素数さん:02/07/18 23:58
>>139
宿題くらい自力でやれ。
141132人目の素数さん:02/07/19 20:29
変動係数を用いてばらつきを評価するときの長所、欠点を教えて欲しいっす。
142132人目の素数さん:02/07/19 21:16
 
143132人目の素数さん:02/07/20 14:50
t分布は自由度が大きくなるにつれてスソが軽くなるように見える。
実際、自由度は∞のときに標準正規分布になることが知られている。
なぜそのようになるのかを説明せよ。って問題だれか教えてくれませんか?
144計量士さん:02/07/21 00:47
>>141
利点
平均を1とするので、
数字の桁数が異なるものでも、同じものさしで
ばらつきの大きさを評価できる。
欠点
まともな使いかたをしたらないんじゃない?

ところで、
統計の中級者、上級者向けの本を紹介してほしいです。
今日、近所にある本屋にいったら、
丸善出版のなんか、MITで使ってる教科書の日本語訳
とかいう本が売ってました。
これは、初心者には難しいでしょうか?
145ななしさん:02/07/21 06:30
> 144

> 統計の中級者、上級者向けの本を紹介してほしいです。
……略……
> これは、初心者には難しいでしょうか?

↑この2行、矛盾してない?
 中級・上級向けが欲しいなら、初心者にとって難しいかどうかは関係ないでしょ?

それと、統計の中級者・上級者ってあんまり意味がないと思う。
統計学ってのは基礎があって、後は個別のトピックがいろいろあるような
分野だと思うから。

そこで、東大出版会の『基礎統計学』シリーズ(全3冊)をお勧めしておく。
このレベルを一通りマスターしたら、あとは関心のある個別のトピックを
扱う専門書に進むのが良いと思う。
146132人目の素数さん:02/07/21 06:39
147132人目の素数さん:02/07/21 10:44
人数、平均値、標準偏差で
平均値の差の検定のやり方教えてください

こ れ か ら は 世の中 統 計 学 が 面 白 く な る わ け だ が 
151ななしさん:02/09/06 00:45
統計解析でよく使われるという「SAS」ソフトウェアに付いて詳しく教えて下さい。
異業種(化学専攻を卒業)を退職し現在無職。SASのオペレーターへの転職を検討中
です。
30代にして人生この先、食べていけるでしょうか。
>>151
よく存じ上げませんが、
ttp://www.sas.com/offices/asiapacific/japan/
153132人目の素数さん:02/09/07 20:45
はじめまして。
株の値動きについてシステム化しようと思い、統計学を基礎から学ぼうと思っています。
このような方面の人にお薦めの統計学の良書をいくつか教えてください。
統計解析学になるのでしょうか?
154132人目の素数さん:02/09/09 11:24
ブランドのポジショニング分析をしたいのですが
SPSSとかで可能でしょうか
155質問:02/09/12 03:27

主成分分析を勉強しています.
あるデータセットで主成分分析をし,主成分得点の表を作ったのですが,その時
求められたの軸を使って,他のデータセットの主成分得点の表を作るにはどうした
ら良いのでしょうか?
わかる方,よろしくお願いします!
>>153
ポートフォリオとかでしょ。
多変量解析の中でも特に主成分分析を使うと思います。
タイトルは統計解析よりむしろ多変量解析で探した方が良いと思います。

>>155
最初に得られた固有ベクトルでスペクトル分解して
各固有ベクトル方向の値を求めれば主成分得点が得られます。

しかし、他のデータセットを加えて改めて主成分分解してみる
などしたほうが主成分が妥当かどうかを見られるので良いのではないでしょうか?
157数学初心者:02/09/12 14:41
ブートストラップってどういう理論の元に成り立ってるのですか?
本を読んでもいまいちわからなくって・・。
158132人目の素数さん:02/09/12 15:02
学部生です。最尤法をつかうことになってしまって相談させて
ください。

JavaないしMapleVでできますか?いまんとここれしかできないす。
しかしJavaには数値計算ライブラリあるのかすら知らないし、
Mapleは数式処理しかしたことなくて、データをロードして
数値計算したことないっす。

ほかの言語ないしツールのほうがいいですか?2,3万の
なら手が出るので買って自分のパソコンにいれようと思うんですが。
アドバイスよろしくお願いします。
159132人目の素数さん:02/09/12 17:02
文系学生から質問です。
統計解析なんてSASなどのソフトの使い方を
知っていればそれでじゅうぶんなのでは?
うちのゼミでは背景にある理論的なことまで
(確率分布の話とか)
やっているけど何の価値があるのかわかりません。
>>159
学生な上に文系だから。
そう、価値がないんだよ。
気が付いた?
161132人目の素数さん:02/09/12 19:35
>>156
> ポートフォリオとかでしょ。
> 多変量解析の中でも特に主成分分析を使うと思います。
> タイトルは統計解析よりむしろ多変量解析で探した方が良いと思います。

レスありがとうございます。ずっと待ってました(w

多数の銘柄間の値動きの分析と言うよりは、一つの銘柄の、一定期間の値動きを
分析しようと思っています。
一日の日中の値動きや、1週間の値動きの癖を探し出そうと思っています。

これも多変量解析の書籍で大丈夫でしょうか?
162132人目の素数さん:02/09/13 01:01
>>155,156
単純に、最初のデータセットで求められた固有ベクトルの式に代入すれば良いんじゃないの?
スペクトル分解って何?
>>162
高校生にスペクトル分解は無理かもな(w
>>161
ちょっと言っている意味がよく掴めていないのかもしれないんだけど、
『一つの銘柄の一定期間の値動き』というのは
主成分分析の場合は、他の多くの銘柄と連動しているから、
それらとどの程度関係があるかを主成分で観る訳だよね。

『一日の日中の値動きや1週間の値動きの癖』
主成分を計算するためのデータ一つ一つが期間の平均値として扱うだけ
ということでは不充分なんだよね?

値動きのもっと微分的な視点が必要ということなら
「時系列分析」にあたると良いと思う。
ちょっと手ごわいかもしれないけど、こっちの方がホットトピックかも。
165132人目の素数さん:02/09/13 04:23
>>163
大学生でもスペクトル分解わかりませんが何か?
宮廷理系ですが何か?
欝山車脳。

>162は別にあってるんじゃないか?
166132人目の素数さん:02/09/13 19:55
>>164
何度もレスありがと。

銘柄によってはまったく他の銘柄と相関関係の無い物もあるのですよ。
あと、例えば9時半に各銘柄がその日の高安値がつくとか、3月後半はいつも高い、
等の癖があるので、それを見分ける為に統計学を利用出来れば、と思いまして。

微分的と言われると数分単位なのかもしれませんが、教えていただいた時系列分析の
書籍を探してみます。
167フリーター:02/09/14 02:19
>>166
やりたいことはパターン認識っぽいね。
ニューラルネットワーク、GA、ヒドンマルコフモデルとかざっと調べるといいかも。
168167:02/09/14 02:21
>>166
補足。取引毎のデータを扱う統計学は最近かなり発達してる。
専門の研究室にいないとデータを手に入れるのが大変かもね。
携帯が普及すると、コンドームが売れなくなる!?
http://www.zakzak.co.jp/top/t-2002_09/3t2002091304.html
http://news2.2ch.net/test/read.cgi/newsplus/1031903114
170理系学生:02/09/16 18:30
質問!

1つのピークしかもたない分布は、
平均、分散などでその形を評価できますよね。
2つピークをもつ分布を評価するようなものってありませんか?

ここでの評価ってのは、複数の分布を比較して差異を明確にする
って意味で書きました。
171132人目の素数さん:02/09/18 23:17
この分野はこの本を読めばもう大丈夫っていう代表的な本を教えて
172132人目の素数さん:02/09/18 23:35
ベイズ統計学ってのは最近どうなんでしょうか?
意思決定に使われていますか?
私もベイズ統計に興味があります。
どなたか現状を知っている方いませんでしょうか??
理論とか、実解析だとか
174あちらの1:02/09/24 19:24
頭のいい人教えてください。
以下のスポーツブックの掲示板で
http://www.saiin.net/~ch/a6/sbook/index.html
以下のスレッドをたてました。
http://www.saiin.net/~ch/a6/hilight.cgi?dir=sbook&thp=1032862432

要約しますと、スポーツブックのメジャーリーグにおける倍率の設定に
少し片寄りがあるのでは?という質問です。
あちらはあちらの住民からレスがつくでしょうが、こちらの住民の方がこの
件に関して詳しそうなのである意味プロの意見で参加くださればと
思って宣伝に来ました。
(続く)
175あちらの1:02/09/24 19:29
少し簡単に今回の件にかんして解説しておきますと
スポーツブックにメジャーリーグを対象とした賭けがありまして、
勝ち負けを予想するもので普通はどちらのチームも1.9倍くらいの
倍率なんですが、首位と最下位とかの試合になると、
その倍率が1.3 倍と3.5倍とかになるのです。
で、その3.5倍の方があまりにオイシイのでは?ということです。
最下位でも勝率350くらいはあります。3回に1回くらいはかちます。
いくら首位が相手でも、投手も打線も水物の野球というスポーツで
1.3倍と3.5倍というのは開きすぎで、3.5に賭けてれば期待値が
でかいのでは?ということです。

実際、ある人が昨日の最下位デビルレイズに100ドルかけて
350ドルにしているのを見ると、なんだかなぁ。と。

確率的にはどうなんでしょうか?
賭博の場合は、両チームの実際の勝率よりも、それぞれのチームに
何人が賭けると考えられるかの方が重要だったりします。
胴元は「試合の勝敗」ではなく「賭けの結果」で儲かる儲からないが決まるのです。
>>176
それは胴元にとってだけ重要な問題であって、
賭ける側には(胴元が破産しない限り)関係ない。
178132人目の素数さん:02/09/24 20:33
>>数学ヲタ
                       ._,,,,,,。,,、       广'x、   ,,、._    」'゙''i、      
     ,,,,,_.,,,,、广゚┐     .,,,v―冖"~゛   ゙'i、      .ト  ,|,_  riゃ .}   .,i´ '冖i、    
     .] ` f゙,l° ,i´     .゙l_ .y-┐ 'や'゙"゙’    _,,,vr"   .゙ト.゙'x,,,,广 ィ・'''゙~  .._,,v・゚ヒ''''・x、 
     入、rУ ,iレ-v,,,、   .,r°."'''l゙  ,|√゙゚'i、   匸 ._  .y・'゙゚,,,v―-,  .:゚ーa  .√ ._,rll_  :}
  .,r''y|゛゙゙l..,i´ ,i"゙l,  .゙ト  ,r°,,,  ..,  ._,,vぐ    .`√ .,i´l广._,,,,,,,,i´  ,,i´ ,i´ ,「 .:| .~''''″
 .r″ .|゙l、 “ .,i″.yi入-イ  il∠i、.` .,メ|  |   」'ト   .,,i´ .,i´ ,, ̄      .[  .,i´.,,,,,,! .]_    
 .゙l_,i´,レ  .'_,,,,レ ~''┐   .,r°.,i´.|  .|   ,l゙ :゙l、 ,,i´ ,i´ l゜.゚L__   .:―ヤ゚″_   :~''=、 
   .,r″.,x=,,      .,i´  ,x'".,,x'″ .゙l、 ゙冖''″ .] |  .,i´ .゙l,    .~1   .゚L '゙〃 ,n, .,,}  
  .,l彡'''″  .゙~"''''''''''"゜  .テ''~゛    .:゚'―---―・° ―″   .~''¬―'″    .:゚=_,r″  ̄  
倍率決めるのは胴元だろ?
>>179
そうだけど、質問者が聞きたいのは、胴元がどうやって
倍率を決めているかについてじゃなくて、
すでに決まっている倍率についてどっちに賭けたら得か
と言うことだろ?
>>数学ヲタ
                       ._,,,,,,。,,、       广'x、   ,,、._    」'゙''i、      
     ,,,,,_.,,,,、广゚┐     .,,,v―冖"~゛   ゙'i、      .ト  ,|,_  riゃ .}   .,i´ '冖i、    
     .] ` f゙,l° ,i´     .゙l_ .y-┐ 'や'゙"゙’    _,,,vr"   .゙ト.゙'x,,,,广 ィ・'''゙~  .._,,v・゚ヒ''''・x、 
     入、rУ ,iレ-v,,,、   .,r°."'''l゙  ,|√゙゚'i、   匸 ._  .y・'゙゚,,,v―-,  .:゚ーa  .√ ._,rll_  :}
  .,r''y|゛゙゙l..,i´ ,i"゙l,  .゙ト  ,r°,,,  ..,  ._,,vぐ    .`√ .,i´l广._,,,,,,,,i´  ,,i´ ,i´ ,「 .:| .~''''″
 .r″ .|゙l、 “ .,i″.yi入-イ  il∠i、.` .,メ|  |   」'ト   .,,i´ .,i´ ,, ̄      .[  .,i´.,,,,,,! .]_    
 .゙l_,i´,レ  .'_,,,,レ ~''┐   .,r°.,i´.|  .|   ,l゙ :゙l、 ,,i´ ,i´ l゜.゚L__   .:―ヤ゚″_   :~''=、 
   .,r″.,x=,,      .,i´  ,x'".,,x'″ .゙l、 ゙冖''″ .] |  .,i´ .゙l,    .~1   .゚L '゙〃 ,n, .,,}  
  .,l彡'''″  .゙~"''''''''''"゜  .テ''~゛    .:゚'―---―・° ―″   .~''¬―'″    .:゚=_,r″  ̄  
182あちらの1:02/09/25 01:23
あげ

数学者さま、あっちにもぜひ降臨してください。
冷静にいきたいんなら勝率とか投手のローテとか考えて
賭ければいいんじゃないの。
もっとも賭けてるやつの大半は、ファンだからとかのご祝儀賭け
なんではないかと思う。

ところで胴元より儲かることってあるのか?
>>183
> 胴元より儲かることってあるのか?

どういう意味だ?
たとえば、A×Bの試合で、どっちも倍率が1.8倍で、
両方に100万円ずつかかっていたら、胴元の儲けは20万円。
もし、当たった方に一人で50万円賭けてるヤツがいたら、
そいつの儲けは40万円。胴元より多い。

…ってこんな話でいいのか?
185あちらの1:02/09/25 09:13
>>183
http://www2.rosenet.ne.jp/~piwo/sbook/
のプレイから辿っていき5スターってとこにいって、
「リアルプレイ」→「スポーツブック」→「ベットライン」
→「BASEBALL」→「MLB Game LInes」にいくと配当とかがみえるけど、
先発投手はあらかじめ発表されています。

この時間だと試合中が多いので倍率出てるのは少ないのですが、
みてもらうとわかるとうり、弱いチームは+210とか+250とか出るわけです。

これは、210/100+1、および250/100+1の倍率なので、いわゆる3.1倍、3.5倍です。
3.1倍とか3.5倍ということは、3連戦で3連敗して初めてマイナスって
ことですよね。

野球においてその確率は非常に低く、どうかんがえても得な気がするのですが
どうでしょう?ってことを質問させていただいています。

向こうにも同じ文章コピペします。
186あちらの1:02/09/25 09:14
ちなみに他のスポーツは知りません。
ただ、ホッケーやアメフト、ラグビーにくらべて
圧倒的に野球の方が番狂わせがある気がするんですよ。
ラグビーとかは社会人と学生でも70ー0とか平気でありますよね。
野球の場合そうはならないと思っています。
187132人目の素数さん:02/09/25 10:31
理論的にも実務面でもまだまだおもしろいことはありそうな気がするが、
現実には手回し計算機時代の遺物として化石化していくんだろうな。
188あちらの1:02/09/25 22:46
また疑問が湧いたので頭のいい人おしえてください。
例のやつですが、100ドルチップを買うと10ドルもらえます。
で、2チーム対抗の試合のデフォルトの倍率が100/110+1です。
つまり、100ドルチップをかって110ドルになるので、
その110ドルをすべてそのデフォルト倍率にかけると
2分の1で自分の応援したチームがかち、その場合100ドルプラスになる。
当然2分の1で負けるので100ドルマイナスになる。
つまり100ドルプラスになるのも2分の1、100ドルマイナスになるのも
2分の1。
とすると、期待値はプラスマイナスゼロということだ。
よって胴元は計算上平均すると利益がでないはず。
189あちらの1:02/09/25 22:50
と、すると、イーブンと思うのだが、あっているだろうか?

ただ、ここで疑問なんだが、デフォルトの倍率が100/110+1
なのでそのまま賭けをつづけると、だんだん減る事になる。

これは結果としてどういうふうに判断すればいいのだろうか?
最初の10%ボーナスがあるから期待値はプラスマイナスゼロのはず。
なのになんかいずれ損する可能性がある。
意味わからん。
期待値プラスマイナスゼロがどうしてマイナスになるのだろうか?

わからん。結果としてこれは期待値どうなの?イーブン?マイナス?
>>188-189
説明の意味がよく分かんないのだが、
100ドルチップ買って何もしないと10ドル儲かるの?
191132人目の素数さん:02/09/26 00:54
>>190
どうやらそうらしい。
なんもせんでも、10%はご祝儀としてもらえるらしい。
ふたりで行ってそれぞれが対抗チームに賭けると
どちらが勝っても総計20ドルの儲け?そんなバカな‥!
193むこうの1:02/09/26 13:15
>>191
>>192
http://www.saiin.net/~ch/a6/hilight.cgi?dir=sbook&thp=1032862432
にありますが、20ドルの儲けが出るわけではありません。
100ドル買ったら、110ドル分かけれるよってことです。
で、その110ドルを払う(実質は100ドル)って得れるお金が
2分の1で200ドルだよってことです。
つまり2人で別なチームに賭けたら、プラスマイナス0ってことです。
>>193
要するに、10%貰う代わりに、そのお金を
一回以上掛ける義務があるのね。

とすれば話は簡単。
一回目の賭けだけ、(ボーナス分を込めて)期待値はイーブン
二回目以降は期待値はマイナス。
195132人目の素数さん:02/09/26 18:30
>>194
だね。
あと未解決な問題としては野球というスポーツに3倍と1、3倍という
開きがあっておかしくないかってことだね。
例の掲示板見てきたが、昨夜3チーム3倍以上のチームがあって
それらに20ドルづつ賭けた奴がいたが、当然3連敗しない限りは
マイナスにならないということだ。
このことが統計的にどう考えられるかということだね。
196132人目の素数さん:02/09/26 22:37
相対関数ってなんでしょうか?
突然調べる必要があって、適当な入門書を探しているのですが、google
ではそれらしき物を発見できませんでした。確立過程ってのが関係ある
ようなのは見付けましたが、あとはわかりません。
レベルは数学専攻でない学部1年生ぐらいはあるかなぁ。昨日、ポアソン
分布、正規分布について勉強しました。まぁまぁ分かったかな。
197あちらの1:02/09/27 11:32
198132人目の素数さん:02/09/28 16:33
>>197
やはり負けが込んでるね。
199【感動】やった!ついに達成!【感激】 :02/09/29 15:53
ついに777円出しました。
買った内容は
セノビー 140円
Dr.GRIPのシャーペン 500円
消しゴム 100円
です。

あわせて740円で消費税入れて777円ですた。

ということで>>200以降のレスは>>199は神だけで1000まで
目指すスレになるからよろしこ
200132人目の素数さん:02/09/29 17:14
流れに従えず、すまそ。すいません。これわかりません。
従業員たちはある仕事を平均10分、標準偏差1.5分で仕上げる。
ところがあるエンジニアが新たな作業方法を発明した。
そのエンジニアによれば、サンプル64人の従業員が新しい
作業方法を使うと平均8分で同じ仕事を仕上げることが
できたとした。
1)サンプル平均X64が8分以下で仕上げる可能性を求めよ。
2)1)の結果を元に、そのエンジニアの新しい作業方法を
採用すべきかどうか答えよ。
>200
初歩の初歩だね。
標本平均が8になるのが、標本平均の分布の棄却域に入ってるか否かを調べればよい。
標本平均は(10、1,5/√64)=(10、0,1875)に従うから、10より2もずれているということは、
このサンプルが与えられた分布に従ってる可能性は非常に低いことになる。
したがって与えられた分布からのサンプルではない、言い換えれば母平均が少ない作業時間のサンプルから選ばれたと結論できる。
202132人目の素数さん:02/10/01 13:37
age
203132人目の素数さん:02/10/01 13:53
ガウス分布にぴったり完全に従うような事例を発見できればなにか賞もらえますか?
204132人目の素数さん:02/10/01 15:19
>>203
象印賞を差し上げます
205 :02/10/01 22:07
すみません、どこで聞けばいいのか分からなかったのでここで聞かせてください。

私経済学畑出身のものです。
全然知識がないのに、計量経済学(時系列分析)でデータセットを与えられて「これはARMA(p,q)プロセスだから、pとqを求めなさい」と言われました。
一応その先生推奨のソフトウェアを使ってそれなりにいじくってみたのですが、p値だのt値だのと出てきて、その読み方(解釈の仕方)がわかりません。
誰か簡単にこれらの意味を教えていただけないでしょうか?

あと、t値やp値などの基礎から応用まで詳しい英語の参考書とかって誰かご存知でしょうか?
206132人目の素数さん:02/10/02 15:10
数理統計の本はどれがいいのでしょうか?
2072チャンネルで超有名:02/10/02 15:25
http://www.tigers-fan.com/~xxccxxc

http://www.tigers-fan.com/~kaaax

ヌキヌキ部屋に直行
  コギャルとヌキヌキ
  全国地域別出会い
208132人目の素数さん:02/10/03 20:01
>205
P値って俺も分からない。誰か教えて。
t値は仮説検定で母分散が分からない時標本不偏分散を用いてt検定をするが、その時のずれの度合。
標準偏差×〇の〇の部分に当たるものだと考えればよく、絶対値が大きいほどずれが大きく仮説が間違っているといえる。
重回帰分析でしょっちゅう出てくると思う。
>206
ホーエルの入門数理統計学は記述はいいが、章の順序が良くない。
209132人目の素数さん:02/10/03 20:38
統計を勉強するなら、どこの大学院がいいのでしょう?

実験計画法をやりたいのですが・・・
210132人目の素数さん:02/10/03 22:19
統計数理解析研究所
>205
t値とは、平均の検定に用いられる統計量で大きければ帰無仮説は棄却される。
p値はその帰無仮説の下でそのt値をとる確率。
t値が大きければ、p値は小さくなる傾向にある。

>206
Rao、C.R. Linear stastical inferences and its applications
宮岡、野田 数理統計学の基礎
この二つはいい本だと思う。ただ読みとおせるかどうかは別問題。 
212132人目の素数さん:02/10/04 22:43
>>201
宮岡、野田というのは知りませんが、
素人にラオを薦めるのはいかがなものか。
と思うわけです。
間違いなく名著ですが。
213132人目の素数さん:02/10/05 00:52
>>211
もうちょっと初心者向けのお願いできないでしょうか?
入門書なんだど、理論に飛躍が無く、ちゃんと証明ものってるやつ。
こんなこと言うと怒られそうだけど。
214132人目の素数さん:02/10/05 01:13
初心者で申し訳ないのですが質問です。

レンガの買い手は近頃のレンガの品質はどうも低下しているようだと思っている。
過去の経験では、レンガの平均破壊強度400ポンドで、その標準偏差は20ポンドであった。
100個のレンガをとってテストした結果、その平均は390ポンドであった。
平均品質は低下したという対立仮説に対して、それは変わっていないという仮説を検定せよ。

これはどのような検定をすればよいのでしょうか?
名前だけでいいので教えてもらえませんか。。
215132人目の素数さん:02/10/05 02:20
アニキたち、漏れは数学は中学以来やってないド素人です。
ポアソン分布の証明がよく分かりません。
特に、lim n→∞ (1+λ/n)n乗=eの-λ乗ってとこが分かりません。
どうか人助けと思って教えてやって下さい(泣
>>215
それは、微分積分の本を開いて、e^xの定義のようなものを
書いてあるところ探した方が良いんじゃないの?
217経済学部出身:02/10/05 11:27
>213
201と同じ
>214
ただの統計学でなく数理統計学の本だからなあ。
ネイマン・ピアソンの定理や尤度比検定が載ってる入門書は限られてくる。
数理統計学ではないが、「経済分析のための統計的方法」が式展開がしっかり書かれてて読みやすい。
>215
e=lim n→∞ (1+1/n)^n という定義だから、
lim n→∞ (1-λ/n)^n=e^-λとなる。
>e=lim n→∞ (1+1/n)^n という定義だから、
>lim n→∞ (1-λ/n)^n=e^-λとなる。
説明になってない…。
219:02/10/05 11:34
213と214が逆でした。
220132人目の素数さん:02/10/05 11:44
>218
lim n→∞ (1+m/n)^nでm/n=pとおくと与式=lim n→∞ (1+p)^m/p=e^mとなる。

221132人目の素数さん:02/10/05 12:05
>>215 の式間違ってるよ。
lim n→∞ (1+λ/n)n乗=eのλ乗
ならばこれはまさしく定義。
高校の数学3の教科書にいろいろ載っているはず。
微積のときにうっとうしい係数が出てこないように作られた数。
222132人目の素数さん:02/10/05 12:31
>221
eの定義としては微分したものが元の関数と等しくなるような指数関数の底ということ。
この時 (a^x)`=lim b→0 [a^(x+b)-a^x]/b=a^x(a^b-1/b)=a^xより
lim b→0 (a^b-1/b)=1
a^b-1/b=1よりa=(1+b)^1/b となり、lim b→0 a=lim b→0(1+b)^1/b=e となる。

223220:02/10/05 12:56
>与式=lim n→∞ (1+p)^m/p=e^m
lim p→0 (1+p)^m/p=e^m の間違い。

ああ疲れる・・・・
224211:02/10/05 21:44
>213
統計の一般的な基礎理論を勉強するなら
東京大學出版会の自然科学の統計学とか数理統計学(しょうかぼう)がいいと思う。
前者は厳密な証明がのってるわけじゃないけど、直感的にわかり易くて網羅的。
後者は前者よりも厳密に理論を展開するけど前者よりは項目数がすくないかな。
どちらにしろ(他の本でも)、
漸近理論や尤度を使ったりするところで証明をしていないことがほとんど。
そういうところはまた別にやっていくしかないと思う。
225132人目の素数さん:02/10/10 08:11
t検定について聞きたいのですが、

t検定をする場合、
平均値、標準偏差、t値、P値というのを検出すればいいんですか?
その場合、平均値と標準偏差は出るんですが、
t値とP値はどのように出せばよろしいのでしょうか?
ちなみに
  平均値  標準偏差
A 21.9643 9.8413
B 32.3923 11.6376

です。
226132人目の素数さん:02/10/10 13:50
>225
多分アナタ全く分かってないんじゃないの?
t検定では標準偏差と言う言葉は使わない。
大体なにがいいたいかはわかるんだけど。

あと、母平均をいくつと(帰無仮説では)仮定してるわけ?
227225:02/10/10 16:29
>>226
はい、おっしゃるとおりほとんど分かっておりません・・・
母平均は等しいと仮定しています。

標準偏差というのはないんですか??
228132人目の素数さん:02/10/10 16:45
>227
だからAとBの母平均はいくつと仮定してるわけ?
あと標本数の情報も必要だね。
その辺の事はだれでもわかるような本にも書いてあると思うので、それ読んでから書き込んでね。
229225:02/10/10 17:04
標本数は28です。
Aの合計が615 Bの合計が907なので、
それぞれ28で割るとA 21.9643 B 32.3923
と出てきます。
母平均は未知なのでいくつとか仮定できないのですが・・

230132人目の素数さん:02/10/10 17:27
だから未知の母数(ここでは平均)を仮定して検定するのが仮説検定でt検定はその一手法なんだけど。
大体言いたいことは推測つくので母平均をpと仮定してAについて求めてみると、
9.8413^2*28/27=a(標本不偏分散)を求めてその後
21.9643-p/{(a/27)^1/2]を計算する、これがt値。

231132人目の素数さん:02/10/10 20:28
>>225
AとBの母平均が等しいか否かを検定するためには、
まず、AとBの母分散が等しいか否かF検定する必要があります。
それによって検定のためのt値は変わってきます。
232132人目の素数さん:02/10/10 22:17
中心極限定理について。

確率変数Xがあり、-∞ < X < ∞の変域で、

n回の試行での平均をYnとすると、つまり、

Yn=(X1+X2+・・・+Xn)/n

で定義されるYnの分布は、正規分布に従うのが中心極限定理ですよね。

ところで、これは、Xの変域がR全体でないときにも正しいのですか?
たとえば、[a,b]や、[a,∞]でも正しいですか?
区間を絞ると、正規分布からずれるような気がするのですが。
>>225
それは必要ないでしょう。
t検定は不等分散について十分頑健ですヨ。
234132人目の素数さん:02/10/16 07:35
ほしゅったらあげろ!
>>232
YnはE[X]に(適切な意味で)収束する。正規分布には従わない。
きみは大数の法則と中心極限定理を混同してる。
236132人目の素数さん:02/10/17 21:32
2標本のt検定が全く分からないです(爆
分かりやすく書いてある良い本ないですか?
237132人目の素数さん:02/10/18 22:39
平均方向μ、集中度κのパラメータを持つ円周正規分布
f(θ;μ,κ)=exp{κcos(θ-μ)}/2πI(κ) 0≦θ<2π において

α(1),α(2),・・・,α(n)〜f (i.i.d)とする時
f(α(1),α(2),・・・,α(n))
=Π[i=1,n]f(α(i))
={(1/2πI(κ))^n}*[exp{κ納i=1,n]cos(α(i)-μ)}]
=exp{κcosμ納i=1,n]cosα(i)+κsinμ納i=1,n]sinα(i)}*{(1/2πI(κ))^n}
=[exp{κ(cosμ)(Rcosζ)+κ(sinμ)(Rsinζ)}]*[(1/2πI(κ))^n]

で、κが与えられた時のμの十分統計量を求めよ。
という問題なんですが、1つのパラメータを推定するのに
Rcosζ、Rsinζの2つ必要なのでしょうか?
だからと言って1つだとどっちなのかも分かりません。教えてください。
μとκが未知の時のμとκの十分統計量はCとS、
μが与えられた時のκの十分統計量は把os(α(i)-μ)だと分かったのですが・・・。

ここで
C=納i=1,n]cosα(i)=Rcosζ、S=納i=1,n]sinα(i)=Rsinζ、R=√(C^2+S^2)とし
I(κ)はオーダー0のmodified Bessel functionである。よろしくお願いします。


238132人目の素数さん:02/10/19 00:41
ここだ!ヽ(´ー`)ノ
ふぅ、やっと見つかった。あっちこっちの掲示板で放置されつづけた
おいらの疑問に答えてくれ〜。
 ↓コレ
>パチンコにおける標準偏差の出し方について教えてください。
大当たり確率1/315、確変割合1/2(大当たりした時1/2の単発
絵柄だとそこで終了。確変絵柄だと次回大当たりまで玉が減らず、
次も確変だと・・・と単発絵柄が出るまでループします)という
初当り(確変中の当りを覗いたもの=通常時の大当たりをさします)
に対する期待大当たり回数が2回の台の場合。
10000回転させた時の標準偏差はどれくらいになるんでしょうか。

確率p、回転数nとしたときのノーマル機の標準偏差√[pn(1-p)]
までは何とか理解したんだけど、確変のバラツキをどのように考慮
すればいいか分かんないんす。誰か分かりやすく教えて〜。
>>238
簡単のため、 p = 1/315 とおく。

確率 1-p で、大当たり回数 0回。
確率 (1/2)p で、大当たり回数 1回。 ← 一回目で通常絵柄
確率 (1/4)p で、大当たり回数 2回。 ← 一回目で確変絵柄 二回目で通常絵柄
確率 (1/8)p で、大当たり回数 3回。 ← 一二回目で通常絵柄 三回目で確変絵柄
…以下同様

なのだから、回転数1回のときの分散は
( (1/2)p 1^2 + (1/4)p 2^2 + (1/8)p 3^2 + … ) - (2p)^2
となる。あとは単なる無限数列の和の問題。

A = ( (1/2)p 1^2 + (1/4)p 2^2 + (1/8)p 2^3 + (1/16)p 4^2 + … ) ▲ とおくと、
2A = ( p 1^2 + (1/2)p 2^2 + (1/4)p 3^2 +(1/8)p 4^2 + … ) ●
4A = ( 2p 1^2 + p 2^2 + (1/2)p 3^2 + (1/4)p 4^2 + … ) ★
なので、★-2●+▲ の両辺を計算すると、
A = 4p + 2 ( (1/2)p + (1/4)p + (1/8)p + … )
= 4p+2p = 6p

故に、分散は 6p-4p^2 = 2p(3-2p) となる。 一回あたりの標準偏差は√( 2p(3-2p) )
n回なら、標準偏差は√n倍になるので、 √( 2p(3-2p) n ) となる。

計算間違いがあるかもしれないので検算してみてください。
240239:02/10/19 01:34
> 確率 (1/8)p で、大当たり回数 3回。 ← 一二回目で通常絵柄 三回目で確変絵柄
逆だ。(w
スマソ。
241238:02/10/19 22:18
>>239
うぁ〜、ありがと〜。さすが統計学スレ〜即答〜。
でも、バカチンだからピンとこないや(ププッ
よし、ガンガッテ理解するぞ。
242238:02/10/20 02:28
ひぃっ。数式が難しすぎるぅT,T
これを見て、ノーマル機の標準偏差も全然理解してない
ことがわかりましたぁT,T(アポでしたぁ

と、とりあえず確変のバラツキを考慮しない標準偏差(2√[p(1-p)n]
←あってますよね;;)を上で出していただいた√[2p(3-2p)n]から
差し引いてみまして、確変のバラツキというのが√(2pn)ほどある
という理解でよろしいでしょうか(汗

しかし、
>なのだから、回転数1回のときの分散は
( (1/2)p 1^2 + (1/4)p 2^2 + (1/8)p 3^2 + … ) - (2p)^2となる。

ってあたりは、すっごく初歩的な問題なのですか?(汗だく
243238:02/10/20 02:32
>>242
>確変のバラツキ

というより、確変によるバラツキでした(ヒィッ
244132人目の素数さん:02/10/26 15:55
サンプル数が多いと有意差が多くなる事が統計学の限界のように論じられていますが何が問題なのですか?
精密さが増してるだけでしょ?
246132人目の素数さん:02/11/02 03:03
サイコロが胡散臭いかどうか調べようとして行き詰まりました。
スレ違いだったらすいません。

500回振ってみて、カイ2乗値とゆー値を計算したら67になりました。
その値を何と比較すればいいんでしょうか?(まるで見当違いでしょうか?)
20面体のサイコロなので自由度は19らしく、カイ2乗分布表を見たところ、
0.995のとき6.84・・などとなってます。
カイ2乗値が6.84だったら99.5%胡散臭くない、という意味なんでしょうか?
振る回数が500回で十分かどうかも自信ないです。
247132人目の素数さん:02/11/02 06:07
>>246
自信もっていい。
248132人目の素数さん:02/11/02 11:34
>>247
振る回数以外のことも教えてほしいんだけど。
249132人目の素数さん:02/11/02 22:21
どーか教えてくださいage
250132人目の素数さん:02/11/04 01:48
カイ2乗値(例えばピアソンの適合度基準の値)が大きいとき,
そのサイコロは“胡散臭い”とみなし,大きくないとき,“胡
散臭くない”と見なす.

“カイ2乗適合度検定”をキーワードにして調べてみ.
>>244
「統計学」の限界というのは意味不明。
念頭においてるのは仮説検定?
252132人目の素数さん:02/11/07 17:18
学校の授業でSASというソフトを習っているんですが、
まったくわかりません。
上っ面だけでもいいから初歩的なことを
一通り学べるやさしい本やホームページはないでしょうか。
(・∀・)リサンガタデシタ
254132人目の素数さん:02/11/09 23:15
>>1はV[X]が負
255132人目の素数さん:02/11/13 02:20
http://www.coop-bf.or.jp/B0209/kei.html
http://www.saiensu.co.jp/books-htm/ISBN4-915787-91-5.htm
生協でかなり売れてる田中勝人氏の本はどんなもんでしょう?
使ってみた方いますか?
P(A∪B)=P(A)+P(B)-P(A∩B)
の証明を教えて下さい。
257132人目の素数さん:02/11/13 22:43
>>256
ベン図を書けばすぐわかる事。
258re:japon:02/11/14 02:04
こんなんでました
【1】700ページの本に700個のミスプリントがあるとする。
1ページに3個以上ミスプリントがあるページはどれくらいあるか?
【2】ある集団では1パーセントが胃癌にかかっている。胃癌にかかっている人を
少なくとも1人含む確率が95パーセントを超すためには少なくとも何人を抽出し
なければなならないか
【3】パン屋のぶどうパンに干しぶどうが10個未満しか入ってないのが全体の
5パーセントを超えると苦情が入る。干しぶどうは一個1gでパン一つに対し小
麦粉30グラム使用する。300kgの小麦粉に対して干しぶどうを何kg仕込めば苦
情を受けないか。
【3】ヒント
30分の300×1000=10000個のパンを作ろうとしている。10000χg=10χsの干し
ぶどうを仕込めば1個当たり平均χ個の干しぶどうが入る。
Pχ(0)+Pχ(1)+…+Pχ(9)<0,05となるようなχの最小値を求めればよい。つまり
1+χ+2の階乗分の1×χの2乗+…+9の階乗分の1×χの9乗<0.05eのχ乗
となるχの最小値を求めればよい。

とまあこんな感じの宿題を出されまして手も足も出ません。教えて下さいな。
ちなみに来週の水曜提出です。
>>258
マルチすんな、ヴォケ!
>>258
[1] どのページについても「同様な確からしさ」でミスプリントが存在するという
保証がないと、なんともいえない。それがあってこそ、確率という扱い方ができる。
しかし、この問題ではそのことには一切言及していない。従ってこれは条件の不備。
条件が不明なのに推論を続けるのは科学的には極めて危険で、下手に強引に推し進め
るのは、宗教や政治に悪用される結果に終わるので、そんな癖はつけない方がよい。

[2] これは、授業を聞いたかどうかをチェックしている問題である。定義そのままと
いってもいいくらいである。つまり我々が代返しても無意味。参考書という「なかった
ことをあったことにするための道具」がある以上、そちらをお勧めする。

[3] 素直な感想は「ここまでヒントが出てるのに?」である。わからない問題スレや
くだらない問題スレで「解き方」尋ねる分には、多くの者が助けてくれるだろう。
「解く気がないのに答えを聞く」分には、完全に叩かれるか、阿呆が自慢げな答えを
書いてくれるかに終わるだろうが、自信過剰な阿呆のすることだから間違ってても
気づかない。そんな人の答えはうのみにしない方が身のためだろうことお伝えしておく。
261132人目の素数さん:02/11/14 21:15
>>258
親切に答えてあげるが、全部ポアソン分布でいいんじゃないの。
まあ260の言う通り。
>>260は (゚∀゚)イイッ!こと書いてるね
263132人目の素数さん:02/11/15 02:22
すいません、統計の専門の皆様にお聞きしたいのですが。
今、正規分布N(μ1,σ1^2),N(μ2,σ2^2),..,N(μn,σn^2)が与えられていて、
ここから、サンプリングするプログラムを書いてます。
ところが、制限があって、
x1+x2+…xn=a(定数)という条件を満たさなければなりません。
(x1,...,xnはそれぞれの正規分布からとった数)
で、やりたいことは、この制限を満たしつつ、(x1,..,xn)の組を
たくさんとったとき、それらの組があたかも元の
N(μ1,σ1^2),N(μ2,σ2^2),..,N(μn,σn^2)を再現できている
かのようにサンプリングしたいのです。
(すいません、伝わっているでしょうか?下手な文ですいません)
ところがうまく再現できるたくさんの組が作れません。
みなさんの、お知恵を拝借したいです。

最初は和の制限なしにたくさん(x1,..,xn)をサンプリングして
和がaになるものだけでフィルタリングしたのですが、
正規分布を反映してませんでした。
#n次元空間の点(x1,..,xn)のばらつきに対して、超平面
#x1+x2+…xn=aで切った断面が正規分布の分散を反映していない
#のであたりまえなのですが。

他にもいくつか戦略をたてて作っているのですが、まだ作れて
いません(特に分散のフィッティングが難しい!)
力技でもかまいませんので、何かいいアイデアはありませんか?
>>263
結論からいうとできない。
n=2 のとき x2=a-x1 だが、x1 が正規分布なら x2 は正規分布でありえない。
他の n でも同様。何かモデルを変更する必要がある。
265132人目の素数さん:02/11/15 16:17
>>263

> 最初は和の制限なしにたくさん(x1,..,xn)をサンプリング
> して和がaになるものだけでフィルタリングしたのですが、

N(μ1,σ1^2),N(μ2,σ2^2),..,N(μn,σn^2)
に従う独立なn個の確率変数x1,…xnの実現値が,
x1+x2+…xn=a(定数)
を満たす確率は0ではない?

266132人目の素数さん:02/11/15 21:44
質問です。
センター試験など選択科目による格差を無くすための処理で、
科目別に偏差値を算出することで、ある程度格差を吸収できると思うのですが、
それぞれの科目の選択者の集団の、
それ以外の科目(たとえば英国数)での結果に大きな差が発生してる場合、
または科目の選択が自由でなく、敢えてレベル別に分けて受験させた場合、
どういう補正や手法が適切でしょうか?
いわゆる偏差値の定義ってなんだっけ?
M点満点のとき得点Xの偏差値S[X]は標準偏差σと平均点E[X]でどう表せるの?
268132人目の素数さん:02/11/16 01:50
>>264
どもありがとうございます。確かにn=2のときはできないですが、
他のnだと本当にダメですか?というか、正規分布になるように
たくさんのデータを生成したいのです。。。説明が下手ですいません。

>>265
もちろんその確率は0ではないです。
今、思ったのですが、多次元正規分布なので、correlationを考えれば
いいような気がしてきました。多次元正規分布って、レシピにのってた
かなぁ。。。
269132人目の素数さん:02/11/16 08:40

270132人目の素数さん:02/11/16 17:52

271132人目の素数さん:02/11/20 00:16
age
272132人目の素数さん:02/11/20 16:09
厨な質問でスマソが、相関係数rの算出法を
ありったけ知りたいのですが、誰か神様、おながいします。
273132人目の素数さん:02/11/20 20:51
>>272
猿でも分かる類の本でも載っているので、自分で調べろ。
これが、最大限の親切。
274132人目の素数さん:02/11/20 22:31
>>273
それは失礼というものです。
どれがサルでもわかる本か、わからないと思う。
それと猿を漢字で書くとよめないのかもしれない。。。
275132人目の素数さん:02/11/25 05:38
>>235
俺の理解が間違っているのかもしれんが
Ynは正規分布に収束するんでないの?
E[Yn]はE[X]で、Ynの分散がどんどん小さくなるという意味で
YnはE[x]に収束するんだろうけど、Ynの分布自体は正規分布に収束するんじゃ
ないかな。
ごめんこの解釈間違ってる?
276132人目の素数さん:02/11/27 12:49
誰も答えてくれない…。
277132人目の素数さん:02/11/30 14:00
すいません。 インターネットをいろいろ検索したのですが、
わからないのでお尋ねします。
世界各国成人男女の平均身長がわかる統計データが欲しいのですが、
どこで手に入りますでしょうか?
どなたか教えて下さい。
>>275
合ってると思う
たとえば簡単なケースとして、X1,…,Xnが有限の平均μと分散σ^2をもつi.i.d.なら
ば、その分布がどのようであろうとも(もちろん変域も問わない)、n→∞のときYn
は平均μ,分散σ^2/nの正規分布に“近づく”。
ただしこの言い方だと近づく先もnに依存しており、δ関数的になっていくから、普通
は標準化して「(Yn-μ)/(σ/√n)が標準正規分布に近づく」と言う形で表現するが。
279132人目の素数さん:02/12/01 14:57
という事は>>235が間違いだったのか。
280132人目の素数さん:02/12/02 00:27
>>279
というより232が曖昧すぎ(Xiの仮定たとえば独立性とかも書いてないしn→∞のとき
とも書いてない)。
n→∞のときYnが「何かに収束する」という形で述べるなら235のいうように大数の法
則しかない。近似としては相手側もnに依存してよいが、「漸近的に等しい」とかそう
いった形にしなければならない。正規分布に「収束する」という形で述べるにはYnで
はなく(Yn-μ)/(σ/√n)を考える必要がある。235はそのことを想定していたのだと思
われ。
281132人目の素数さん:02/12/02 00:58
2次元のデータから回帰直線を書くときに、
yの予測値とyの誤差の二乗合計を最小にする方法はわかったのですが、
直線からの距離を最小にする場合の方法がわかりません。
検索等もやってみたんですが、前者しか見つからなかったんで、
何かいいHPや、書籍(できればプログラム付き)があったら紹介お願いします。
282132人目の素数さん:02/12/02 12:06
y=a+bx+cz+u uが撹乱項
というモデルで
Σe^2=Σ[y-(a'+b'x+c'z)]^2
を最小にする推定方法が最小二乗法ですよね。(a',b',c'は推定値)
これじゃだめなのですか?
この時yのベクトルとyの予測値のベクトルとの距離は
最小になってると思うのですが。
サッカーで今期45試合フルに出て26点とる選手がいたとする。
来シーズン50試合にフル出場できると仮定して今期と同じ確率で得点
できるとする。この時、50試合で35点とれる確率はいくらか?
ただし来シーズンも同じチーム、同じリーグでプレーしたとすること。
海外に移籍することはない。

誰かヘルプ〜。
>>283
どのようなモデルを採用するかによって結果は異なると思われ。
それに26点が期待値でなく実現値の一つならばなおさら分からない。
285132人目の素数さん:02/12/02 14:12
>>283
性器分布表が手元にないのでパス。
286132人目の素数さん:02/12/02 17:12
>>282
281は垂線の和が最小という意味だろうから、違う。
>直線からの距離を最小にする場合の方法がわかりません。
その直線が統計的にどういう意味を持つかは訊いてみたい。
>>281
直線 ax+by+c=0 とデータ点の距離を計算して
最小値を探せばいいだけじゃないの?
計算量は多くなるんでしょうけど。
289132人目の素数さん:02/12/02 23:02
>>287
俺もうろ覚えなのだが、多変量解析の一つにその直線を求めるようなものがあったと思った。
だれか詳しい人教えて。
290281:02/12/02 23:14
皆さんレスありがとうございます。

>>287
私が読んだ本では、x,yの両方とも誤差を含んでいると考えられる場合や、
x,yのどちらが原因、結果であるか不明である場合、
そちらの方が良いとありました。と個人的に理解しました。

>>288
その通りです。
が、自分の知ってる数学の範囲だと、ちょっと解けそうにないです。
291132人目の素数さん:02/12/03 00:10
V(aX+b)=a^2*V(X)
とあるんですが、どうしてこうなるのか教えて下さい。
途中の式変形書いてもらえるとありがたいです。
>>290
それ、計算機で力ずくではダメなの?

>>291
E( aX+b ) = aE(X) + b
だから
V( aX+b ) = Σ( aX + b - aE(X) + b)^2 /N
 =Σa^2( X -E(X) )^2 /N
 =a^2 Σ( X -E(X) )^2 /N
 =a^2 V(X)
293291:02/12/03 00:39
>>292
ありがとうございます・・
でも全然わからないのですが・・
Nって何ですか?
1行目は期待値の演算は線形性をもっているということは書いてあった
のでいいとして、その次の
V( aX+b ) = Σ( aX + b - aE(X) + b)^2 /N
はいったい・・
分散の定義は
V(X)=(x-E(X))^2*P(X=x)
しか知らないのですがほかに何かあるんですか??
294291:02/12/03 00:45
あーなんか納得できました
292さんありがとうございます
>>293
えーと、なんか標本を分析してる状況が頭にあったので P = 1/N のつもり・・
296281:02/12/03 01:21
>>292
自分のPCで計算させようと思ってます。
y方向の誤差最小の場合はわりと簡潔に書け、速度も軽かったので、
こちらも最終的なパラメータ算出の式や方法が分かれば、
自作ソフトの一部に組み込む方向で何とかしたいと思ってます。
297132人目の素数さん:02/12/04 18:45
素人でスマソ
偏差値のことですが、あるグループで55.5
別のグループで67.0だとしたら、この間には
差があるのかないのかっていうのはこの値から
判断できるのですか。
>>296
ためしに試行関数を cos[t]X+sin[t]Y+c = 0 と置いて各点からの
距離の二乗和を最小にするt,cを探そうと思ったら
c = -Ex cos[t] -Ey Sin[t]
(-Ex^2 + Vx)cos^2[t] + (-Ey^2 +Vy)sin^2[t] -(ExEy-Vxy)sin[2t] = 0
Ex,Ey :x,yの平均
Vx,Vy :x,yの二乗の平均
Vxy :xyの平均
のような条件になりますた・・・
299132人目の素数さん:02/12/04 21:20
>>293

> 分散の定義はV(X)=(x-E(X))^2*P(X=x)
> しか知らないのですがほかに何かあるん
> ですか??

その定義じゃ離散型のXにしかあてはまり
ません.

V(X)=E((X-E(X))^2)

を定義にしときましょう.

# じゃあ,E(X)の定義は?とかいう?

300132人目の素数さん:02/12/04 21:35
>>293

299のもんだけど,ヒント.

299の分散の定義と,期待値の線形性を使えば,
V(X+a)=V(X)とかV(aX)=a^2V(X)とかはすぐでてくる.
あとは自分で考えること.
301132人目の素数さん:02/12/04 21:56
統計の質問
わからないので誰か教えてください。

ある新商品の検査で従来品との比較をしたときに、
両者の間に有意に差があるかどうかを知りたいのです。

検査は(新商品・従来品)を1セットとして行われますが、
複数の検査場でやられており、検査場間のばらつきが非常に大きくなっております。

たとえば、A検査場とB検査場で1セットずつ検査されており、
両検査場とも新商品のほうが優れていたのですが、A検査場の新商品の
成績とB検査場の新商品の成績がまったく違うような場合です。

セット間のばらつきを考えず、新商品と従来品の性能の有意差を出すためには
どうしたらいいでしょうか?

302132人目の素数さん:02/12/04 22:20
http://global.whitesnow.jp/casino.partner.toppage.txt
私の友人が先日3万ドル(360万円)当てました。(スロット)
ちなみに私の最高は1000ドル(12万円)。現在までの収支は+1200ドル。(スロット)
仕事が忙しくてなかなかパチ屋に行けないのですが、インターネットカジノなら24時間いつでもOK
なので、時間が無い人でも出来るってとこがGOODですね。
303132人目の素数さん:02/12/04 22:23
次の証明は正しい?正しくない?

非負整数を要素とするn×n行列が任意の0要素に対して、その0を
含む行和と列和を加えるとn以上であるという性質を満たしている。
このときこの行列のすべての要素の和はn^2/2以上であることを示せ

n=1の時、命題は成り立つ。
n=k-1の時、命題が成り立つと仮定し、k次の行列について考えるとこの行列が
0要素を含まない時、命題は明らかに成り立つ。i行j列の要素が0の時、この行列
のi行とj列の和は仮定よりk以上であり、この行列からi行j列を除去して得
られる(k-1)次の部分行列の要素の和は帰納法の仮定から(k-1)^2/2以上である
よって題意の条件を満たすk次の行列の要素の和は
(k-1)^2/2+k=(k^2+1)/2>k^2/2
よって命題は成り立つ。
304132人目の素数さん:02/12/06 00:10
>>303
スレ違いに見えるが、マジレスしよう。
命題自体は正しそうな感じだが、「証明」は間違っていると思われ。
理由:命題の条件をみたすk次の行列からi行j列を除去して得られた(k-1)次の部分行列が、
(k-1)次行列として命題の条件を満たしているとは限らないため、この部分行列に
対してn=k-1の場合の命題を適用できるかどうかわからないから。
たとえば、
( 0 1 1 )
( 1 0 0 )
( 0 1 1 )という3次行列は命題の条件を満たしているが、どの0成分に注目して2次
行列を作っても、その2次行列は命題の条件をみたしていない(結論はみたしている
が)。結論が成り立ってしまうのでわかりにくいなら、次のように言ってもよい。
303の「証明」は、命題の結論を「(n^2+1)/2以上」に変えてもそのまま通用する。
しかしその命題は成り立たない。たとえば4次行列
( 1 0 0 1 )
( 0 1 1 0 )
( 1 0 0 1 )
( 0 1 1 0 ) の要素和はちょうど8 = 4^2 /2 である。
305132人目の素数さん:02/12/06 00:22
>>301
これ実際の会社での話?そんな性能にバラつきのある商品って売っていいの?
売り方しだいやろ。でなきゃADSLなんか提供できないよ
307132人目の素数さん:02/12/06 01:24
>>301
いわゆる「対応がある場合」の「平均値の差の検定」でいいんじゃないの? 統計の教
科書に載ってる。
つまり、新製品・旧製品ともに成績は正規分布に従うとして、検査場(i)ごとに新製品
の成績Xiと旧製品の成績Yiの差Di=Xi-Yiについて、標本平均と標本分散を計算して、
t分布を用いて検定するというやつ。ここで新製品の成績の分散(σ_x)^2と旧製品の成
績の分散(σ_y)^2が異なっていても大丈夫だが、「検査場ごとのばらつき」というのは
母分散(σ_x)^2や(σ_y)^2による標本のばらつきなのだから、単にσ_xやσ_yが大きいの
だと考えればいい。
308132人目の素数さん:02/12/06 04:21
>>297
遅レススマソ。埋もれてて見落としてた。
 異なるグループにおける偏差値の比較は無意味。
 偏差値は、あるグループ(正規分布と仮定)における標本(学生)の相対位置を標
準化して表しただけのもの。ある学生が、あるグループでは(平均50分散100に直し
たとき)55.5にあたる位置の成績を取り、別のグループでは(同じく平均50分散100
に直したとき)67.0にあたる位置の成績をとったと。( ´_ゝ`) フーン それで?
それ以上何が言える?
 もし全く同じ試験の同じ成績を2つのグループで眺めた場合の話であれば、第一の
グループの学生たちの成績の方が第二のグループの学生たちの成績より全体によい、
くらいのことはいえるだろうが。
309281:02/12/07 01:20
>>298
ありがとうございます。
この式なら私でもなんとか解けそうです。
それで各パラメータを求めることにします。
310132人目の素数さん:02/12/09 01:07
>>307
なろほど。
差をとってやるんですね〜。
やってみたら有意差でました。
遅くなったけどどうもありがとう!

>>305
コメントどうもです。
実際に売る予定の製品です。
地域や季節、使い方で大きく差の出る
機械で、いろんな条件でも有効だっていう
のをtestしてたのです。
311132人目の素数さん:02/12/09 02:39
フリーの統計ソフトG* Powerの起動の仕方を教えてください。
データ数とp値を入力すると、検定力を求めてくれるソフトです。
インストールして、スタートのメニューから起動するのですが、
真っ黒なコマンドウィンドウが出るだけで、先に進みません。
(オフィシャルにあるスクリーンショットと全然違う)
ちなみに、当方、ウィンドウズマシンです。

かなりいろいろと検索したのですが、「ソフトの起動の仕方」
なんてことは当たり前すぎるのか、どこにも載ってません。
あほらしい質問かもしれませんが、どなたかお願いします。
312132人目の素数さん:02/12/09 03:41
311ですが、一応、オフィシャルをはっときます。
http://www.psycho.uni-duesseldorf.de/aap/projects/gpower/index.html
313132人目の素数さん:02/12/11 16:26
統計学とモデル理論の関わりについて研究はされてる?
当方,統計専攻の学生ですが,もともと基礎論に興味がありました。
でも,幾何学的モデル理論とかモデル理論がさまざまな分野に応用されているらしいので,
ひょっとしたら研究されてる方とかいらっしゃるんじゃないかと思って。
>>313
具体的な研究は知らないけど、モデル論は証明論と相補的な領域だから、
統計学からの接近なら逆に記述そのものに注目したところにあるんじゃない?
MDL や Kolmogorov complexity あたりから手繰ってみては。
>>313
極限同定に由来する学習理論のうちプログラムの学習はある意味そのものかも。
316313:02/12/12 12:31
>>314
>>315

ありがとうございます。参考にさせていたたきます。
統計学に詳しそうなので質問させてください。
ANOVAについては分かるのですが,
Duncan's testという手法が手持ちの統計学の本では載っていません。
日本語でダンカンの検定ということと,
第一危険率があまり抑えられないということまではなんとなく調べられましたが,
どのような意図でこの手法を用いるのかなど,
お教えいただけないでしょうか?
318132人目の素数さん:02/12/15 17:09
難しそうだね。
ANOVAもDuncan's tesstも聞いたこともないや。
中心極限定理について教えてください。

例えば、身長のデータを30人分集めて、その平均を取るとします。
で、その試行を1000回繰り返します。
その場合の平均値のバラツキが正規分布になる、ということですか?

その時、平均、標準偏差、標本平均、標本標準偏差って、
どう当てはまるんですか?
1000個の平均値の平均が標本平均?
じゃあ、標本標準偏差を求めるときも、
1000個の値と標本平均を用いて求めるんですか?
中心極限定理の、σ/n^1/2 (n=データ数)
っていうのはどうなるんでしょう。
320132人目の素数さん:02/12/16 02:06
統計でわからない問題があるんですが、わかる方いたら教えてください。
・日本人の血液型の比率は、A:B:O:AB=40:20:30:10である。ある職業についている400にんについて
血液型を調べたところ、A型170人、B型70人、0型110人、AB型50人であった。
この職業についている人の血液型の比率は日本人の血液型の構成比率と同じであると
言えるかどうかを有意水準5%で検討することにした。検定統計量の値と検定結果の判断は?

やってみてもわかりません、どうなるんでしょうか?
321132人目の素数さん:02/12/16 20:19
>>319
そう、その理解でOKだと思う。
>>320
「適合度検定 カイ二乗分布」あたりでググるべし。
323132人目の素数さん:02/12/19 00:14
アンケート集計の解釈の仕方について聞きたいのですが、ここでいいのでしょうか?
◆わからない問題はここに書いてね◆スレでどのスレがいいか聞いたのですが
答えをいただけませんでした。
324132人目の素数さん:02/12/19 00:15
>>323
アサピー放送かな?
325132人目の素数さん:02/12/19 00:21
>>324
なんことでしょうか?あるスレ内でアンケートを取ったのですがその解釈の妥当性を
知りたいと思いまして。おすすめの板、スレはありますか?
326132人目の素数さん:02/12/19 05:35
>>325
アンケートの取り方や、何をどう解釈する(した)という話なのか判らないと、
レスはおろかオススメの判断すらできないよ。
327132人目の素数さん:02/12/19 05:47
>>319
>その時、平均、標準偏差、標本平均、標本標準偏差って、
>どう当てはまるんですか?

「どう当てはまる」という質問の意味がよくわかりませんが…。
母平均をμ,母標準偏差をσとすると、標本平均Xはnが大きいとき平均μ,標準偏
差σ/√nの正規分布に近づく。したがって(X-μ)/(σ/√n)は標準正規分布する。
これが中心極限定理ですよね。それだけ。
標本標準偏差Sについては特に何もいえない。ただ、S^2の平均はσ^2に一致する
(偏差平方和をn-1で割ってS^2を定義した場合)。
ちなみに、母集団が正規分布ならば、(n-1)S^2/σ^2は自由度n-1のカイ二乗分布
に従うし、(X-μ)/(S/√n)は自由度n-1のt分布に従う。これらの事実は中心極限
定理とは直接関係ないが。
328132人目の素数さん:02/12/19 06:00
329132人目の素数さん:02/12/19 07:36
>>319
母平均、母標準偏差は定数(既知か未知かはともかく)ですが、標本平均、
標本分散は確率変数です。そのことはわかってますか?
標本は母集団分布に従う確率変数で、標本平均・標本分散はn個の標本−−
独立同分布の確率変数−−から作った新しい確率変数。確率変数だから、分
布をもつ。どんな分布になるかは難しいが、標本平均については(驚くべき
ことに)中心極限定理によって、nが大きければ「正規分布」といえる。そ
の分布パラメータ(平均・標準偏差)が母集団分布のパラメータ(母平均・
母標準偏差)と一定の関係をもつのは当然。
実際の標本調査結果は、それらの確率変数(標本・標本平均・標本分散)
のひとつの実現値例。だから1000回調査して1000個の標本平均を得れば、
確率変数である標本平均の分布を1000個のデータの分布として見ることが
できる。1000回の試行結果例、というわけやね。
330132人目の素数さん:02/12/19 23:05
では、韓国の大統領選挙があったので、選挙の問題。
ある人口20万の市で市長選挙があり、投票率は50%だった。
開票率30%時点で一方の候補者の当選が確実になった。
確実になるということは99%以上の確率で当選ということと仮定して、その候補者の得票数
を求めなさい。
331330:02/12/19 23:08
×人口20万
〇有権者数20万
332132人目の素数さん:02/12/19 23:10
>>331
20万人全員が立候補した場合も考えるのかよ?
333330:02/12/19 23:16
ごめん、立候補者は2人。
334132人目の素数さん:02/12/20 00:08
正規分布
335132人目の素数さん:02/12/20 00:13
>>326
そうですね。では具体的に書きます。
下記のスレにおいてバナー掲示期間について投票をしていました。その投票結果の
解釈の妥当性をお聞きします。アンケート集計等にお詳しい方よろしくお願いします。

バナーA:ぎこ3発、バナーB:がんがれよ

"サカヲタ殿下"高円宮憲仁親王バナーを
http://sports3.2ch.net/test/read.cgi/soccer/1037903003/312
312 02/12/05 01:39
この時点での板のバナーはバナーBでした。そして、「何時までこのバナーを
あげるのか」 という形で投票が始まりました。その選択肢は、「1、今すぐ、
できるだけ早く 2、高円宮杯決勝終了の12/23 3、天皇杯決勝の01/01」の
3つでした。
より具体的にいえば、1とは(投票終了時点で)バナーBからバナーAへ変更を、
2とは高円宮杯決勝終了の12/23までバナーBで、3とは天皇杯決勝の01/01まで
バナーBでとなるかと思います。ただし、投票終了日時は未定のままでした。

http://sports3.2ch.net/test/read.cgi/soccer/1037903003/401
投票終了日時が02/12/09 23:59に決まりました。
これにより、「何時までこのバナーをあげるのか」は、「12/10以降何時まで
このバナーをあげるのか」になるかと思います。

http://sports3.2ch.net/test/read.cgi/soccer/1037903003/431
1、今すぐ、できるだけ早く。    19票
2、高円宮杯決勝終了の12/23  16票
3、天皇杯決勝の01/01       14票

集計結果がこうなり、19>16>14ということで案1が多数扱いにされ、
バナーBからバナーAに変更となりました。
336132人目の素数さん:02/12/20 00:14
>>335続き
http://sports3.2ch.net/test/read.cgi/soccer/1037903003/576,584
しかし、576、586で投票はいつからいつまでの期間に対して行われたものであり、
暦の性質上、案3(12/10-01/01)賛成者は案2(12/10-12/23)期間にも賛成して
いたため、案1ではなく案2が本来の結論だとの指摘がありました。

指摘をまとめると、下記のようになります。
賛成反対と期間で整理
「12/10以降いつまで掲示するか」が質問。便宜上12/10を分岐日とした。
1、今すぐ、できるだけ早く………19票 (1)12/09まで
2、高円宮杯決勝終了の12/23…16票 (2)12/10-12/23
3、天皇杯決勝の01/01…………14票 (2)12/10-12/23 (3)12/24-01/01

…………………賛成……反対…
(1)12/09まで ……19…<…30…49
(2)12/10-12/23…30…>…19…49
(3)12/24-01/01…14…<…35…49
(1)に関しては反対、(2)に関しては賛成、(3)に関しては反対がそれぞれ多数。
その結果、(2)12/10-12/23が選ばれる。

焦点は、案3賛成者が案2期間に賛成しているとすること、いうなれば、
(1)〜(3)と期間を区切った上で解釈することの妥当性です。
今回のような、いつからいつまでという期間に対して投票を行った場合の解釈は
通常、どのようにされているのでしょうか?
当該スレでは期間を区切らず、設問に対する賛成の大小で結論をだしましたが、
この考え方で合っていたのでしょうか。私は、期間を区切って解釈し、その上で
(2)12/10-12/23が選ばれるという解釈の方がより妥当性あると思いました。
そのため、期間を区切る解釈の妥当性をスレ住民に求めましたが反応がありません
でした(明確な反論もありませんでしたが)。
なお、私自身が後学のために知りたいということですので、当該スレとは無関係
でお願いします。では、よろしくお願いします。
337132人目の素数さん:02/12/20 00:16
X,Yはそれぞれ指数分布Ex(α),Ex(β)に従う互いに独立な
確率変数であるとする。以下の問いに答えよ。
(1)確率変数U=max{X,Y}の分布を求めよ。
(2)確率変数Z=X+Yの分布を求めよ。

教えて下さい。
338132人目の素数さん:02/12/20 00:16
339132人目の素数さん:02/12/20 00:25
>>337
(1)max(X,Y)の分布関数は、それぞれの指数分布の分布関数を乗すれば出るので、
それを微分する。
(2)たたみこみ
340132人目の素数さん:02/12/20 00:53
>339
>分布関数を乗すれば
どういうことですか?
>(2)たたみこみ
これもどういう意味かわからないんですが
どうか教えて下さい。
341132人目の素数さん:02/12/20 03:21
>>337
(1)U=max(X,Y)とすると Pro(U=<u)=Pro(X=<u)Pro(Y=<u)
これを求めてuで微分

(2)Pro(Z=<z)=Pro(X+Y=<z)=Pro(Y=<z-X)
=∫[0 to z]∫[0 to z-x]f(y)dy f(x)dx
[a to b] は積分区間。
これを求めてzで微分。
342132人目の素数さん:02/12/20 21:31
>>341
どうしてわかるんですか?勉強しだいですぐにわかるようになるんですかね?
343339:02/12/20 22:16
>>342
俺の言ってる意味がわからないようでは、無理。
344341:02/12/21 03:32
>>342
分布関数を微分すると密度関数になるから。
指数分布の分布関数はすぐ出るでしょ。
ちなみに俺は339じゃないよ。
345132人目の素数さん:02/12/21 09:10
統計ぜんぜんわからないから教えてくください。
エクセルのt-検定 : 一対の標本による平均の検定ツール
の結果が次のようにでました。
これは有意差があるということを示していると考えてよいと思うんですが、
果たして、どちらが優れているのかって、どう判断したらよいのでしょうか?
ここでは、優れているとは0に近いということで、
ぱっと見では変数2のほうが優れていると思うんですが、
根拠をなんと言えばよいのかわかりません。

変数 1変数 2
平均0.1698800830.066920906
分散0.0082463310.002001865
観測数9696
ピアソン相関0.743882574
仮説平均との差異0
自由度95
t 15.55968082
P(T<=t) 片側3.58222E-28
t 境界値 片側1.661051101
P(T<=t) 両側7.16445E-28
t 境界値 両側1.985249583
346132人目の素数さん:02/12/21 09:12
あ、スペースが消えてしまった。ごめんなさい。
     変数 1       変数 2
平均   0.169880083    0.066920906
分散   0.008246331    0.002001865
観測数  96         96
ピアソン相関    0.743882574
仮説平均との差異  0
自由度       95
t          15.55968082
P(T<=t) 片側    3.58222E-28
t 境界値 片側    1.661051101
P(T<=t) 両側    7.16445E-28
t 境界値 両側    1.985249583
347132人目の素数さん:02/12/21 10:42
見づらい。
整数にしてから計算しろ。
348132人目の素数さん:02/12/21 11:38
t検定とか、F検定とか
サンプル数が多ければ多いほどいいの?
めちゃめちゃ多いデータを入れると、こちらが予期していた結果が出ない。
なるべく、データを少なくしたいんだけど、、、邪道なのかな?
>>348
そもそも予期していた結果だけを得るものじゃないだろ。
都合のいい結果だけが欲しいなら検定なんかするなよ。
350132人目の素数さん:02/12/22 00:20
複数の集団があり、
0に近いほどよい集団だとする。
いくつかの集団は正の数だけ、いくつかは負の数だけというものがある。

このとき、集団の絶対値をとって、比較するのって意味がありますか?
また、ゼロに近いというのはどう判断したらよいでしょうか?
たとえば{1,3,4,2,4}と{1,4,4,1,4}
はどちらが0に近いといえばよいのでしょうか。

「0に近いほど良い」とする根拠は統計学の中にはないのだから、
どのような比較が妥当かは、その問題を扱う分野の常識や君の主張によって
正当化されなければならない。
352350:02/12/22 00:54
>>351
レスありがとうございます。
なるほど。。。
重み付けはその分野によるということですか。
なるべく0に近いほどよいということで
単純に2乗するのってのはだめでしょうか?
根拠はないんですが、、、、

ところで、
分散は何で2乗してあるんですか?
平均からのばらつきの距離二乗の和ですよね。
似たような感じだと思うんですが、、、

0からの離れ具合を同じように示すことはできないもんでしょうか。
353132人目の素数さん:02/12/22 01:34
うーん。分散は平均からの差の平方を要素数で割って
平均からのばらつきを出してるから、
もしかしたら、0で引いたと考えて分散みたいにだせば、
0からのばらつきといえるのかもしれないね。

違うかもしれないけど、、、識者の方お願い。
354132人目の素数さん:02/12/22 13:37
>>350
例えば工場とかで製品を作っているときだったら、部品の寸法が1.00mmという
規格だった場合、そこから大きく外れたものばっかり作る生産ラインはよくない
ということになりますよね。そういう感じのことでいいのかな?

統計的には、標準偏差がどこまでか(どこまでばらつくことが許容されるか)で、
判断すればよいと思います。

分散とか標準偏差の定義式は自分で調べていただきたい。
355350:02/12/23 02:28
>>354
ということはなるべくよい生産ラインを調べたいときは
標準偏差が小さいものを選べばよいという理解でよいですか?

今回考えている状況は、
部品の規定寸法はすべて違うのですが、
実際に作った部品との寸法の差がなるべく
小さいものを選びたいというものです。
>>355
背景によると思うよ。良いというのは評価だから、
評価することによって何か行動決定に使えないとあまり意味がない。

まあどっちにしても平均と標準偏差でデータを要約するのは基本技術だし
平均だけ見ても役に立たないことは多い。むしろ平均と標準偏差の関数で
決まるコストを想定して品質管理がされることが多いのでは。

例えば、バラツキが比較的小さいけど平均が0からちょっと外れたものと、
平均がピシャリ0だけどバラツキが比較的大きなラインはどっちが
良いかは、一概にはいえない。
コストをちょっとかければバラツキを抑えることができるとか、
バラツキを変えないまま平均を変更できるといった選択可能な行動と
そのコストが分からないと評価基準として使いにくいと思う。
357350:02/12/23 03:37
ごめんなさい。
たぶん生産ラインの話をしてしまったから誤解を招いたかもしれません。

本当は、ある値を推定する推定式がいくつかあって、
その式からみちびいた値がどれだけ実測値に近いかを知りたかったのです。

なるべく実測値に近い値を出せる式がどれかを選び出したかった。
ということです。

そこで、統計学でそれが可能ではないかと思って調べていたんです。
そして、今現在調べているところなんですが、
どうやらこういうのには相関というものが関係してるようですね。
見当違いをしていました。

そこで、何度もお聞きして申し訳ありませんが、
相関が1に近ければ近いほど推定値を出す式の精度が高い
ということになりますでしょうか?
358数学嫌いの院生:02/12/23 04:21
>209
希望する地域と、どの程度の学力なのかを教えてください。

>244
意味のない差を検出してしまうことがあります。

>301
どのようなデータの取り方をしているのか、もうちょっと
説明してもらえますか?
場合によっては乱塊法も使えるかと思うのですが・・・・

>350
もし規格があるなら工程能力指数を計算するのが良いと思われ。

さて214や320が言ってる
「○○は同じといえる」や「○○と○○は変わっていない」
を検定しようと、母平均の差の検定や適合度検定をやって、H0が棄却されないのを望む
というやり方は「有意水準」という観点からもどうかと思う。
基本的に検定推定では「有意差アリ」の検出は出来ても、「有意差ナシ」の検出は
できないと思うのですが・・・・
他にいい方法ご存知ないですか?
>>357
相関係数も一つの見方に過ぎない。それで満足ならいいけどね。
明らかに比例関係にない場合や、極端に離れているデータがある
場合は相関係数は有効でないことが多い。

356に話を戻すと、推定式の中にはおそらく定数が入ってる
だろうから、その定数をパラメータとみて変更することで
平均や分散がどう変わるかが問題なのでは。

ただし推定式のなかに十分良いものがあると信じれる場合は
その方法でもいいけど、そうでないかも知れない場合は、
推定式の次数あたりから疑ってみる必要もある。実際、
物理では現象を説明する式が予め分かるわけないから、
AICのような方法を使う場面もある。
360数学嫌いの院生:02/12/23 04:30
>350
おっとすみません。
357のカキコを見ずに適当なこと言ってしまいました。

ちょっとお聞きしますが、推定式とは回帰式のようなものですか?
それ以外の何かのモデルで導き出された予測値と実測値があって、
その相関係数で評価しようというのですか?
361350:02/12/23 05:03
みなさん、ご意見ありがとうございます。

回帰式ではないです。
もともとサンプルがない状態で、
周辺情報から適当と思われる式を導き出し(でっち上げ)たものです。

362132人目の素数さん:02/12/24 15:47
相関の強さを見るために、クラメール係数の値がいくつ以上なら相関が強いといえるというような基準はあるんでしょうか。。。?
>>358
>基本的に検定推定では「有意差アリ」の検出は
>出来ても、「有意差ナシ」の検出はできないと
>思うのですが・・・・

言いたいことはわかるが、言葉遣いが不適切。
(有意差のアリ/ナシを決定するのが検定。)

帰無仮説が棄却されなかったとしても、それは、
「帰無仮説が正しくないとは言い切れない。」
という程度の意味であって、帰無仮説の正しい
ことが積極的に証明されたわけではない。

といわないと。まあ、検出力(第二種の誤りを
おかさない確率)を上げたい時はサンプルの数
を増やせばいいんだけどね。
364数学嫌いの院生:02/12/24 23:32
>363
>言いたいことはわかるが、言葉遣いが不適切。
>(有意差のアリ/ナシを決定するのが検定。)
>帰無仮説が棄却されなかったとしても、それは、
>「帰無仮説が正しくないとは言い切れない。」
>という程度の意味であって、帰無仮説の正しい
ことが積極的に証明されたわけではない。

この文章明らかに矛盾してます。
前半部分は「検定とは有意差アリ・ナシを決定するものだ」と言っているのに
後半部分は「検定とは有意差アリ・ナシを決定するものではない」と言っている。

まぁ文章を読む限り分かってそうだが、
検定ではアホみたいにサンプル数を増やせばいいというものではない。
使う分野にもよるだろうが、ヒストグラムが書ける程データをとった場合、
検定をすることに意味はありません。
365363:02/12/25 00:14
>>364
>後半部分は「検定とは有意差アリ・ナシを決定する
>ものではない」と言っている。

言っていないよ。後半部分に「有意差」なんて単語は
出て来ていないでしょう?もしかして「有意差」とい
う用語を、あなたと私とで別々の意味で使っているの
かな?
366132人目の素数さん:02/12/25 00:35
保険のアク板より
今年のアクチュアリー試験の数学。
なんかこの問題だけ解答がでないよー。
問題そのまま写すよ。

>>ある植物の種の重さを、10gきざみの度数分布表(例、0g超10g以下、10g超20g以下…)に整理して平均を求める。
平均の誤差が 0.2g 以下となる確率が、0.95以上となるためには、種の数を[  ]個
抽出すればよい。ただし、種の数は十分大きいとし、中心極限定理を用いて求めよ。

母集団の分散が未知なのに…。統計板の人ならどう思いますか?
367132人目の素数さん:02/12/25 01:00
>>366
1個の誤差は平均0分散2,5の一様分布に従うので、それに中心極限定理をあてはめる。
つまり、x個平均すれば誤差の分散は2,5/√x
ってなるからそれに正規分布をあてはめればいいんじゃないの。
368367:02/12/25 01:57
分散は2,5^2=6,25だね。
俺もこの問題0点だな。参った。
369132人目の素数さん:02/12/25 05:08
XとYの相関係数について
分子がXとYの共分散で、
分母が√(V(X))√(V(Y)) (V:分散)
なのですが、分母が覚えづらくって困っています。
「ある2数のルートの積を取る」行為に名前はあるのでしょうか
無ければどなたかネーミングしていただきたいのですが。
(現在は2分散の根号積と覚えています。金剛石みたい)
分散の平方根を標準偏差というわけだが
>>362
ない。比較して初めて意味を持つ。
>>369
「根号積」はへんだよ。
「根号」は記号の一種だから。

それから「根」だって、「平方根」と
しないと何の根なのかわからない。

略さないでそのまま「2分散の平方根の積」で
いいのでは?
373366:02/12/26 00:54
>>367
遅レススマソ。こういうことですか?
でも分散値は25/3になるんですけど?

X_i(i=1,2,…)は(μ-5,μ+5]上の一様分布に従うとする。(μ=5,10,15…)(X_1,X_2,…はi.i.d.)
するとE(X)=μ,V(X)=10^2/12=25/3
Y_n=(X_1+…+X_n)/nとおくとき,
√3n(Y_n-μ)/5 は n→∞のとき,N(0,1)に従う。
よってP(|Y_n-μ|≦0.2)≧0.95
とすると,0.2・ √3n /5 ≧ u(0.025)=1.96
∴n≧800.333…
ゆえに801個
374367:02/12/26 01:22
確かに計算してみると分散は25/3になるね。悪い悪い。
(∫[5 to -5]x^2・1/10dx=25/3)
だから標準偏差は5/√3でx個集めて平均すると5/√(3x)となるので
0,2>1,96・5/√(3x)となりx>800,3となって君が正しいね。
375366:02/12/26 01:31
いや、ヒントありがとうございます。
アク試験僕はさんざんでした。
むこうの板の人の評価では「数学」易化されているらしいっす。
もう1年確率統計みっちりやります。(今年は精密法2問…。なんも知らなかった…。)
376数学嫌いの院生:02/12/26 02:08
>363
ニュアンスの問題なんですかね?
基本的に私とあなたの考えていることは一緒だと思います。

初心者相手に”母平均の差に関する検定”等の説明をする時、
「有意差ナシ」と言うと、
「有意差ナシ」=「2つの母集団は完全に同じものだ」と誤解されることがあるので、
基本的に私は「有意差ナシ」という言葉は使わないのです。
>>376

「母平均の差に関する検定」でいうなら、私は
「有意差アリ/ナシ」という言葉を、以下の様
に理解しています。(簡単の為、母集団は両方
とも、分散1(既知)、平均未知の正規分布とし、
帰無仮説を「2つの母集団の平均は等しい」で
あるとします。)

・標本平均の差の絶対値が、ある数a(これは有
意水準から定める)以上になったとき、「有意
差アリ」という。
・標本平均の差の絶対値が、上記のa未満になっ
たとき、「有意差ナシ」という。

で、>>363となったわけです。有意差という言葉
を上記以外の意味で使うなら、話はかわってくる
んでしょうね。
378数学嫌いの院生:02/12/27 02:43
>377
つまりあなたが意味するところは、
解析の結果としての「有意差ナシ」という意味なんですね。
分かりました。
ちなみに私の専門分野は品質管理なんですが、
あなたの専門は何ですか?
参考までに知りたいです。
379132人目の素数さん:02/12/30 03:33
いま、統計学勉強してる工学部の学生ですが、
特性関数やら積率母関数やら意味不明です。

とりあえず、特性関数ですが、
なんの為に必要なんでしょうか?
380132人目の素数さん:02/12/30 04:27
>>379
中心極限定理を厳密に証明するときに使う>特性関数
>>379
もし、確率論を全く勉強してないなら平行して勉強することを勧める。
統計学だけやっても意味が分からんだろうし、単なる how to になっちまう。
でも統計学は how to として使えるほど単純じゃないからね。
382132人目の素数さん:03/01/07 16:55
経済学部学生です。初歩的な質問で恐縮ですが、仮説検定の趣旨について教えてください。
「帰無仮説」とは相関性の不在を仮定する説、「理論値と観測値の間の乖離は有意ではない」
即ち「理論が正しい」と仮定する説、という事なのですか?
そして理論と観測値の間の乖離の程度を示す χ2の値が大きく、棄却域に入れば、帰無仮説は
棄却される=理論値と観測値の間の乖離は有意である=理論の妥当性は疑わしい、と判定できる
という筋道なのでしょうか。
棄却域に入らなければ乖離は有意でなく、理論はほぼ正しいと言える、という事ですか?
383132人目の素数さん:03/01/07 16:59
も二つ、臨界値って一言で言うと何?臨界値より大きいとどうなる?
小さいとどうなる?
確率値ってのは「そのような理論と観測の乖離が発生し得る確率」って事ですか?
で、その確率値が小さければ、「それ程極端な乖離が発生する可能性は極めて低い、
異常事態だ」=「その理論ちょっと違うんじゃない?怪しいよ」ってな筋道になるん
でしょうか?
>>382

>棄却域に入らなければ乖離は有意でなく、理論は
>ほぼ正しいと言える、という事ですか?

「棄却域に入らなければ乖離は有意でなく、理論が
間違っているとは言い切れない。」が正しい。

その他の部分はマル。
384だが、すまん。「その他の部分はマル」と言ったが以下の部分は意味がよくわからん。

>>382
>「帰無仮説」とは相関性の不在を仮定する説、「理論値と
>観測値の間の乖離は有意ではない」即ち「理論が正しい」
>と仮定する説、という事なのですか?

統計的検定における「帰無仮説」とは、母集団に関する仮説で、検定によって棄却する/しないの判断にさらされるもの(検定によって無に帰するかもしれない仮説)、をさす。

統計的検定における「理論値」とは、帰無仮説が正しいと仮定した上で確率論的(理論的)に導かれる値である。従って、「理論が正しいと仮定する説」という部分は意味がとれない(統計的検定では、確率論(ランダムネスに関する理論)が正しいかどうかは問題にしていない。)

>>383は、「臨界値」や「確率値」といった言葉をどういう意味で使っているのかが分らないのでコメントできない。
386132人目の素数さん:03/01/07 19:29
>385
理論値は例えば5である。実験を行った。観測値を見たら5,1だった。
この0,1の差は偶然生じたものなのか、それとも理論に何か欠陥があるせいなのか。
帰無仮説とは取りあえず「その差は偶然生じたものでしょ、0,1くらいの差は起こり得るって。」と仮定する説・・・と
考えていたのですが・・。
「相関性の不在」とは理論値と観測値と間に何か関連がある、つまり何か理由があって理論値と観測値は乖離している、
という意味で書いたのですが。ああ、何か分かんなくなって来た。
387bloom:03/01/07 19:30
388132人目の素数さん:03/01/07 19:32
要するに帰無仮説という言葉の定義が判らないんだよお。(末期的)
389132人目の素数さん:03/01/07 19:37
も一つ、確率密度関数というのは頻度をヒストグラムで表した場合の縦軸に相当する
ものですか?で、それを積分したものがグラフの面積=確率に相当するのですか?
全然違ったら恥ずかしいので教官と対面して質問することが出来ません。
匿名の世界を有効活用しよう。
>>386
>帰無仮説とは取りあえず「その差は偶然生じたものでしょ、
>0,1くらいの差は起こり得るって。」と仮定する説・・・と
>考えていたのですが・・。

例をあげてみる。
あるコインがあるとする。コインに関する仮説、

H_0:そのコインを投げたとき、表のでる確率と裏の出る
  確率はどちらも0.5(50%)である。

を考える。これを検定しよう。検定において棄却する/しないの判断にさらされる仮説を帰無仮説という。いまはH_0を帰無仮説として検定を行う。

コインを100回投げ(これは大きさ100の標本を抽出することに相当する)、表の出た比率aを計算する。このaが「観測値」とか「実測値」などとよばれるもの。

H_0を「正しい」と仮定したときの表の出る比率の期待値は確率論的(理論的)に厳密に計算でき、0.5である。この値0.5が今の場合の理論値。

観測値aと理論値0.5との差の絶対値が、ある値xよりも大きければ帰無仮説H_0を棄却する。xよりも小さければ帰無仮説H_0を棄却しない。臨界値とはこのxのことか?xは有意水準から理論的に求まるある値。(もしかして確率値とは有意水準のことか?)
391132人目の素数さん:03/01/07 20:14
>386
訂正。相関性の不在とは(略)関連がある「わけではない」、(略)乖離している
「わけではない」という意味で書いたのですが。
392132人目の素数さん:03/01/07 20:16
>391
そう!多分その有意水準とやらだ!(いい加減・・)
>>389
>匿名の世界を有効活用しよう。

そんなことをするより、今すぐ本屋へ行って、確率統計の入門書を買え。それからでないと、質問すらもまともにできないぞ。
394SAFEWAY:03/01/08 15:45
多分この説明じゃわからないと思うけど・・・

帰無仮説ってのはようはその仮説があってるかどうかを確かめたい
仮説って事です。でどうやって確かめるのかというと
その仮説のもとでその統計量がどういう分布をするかを
考えるという方法で確かめます。

この統計量はこの帰無仮説のもとでこの分布に従うというような
事を言うわけですが、だからもしその仮説が正しいのならだいたい
その分布の平均値が出るはずですよね。もしその分布の元で
5%以下の確率でしかないような値が出たのであれば
その分布に従っているとは考えにくい、つまりその仮説が
あっているとは考えにくい → その帰無仮説を棄却
となるわけです。

395SAFEWAY:03/01/08 15:46
例えば最尤推定量なら標本数が大きくなっていくと推定値は
漸近的に真の値を中心とした正規分布に従っていくわけです。
この時平均はわからないけど分散は推定できるので
その推定した分散が1だとしたら真の値を中心として
分散1の正規分布に従っているわけです。
でもし仮にここで帰無仮説として真の値は0という
仮説を検定したいとしましょう。その時に
推定値が7だとしたら、平均0分散1の正規分布が
7という値をとる確率はほとんど0です。
そんな値が出ると言うことは平均が0であるという
仮説が正しいとは考えにくい → 帰無仮説の棄却となるわけです。
逆に真の値が7という帰無仮説を考えると
平均7分散1の正規分布が5〜9という値をとる確率は
だいたい95%くらいあるので7という推定値は
おかしくない → 帰無仮説を棄却しない
となるわけです。

仮説検定の原理はほとんど全部これです。つまりある
仮説が正しいとした時にその統計量はある分布に従うはずだ
がもしその統計量の値がその分布のもとでは出る確率が
非常に低い値が出てしまったらその仮説は正しくとは
考えにくいという事です。

統計量が確率変数だというの理解してください。
そして仮説検定とはようは帰無仮説の元でその確率変数が
どんな分布をするかというのを考える事だと思っておいてください。
それがわからないと検定とは何をやってるのか全くわからないと思います。
396132人目の素数さん:03/01/08 18:21
参考になりました。どうも有難うございます。
そうですね、やはり一定程度自学してからでないと質問は出来ませんね。
397132人目の素数さん:03/01/08 19:19
私の手元に在る参考書では離散型確率を以下のように説明しています。
「とり得る値がa1、a2・・・のように列挙できる確率変数」
列挙できるとはこれ如何に?
例えば複数のサイコロを投げた時の目の出方は離散型ですか?
>>397

>列挙できるとはこれ如何に?

この場合の「列挙できる」とは、厳密には、

とり得る値が有限個か、または、とり得る値全体の集合と自然数全体の集合との間に一対一の対応がある。

という意味です。数学ではこの事を「とり得る値全体の集合が高々可算集合である」といいます。

>例えば複数のサイコロを投げた時の目の出方は離散型ですか?

1,2,3,4,5,6 と列挙できる。よって離散型。
399132人目の素数さん:03/01/08 19:38
>「とり得る値全体の集合と自然数全体の集合との間に一対一の対応がある」
とはどういう事でしょうか?
例えば、「コインを投げて表が出れば1を裏が出れば0を与える」という試行があるとして、
生起する事象は表か裏かどちらかしかなく、表なら1、裏なら0に対応している、
という意味でしょうか?
>>399

>例えば、「コインを投げて表が出れば1を裏が出れば0
>を与える」という試行があるとして、生起する事象は表
>か裏かどちらかしかなく、表なら1、裏なら0に対応し
>ている、という意味でしょうか?

確率変数Xを次のように決めます。

コインを投げて表が出ればX=1、裏が出ればX=0。

Xの取り得る値全体の集合は{0,1}。これは有限集合なので、
確率変数Xは離散型(Xは離散型の確率変数)です。
402132人目の素数さん:03/01/09 12:46
連続型分布の例にはどんなものがあるのでしょうか?
身長、体重などですか?
「連続型分布において、定義区間にわたって確率分布を積分したものは1にならなくてはならない」とありますが、
これは要するに「定義区間の中のどれかの値は必ずとる」という事と同値なのでしょうか?
連続型では「特定の値をとる確率は0に等しく、一定の区間に対してしか確率を付与することは出来ない」
でしたっけ?これは「確率変数xが特定の値aをとる確率は0に等しいが、xが区間aからbの間に存在する確率は0以上」
という事でしょうか?これが離散型と異なる点ですか?
例えば、生徒の身長の分布において、165,22244556cmだとか175,9845736cmとかの特定の数値が
得られる確率は0であり、知ることが出来るのは165cmから175cmの間の値をとる確率ぐらいだ、
ということですか?
>>402

その理解でいいだろう。
(まあ、つっこみどころがない訳ではないが。)
404132人目の素数さん:03/01/09 17:19
どういうつっこみどころが?
405132人目の素数さん:03/01/09 20:32
無作為に選ばれたX人の誕生日で1年分のカレンダーを埋めることができる可能性が10%を超えるような最小のXていくら何でしょうか…
選ばれた人の誕生日には偏りがなくどの日に生まれるかは同様に確からしいとして

混乱してきた…逝ってきます
406132人目の素数さん:03/01/09 20:51
ところで今度は確率密度関数の話ですが、確率密度関数の高さをf(x)、xの周りの幅の区間をΔxと表すと、
母集団における平均μは
「μ=インテグラルxf(x)Δx」と表せると。

で、f(x)Δxは相対頻度(=生起回数/試行総数)に対応し、
f(x)は確率密度関数の高さを、Δxはxの周りにある区間の幅を表すと言うのですが、
柱状図に当てはめて考えてみると、f(x)は柱の縦幅の長さを、Δxは横幅の長さを表し、
縦掛ける横でその柱の面積が求まり、これが相対頻度即ち確率変数Xが或る値xの周りにあるΔxの幅の区間
に入る確率となる、ということでしょうか。

ほんで、平均(期待値)は、xにxが生起する確率f(x)Δxを掛けて各場合を合計する事で求まると。
離散型の場合のΣで各場合を合計する処理が、離散型の場合の積分に相当するという事ですか?
407132人目の素数さん:03/01/10 14:26
>>405
20人くらいじゃないの?


・・・・て煽りは置いといて、(考えなくても影響はないと思うが)2/29生まれに注意しないといけない。
さらにややこしい事に1900年は閏年じゃないな。
(1900は100の倍数でかつ400では割り切れないので。2000はたまたま400で割れたから閏年)

これらの要素が大勢に影響を与えないとしたら話は簡単で、

E(1)=1
E(2)=E(1)*(364/365)
E(3)=E(2)*(363/365)
・・・・
E(n)=E(n-1)*((366-n)/365)

と進めて、E(X+1)=<0.1<E(X)が成立する自然数Xを求めればよい。






408132人目の素数さん:03/01/10 18:02
   りんご みかん メロン ・・・
x1    54   10   20
x2    15   33   5
x3    13        41
例えば上のようなテーブルがあったとして、空欄に予想評価を与えるには
最小二乗誤差法という手法を使うと聞いたのですが、
Webで計算式調べてもさっぱりです…上の例で言うとどのような計算に
なるでしょうか?
409132人目の素数さん:03/01/11 01:27
age
410132人目の素数さん:03/01/11 01:37
確率変数って何か実際に分かってる人って少ないね。
>>407
大間違い。
412山崎渉:03/01/11 12:07
(^^)
>>405
x 人集めてきて、1年(365日)のうちちょうど i 日がカバーされる確率 Qi(x) を考える。

Qi(1)=C(365,i)*(i/365)**1、
Qi(2)=C(365,i)*(i/365)**2 - Qi(1)、
Qi(3)=C(365,i)*(i/365)**3 - Qi(1) - Qi(2)、
...

もちろん i>x のときは Qi(x)=0 とする。
Q1(x)からQ364(x)を全て加えたものが 0.9 を下回る最小の x が求める値。

と思う。でも、これでは手計算できない。
414132人目の素数さん:03/01/11 15:06
教科書にある以下の記述について御教示下さい。
@「確率密度関数とは相対頻度分布の極限、換言すれば母集団の相対頻度分布である」
・・・データを増やしていけば極限的漸近的に確率分布は正規分布に近づいて行き、
   確率密度関数とはこの正規分布に近似される分布を表す式である、という事でしょうか。
   またこの記述は離散型ではなく連続型分布を想定しているものでしょうか。
A「確率密度関数の高さは確率を表すものではない。飽くまで確率の密度を表すものに過ぎない。」
・・・「確率の密度」とは?
B「母集団の分布が離散型分布である場合、母集団の相対頻度分布を特に確率関数という。」
・・・@と併せて考えて、母集団の相対頻度分布を以下のように捉えたのですが、間違いありませんか。
   連続型の場合:データを無限に増やしていった時に漸近していく相対頻度分布の極限。正規分布で近似される。
          確率密度関数と呼ぶ。
   離散型の場合:とり得る値は可算個なので、データを増やす程、正規分布で近似される滑らかな曲線
          に漸近していくという事はない。確率関数と呼ぶ。 
415132人目の素数さん:03/01/11 15:45
C中心極限定理が以下のように説明されています。
「確率変数Xiの和狽wiの分布、及び平均狽wi/Nの分布は正規分布に近づく」
・・・「(データを増やすほど)正規分布に近づく」という事ですか。
D一致性とは標本数を増やして行くほど推定値が真の値=母数に漸近して行く
という事ですよね。これは要するに大数の法則と同値ですか?
一致性は当然満たされれるべき性質だと思われるのですが、殊更に提示するのは、
一致性を満たさない推定量も存在しているからなのですか。
E不偏性とは「母数Xの推定量をX^とすると、X^の平均がXである」という事だそうですが、
いまいち良くわかりません。
例えば10個の標本X1、X2、X3・・・・X10から成る母集団Yがあったとしましょう。
X1の平均をXバー1、X2の平均をXバー2・・・・として、Yの平均(=母平均)をμとすると、
 μ={(Xバー1)+(Xバー2)+・・・+(Xバー10)}/10
が成立する時にXバーiは不偏推定量といえる、という事でしょうか。
416132人目の素数さん:03/01/11 17:34
417132人目の素数さん:03/01/11 21:08
>>415

突っ込みどころ満載だが、とりあえず一つだけ。

>例えば10個の標本X1、X2、X3・・・・X10から
>成る母集団Yがあったとしましょう。

これは意味不明。「標本」「母集団」という言葉の意味を調べてみること。
言葉づかいの間違いが一つや二つなら、前後の文脈から類推して
逐次エラー訂正して読みすすめる事もできるが、>>414,>>415
様に間違いが多いと、もはやそれもできない。何が言いたいのか
さっぱりわからない。

>>414

>データを増やしていけば

「データ」を増やすのではなく「標本数」を増やすのでは?

>極限的漸近的に確率分布は正規分布に近づいて行き、

何の確率分布が正規分布に近づいて行くのか?
「中心極限定理」をキーワードに調べてみること。
この辺(414の(1))でいきなりつまずいているので、後の方
の文章がすっちゃかめっちゃかになっているようだ。
>>415

>「(データを増やすほど)正規分布に近づく」という事ですか。

「データ」を増やすのではなく「標本数」を増やすのでは?
(「データ」を「標本数」の意味で使っているのか?自分の
主張を他人に理解して欲しいなら、曖昧な言葉遣いはしない
ことだ。)

>一致性とは標本数を増やして行くほど推定値が真の値=母数
>に漸近して行くという事ですよね。

「漸近して行く」とはどういう意味で使っているのか?
もう少し調べて、数学的に述べてみよ。

あと、「確率変数」「統計量」「推定量」といった言葉の意味
はわかっているか?(この辺を曖昧にしたままだと後が大変。)

どうもやる気はあるようなので少々コメントしてみた。
健闘を祈る。
420132人目の素数さん:03/01/12 03:47
>>414
質問がたくさんあるので最初の質問に答えます。
あとは誰か順番に答えてあげてください。
まず@の質問について
@「確率密度関数とは相対頻度分布の極限、換言すれば母集団の相対頻度分布である」
・・・データを増やしていけば極限的漸近的に確率分布は正規分布に近づいて行き、
   確率密度関数とはこの正規分布に近似される分布を表す式である、という事でしょうか。
   またこの記述は離散型ではなく連続型分布を想定しているものでしょうか。
「」内はまぁいいと思いますが、そのあとの記述について、
データを増やしていっても相対頻度の形は正規分布に近づいていきません。
中心極限定理とごっちゃになっているみたいです。
和の分布が正規分布に近づくというのはそのn個の和を一個の標本として考える
という事です。そのnを増やしていったときに正規分布に近づくという事です。
あと「」内の記述は離散も連続もあてはまるでしょう。

421132人目の素数さん:03/01/12 07:04
>>420
すいません一つ訂正しておきます。
離散確率変数のときは確率密度関数とは呼びません。
Probability mass functionと呼びます。
日本語訳は知りません。
ちなみに確率密度関数はProbablity density function
ですがこの2つは本質的には同じものです。
422132人目の素数さん:03/01/12 07:24
>>414
ついでだからAとBの質問にも答えておきます。
まずBから。
ちゃんと読んでみると
「」の内の記述は結局Probability mass functionの事ですね。
つまり、日本語訳は確率関数だったんですね。

誤解の元は中心極限定理をまちがって理解している事のようです。
420でも書きましたが相対頻度の形は標本数を増やしても
正規分布の密度関数の形にはなりません。
その確率変数の確率密度関数や確率関数の形にどんどん近づいていきます。

Aはこの点が確率関数と確率密度関数の違いなのですが、
密度関数では区間の面積がその区間をとる確率なのに対して
確率関数の方はその点の値がその点をとる確率なのでこのように
説明したんでしょう。連続確率変数が一点を取る確率がゼロというのは
一見おかしく見えますが、それを説明するのは測度論や
ルベーグ積分の話になってきて難しくなるのでやめます。
423132人目の素数さん:03/01/12 12:48
無知晒しまくりでお恥ずかしい限りです・・初学者ゆえ何卒ご容赦下さい。
訂正して再度お尋ねします。

@ヒストグラムを書く際に、標本数を増やしそれに応じてグループ分けを細かくしていけば
(10刻みから5刻みへ、5刻みから1刻みへ、1刻みから0,2刻みへ・・・)、ヒストグラムの概形
は次第に滑らかになって行きますよね。「極限的漸近的」とは、標本の相対頻度分布が、標本数
を増やすにつれてどんどん母集団の相対頻度分布に近づいていく有様を述べたつもりです。
で、母集団の相対頻度分布を、
(1)連続型の場合は確率密度関数と言う。区間の面積がその区間(の中にある或る値)をとる確率を
表す。つまりxという特定の値をとる確率は0であり、凅という区間に対してしか確率を付与する事はできない。
確率変数が区間凅の中に入る確率は、面積f(x)儿で表される。
(2)離散型の場合は確率関数と言う。或る特定の値(例えばサイコロの3の目)に、確率変数がその値(3という値)
をとる確率(1/6)を付与する事ができる。
冷静に参考書を読んでみると、確かに中心極限定理と混同していることが分かりました。
「正規分布に近づいていく」ではなく、「母集団の相対頻度分布(=確率密度関数or確率関数)に近づいていく」
で宜しいのですよね。
AB「連続型では区間に対してしか確率を付与できない。離散型では一点に対して確率を付与する事ができる。
従って、連続型では、(分布を表す)確率密度関数の高さf(x)は確率を表さず、区間凅と高さf(x)を掛け合わせる
事によって初めて確率が出る。」
「連続型の母集団の相対頻度分布を確率密度関数と言う」 
「離散型の    ”      確率関数と言う」という解釈で宜しいでしょうか?
424132人目の素数さん:03/01/12 12:53
すいません!
条件付き確立の定義ってどういったものですか?
425132人目の素数さん:03/01/12 13:18
C中心極限定理を以下のように解釈しましたが宜しいでしょうか。
「複数の独立な確率変数の和(若しくは平均)を一つの確率変数Xとして捉えると、
要素となっている確率変数それぞれの分布がどのようなものであれ、Xは正規分布に
従う。」
D一致性は以下のように解釈しました。
「確率変数Xの推定量をX^とする。εをXとX^の間の乖離の許容限界、即ち何とかぎりぎり
許される誤差の最大範囲とする。
X^が区間[X−ε、X+ε]の中に入る確率が、標本数を増やすにつれてどんどん1に近づいていく時、
X^は一致性を満たすと言える。」
E不偏性については要するに以下のような事を考えていたのですが。
「日本人の平均身長を推定するために、東京の平均身長と大阪の平均身長を用いる。
この時、日本人の平均身長は(推定の対象となる)母平均に、東京の平均身長と大阪の平均身長はそれぞれ
推定量に相当する。
日本人の平均身長=(東京の平均身長+大阪の平均身長)/2
が成立する時、東京の平均身長と大阪の平均身長はそれぞれ不偏推定量である、という事が言える。」
やっぱり違いますかね。何か他に適例があったら御教示ください。

相変わらず間違いだらけだと思いますが、御指摘を頂ければ幸いです。
>>425

>「確率変数Xの推定量をX^とする。

確率変数について理解できていないと思われます。「確率変数」という言葉の意味を調べてみて下さい。あなたの教科書にはなんと書いてありますか?
427132人目の素数さん:03/01/12 15:10
すみません、D誤解している部分がありました。
「確率変数X」ではなく「母数X」に訂正して下さい。

おっしゃる通り確率変数の定義を未だによく理解していないので教えて下さい。
教科書には「確率的にいろいろな値をとる変数。略式に言うと偶然に左右される変数。」
とあるのですが、具体的にイメージできません。

或る確率分布を背景に伴って動く変数、という事ですか?
例えばさいころの目をXとすると、Pr{X=i|i=1,2,3,4,5,6}=1/6という確率分布を
伴いつつ、Xは1から6まで色々な値をとる、という事ですか?
>>427
>教科書には「確率的にいろいろな値をとる変数。
>略式に言うと偶然に左右される変数。」とある
>のですが、具体的にイメージできません。

確率変数の定義は、「文系用」や「やわらか工科系用」の
教科書などでは、分かりやすく書こうとするあまり上記の
用に(初心者には)意味不明な説明がされている事が多い。

とはいえ、厳密に説明すると、これもまた初心者にとって
意味不明になる。以下のような説明ではどうか?

確率変数とは、

(1)確率実験が行われる前には値が代入されていない。
(2)確率実験が行われると、その瞬間に値が代入される。
(3)代入される値は、実験結果に応じてあらかじめきめ
   られている。

上記の様な変数の事である。例えば、コイン投げの実験に
ついて、

・表がでたらX=1(Xに1を代入する)としよう。
・裏がでたらX=0(Xに0を代入する)としよう。

とあらかじめ決めれば、このXは確率変数である。
429420:03/01/12 15:44
>>423はそれでいいと思います。ただ一つ言うと極限と漸近は違います。
簡単に言うと漸近とは極限に行くちょっと前に状態と考える事ができす。
ものすごく極限に近いけど極限ではない状態の事です。

>>425は@は正規分布に近づくと言い換えれば、いいと思います。
一致推定量の定義は真の値に確率収束する推定量のことです。
直観的な理解としては標本数が増えれば増えるほど真の値に
近づくというだけで十分だと思います。
不偏推定量とは推定量が確率変数だということを理解して
その期待値が真の値と等しいという事です。
(1)一致推定量だが不偏推定量でないものや
(2)不偏推定量だが一致推定量でないもの
両方ありえます。

>>427
確率変数を測度論的に厳密に定義すると集合の話から始まって
いろいろと(ここで書くには)面倒な定義をしないといけないので
それはテキストを見た方が早いと思います。

直観的には427でいいと思います。むしろ小難しい確率変数の
定義を(応用で使ってる分には)覚える必要はありません。

さいころの目の他には例えばコインをはじいて裏表がでる事象なども
確率変数といえるでしょう。
430132人目の素数さん:03/01/12 16:05
>428
実験前はXと大文字で表され、実験後判明した実現値・観測値はxと小文字で表されるんでしたっけ?
Xはxとして実現されるという事ですか?
具体的に言うと、さいころを振る前に、これから出るであろう目をXと事前に表現しておき、
実際に振った後例えば3が出たら、X=3と代入される、という事ですか?
この場合3が小文字のxに相当するという事ですか?
>>430

確率変数を大文字(例えばX)であらわし、実際に実験を
したときにその確率変数に代入された(される)値(こ
の値の事を確率変数Xの「実現値」といいます)を小文字
(例えばx)であらわす流儀があり、一般に広く採用され
ています。

>具体的に言うと、さいころを振る前に、これから出るで
>あろう目をXと事前に表現しておき、実際に振った後例
>えば3が出たら、X=3と代入される、という事ですか?
>この場合3が小文字のxに相当するという事ですか?

そうです。
432132人目の素数さん:03/01/12 16:19
>429
「標本数が増えれば増えるほど新の値に近づく」
・・・要するに、大数の法則に従う、という事ですか?
「不偏推定量とは、推定量が確率変数だということを理解して、その期待値が
真の値と等しいということ。」
母数を推定するために用いる推定量が、或る確率分布に従いつつあれこれ変動し、
変動しつつもその平均値は母数とピシャリ合致する、という事ですか?
>>432

n個の標本に対応する確率変数を、

X1,X2,・・・,Xn

とする。

Y=(X1+X2)/2
Z=(X1+X2+・・・+Xn)/n

とする。YもZも、母平均の推定に関する不偏推定量だ。
Zは、一致推定量でもある。しかし、Yは一致推定量で
はない。
>>425

>中心極限定理を以下のように解釈しましたが宜しいで
>しょうか。「複数の独立な確率変数の和(若しくは平
>均)を一つの確率変数Xとして捉えると、要素となっ
>ている確率変数それぞれの分布がどのようなものであ
>れ、Xは正規分布に従う。」

「確率変数それぞれの分布がどのようなものであれ」の
部分だが、要素となっている確率変数それぞれは、全て
ある一つの確率分布に従っていなければならない。
>>432
>母数を推定するために用いる推定量が、或る確率分布
>に従いつつあれこれ変動し、変動しつつもその平均値
>は母数とピシャリ合致する、という事ですか?

言葉遣いがなってません。(従って意味がとれません。)

「推定量」という言葉と「推定値」という言葉を、しっ
かり使い分けて、上記の文章をもう一度書き直してみて
ください。

「推定量が」「あれこれ変動する」なんておかしいと思
いませんか?

「推定量」と「推定値」の区別がついていないところが、
あなたがこんがらがっている一つの大きな原因でしょう。
「推定量」と「推定値」の意味を調べてみてください。
436132人目の素数さん:03/01/13 00:17
分散を算出する時,なぜn-1で割るのか教えてください。
437132人目の素数さん:03/01/13 00:20
>>436
単にデータが2個しかないときの整合性のためです
438132人目の素数さん:03/01/13 01:15
回答者の皆さんわざとか知識不足かはしりませんが、
結構嘘が混じってますよ。
>>437

おいおい。そりゃないだろ。
母分散を推定する時に用いる標本分散の分母がn-1なのは、
そうしないと不偏推定量にならないからだろ。
440420:03/01/13 03:29
>>432
しょうがないので一致推定量の定義をちゃんと書きましょう。
(ここで数式を書くのは書きにくいし書けないのもあるのでいやなんですが)
まず確率収束を定義します。
    limPro(|m(n)*-m|>=e)=0
ここでm:定数 m(n)*:ある数列 >=は不等号です。
limはnが無限大になるように取ってます。
これがが任意のeで成り立つとき(つまりどんなに小さな正のeで成り立つ)
m(n)*はmに確率収束するといいます。
そして推定値が真の値に(nが大きくなるにつれて)確率収束
するような推定量を一致推定量といいます。

大数の法則とは(実は大数の法則にもいろいろあるんですが一番最初に習うのを)
標本平均が確率収束するという事です。推定量が標本平均だったら
大数の法則から推定量が一致推定量であることが言えます。

不偏推定量とはさっきの書き方を使うと
       E[m(n)*]=m
がnに関係なく成り立っている事です。
432は不偏推定量に関してはいいと思います。

ちなみに名前欄に420と書いてあるのだけが僕が書き込んだものです。
他のは僕ではありません。確かにいくつか間違いがあるようです。
441132人目の素数さん:03/01/13 06:52
Wilcoxson順位和検定って、
サンプル数が多くなってもちゃんと有意差を検出できる?
>>440

>ここでm:定数 m(n)*:ある数列 >=は不等号です。

m(n)*:ある確率変数列

>そして推定値が真の値に(nが大きくなるにつれて)確率収束
>するような推定量を一致推定量といいます。

nが大きくなるにつれて真の値(推定したい母数)に確率収束
するような推定量を一致推定量といいます。
443132人目の素数さん:03/01/13 11:34
弱一致推定量であることは,
その推定量の分散とバイアスがともに0に収束することと
同値である.
444132人目の素数さん:03/01/13 11:42
推定値まで真の値に確率収束するのは強一致の方な.
まあこの場合は確率収束するだけじゃじゃないけど.
445132人目の素数さん:03/01/13 12:31
統計学初心者ですが、問題でどうしても解けない問題があります。
周りに聞く人もいないので正直困ってます・・
何方か『解いてやるよ〜』って方いませんか?
その際はメールで問題お送りします。
お願いします・・・
問題は重回帰分析等です。

446132人目の素数さん:03/01/13 22:43
教えてください。
Q、ある空港の駐車場を拡張する計画がある。平均駐車時間が以前に比べ長くなっているなら拡張しなければならない。
平均駐車時間が従来どおり42,5分であるかどうか検定したい。入出時間が記録されている駐車券を36枚サンプリングし
て調べると、その平均は46分であった。今までの経験から、標準偏差は7,6分であることがわかっている。この時、有意
水準を5%として仮説検定を行ないなさい。
447132人目の素数さん:03/01/13 22:51
おいおい。446は自分で考えるつもりが全くないだろ。(レポートか?)
まずは一冊くらい入門書読んでみろよ。こんなの3ページくらい
読んだら分かることだろ。

ヒント:分散が既知の場合の母平均の仮説検定
448132人目の素数さん:03/01/13 23:29
>>447
ごめんなさい。参考書持ってなくて気がついたら提出明日だったんです。
ちょうど講義休んだ時ので、わからなくて。
帰化仮説:μ=42.5 対立仮説:μ>42.5
42,5+1.64*√(7,6)^2/36=44,58
標本平均=46>44.58⇒帰無仮説を棄却
∴拡張が必要
でいいんですか?どうか教えてください。
449132人目の素数さん:03/01/13 23:42
結果は合ってるね
450132人目の素数さん:03/01/13 23:50
>>449
途中全然わかりません。教えてください。
451132人目の素数さん:03/01/14 01:51
最小二乗法の問題点と、そのチェック方法と解決法ってなんですかね?
どなたか教えてください
452132人目の素数さん:03/01/14 07:45
>451
一度回帰診断について調べてください.
ここでは書ききれん
453経済学部生:03/01/14 12:51
誰が何を書いたか明確になるよう、以後名前を付けて書き込みたいと思います。
>433 母平均に対する推定量について。
>(X1+X2)/2は不偏推定量だが一致推定量ではない。
>ΣXi/nは不偏推定量かつ一致推定量である。
前者も後者もその期待値が母平均と等しいという点で不偏性を満たす。
しかし、後者がnの値を増やしていくにつれ、母平均との誤差が0である確率が1に収束していく
という点で一致性を満たすのに対し、前者は(標本数が既に2と決定されているという点で)そのような
事態が起こり得ないから一致性を満たさない、ということですか?

>435不偏推定量について。
>「推定量が変動するなんておかしい」「推定量と推定値とを区別せよ」
推定量とは確率変数(実験前に事前的に値の取り方が確率分布によって規定されている変数)の
一種ですよね。「あれこれ変動する」とは「変数が或る一定の確率分布に従いつつ色々な値をとる:
例えばさいころの目が1から6まで色々な値をとる」事を表現したつもりです。
で、推定値とは推定量を具体的に計算した結果、言うなれば定数という事ですか?
また、「確率変数の平均」「推定量の平均」という言葉が今まで余りピンと来なかったのですが、
「期待値」といった方が分かり易いのかも知れません。
「これから実験をしたら、おおよそこんな値が出るだろう」と期待・予測される値、という事ですよね。
454132人目の素数さん:03/01/14 13:27
455経済学部生:03/01/14 14:44
また、「推定量」という言葉を調べていて新たに発生した疑問。
「統計量とは標本から構成される確率変数である。標本の関数と言ってもよい。推定のために
用いられる統計量を特に推定量と言う。」とあるのですが・・。
標本平均は母平均に関する推定量ですよね。
標本平均は標本の和をn(標本数)で除したものであるという点が、「標本から構成される」に相当するのですか?
要素となっている標本それぞれは確率変数だから、その和をnで除した標本平均も確率変数になる、という事ですか?
「標本の関数」とは、どのような標本を採るのか、或いは採られた標本がどのような値をとるかで、標本平均の値
が決まって来る、という事を指しているのですか?

>440 一致推定量について。
私は「一致性」という言葉を「誤差の許容限界内に推定量が入る確率が、標本数を増やすにつれて1に収束
していく」と捉えて425のDにも書いたのですが、言っている事は同じですかね。
>443 推定量の分散と誤差が0である確率が1に収束する、という事ですか?
普通「一致推定量」と言ったらこの弱一致推定量を指すのですか?

456えと:03/01/14 14:50
457経済学部生:03/01/14 15:00
>436 母分散の不偏推定量が、Σ(Xi−標本平均)^2/(n−1)である理由について。
数学的な証明ではありませんが、直観的には以下のように捉えて宜しいのでしょうか。

仮に母平均が既知であったら、母分散=Σ(Xi−母平均)^2/nと推定されますよね。
然るに今残念ながら母平均は未知である。仕方がないから標本平均を用いて母分散を推定するしかない。
しかし、幸いΣ(Xi−母平均)^2>=Σ(Xi−標本平均)^2
即ちΣ(標本−母平均)^2>=Σ(標本−標本平均)^2
である事だけは判明している。(証明は後述)
Σ(Xi−母平均)^2/n・・・@
Σ(Xi−標本平均)^2/n・・・A @>=A
母平均が分かってさえいれば母分散を@と推定できるのに、分からないゆえに標本平均を
用いて推定するしかない。Aと推定してしまいそうになるが、@>=Aであるから、
もう少しAを大きくして@に近づけるために、Aの分母をnより小さな数で割った方がよさそうである。

nより小さな数で割る理由は大雑把にはこのように捉えられるのでしょうか。

458132人目の素数さん:03/01/14 15:12
不偏分散の期待値を計算すると母分散になるんだよ。
母分散の期待値を計算すると母分散より大きくなっちゃうんだよ。
どちらも一致推定量だけど、何度も実験を繰り返したら、
平均値が真値になるほうが、なんとなくすっきりするだろ?
だから、不偏分散の方が好まれるんだよ。

ただ、いつでも不偏推定量が良いというわけじゃないんで、
その辺はじっくり勉強してくんな。
459132人目の素数さん:03/01/14 17:10
>458
>「不偏分散の期待値を計算すると母分散になる」
・・・これが不偏分散が「不偏」たる所以な訳ですか?
>「母分散の期待値を計算すると母分散より大きくなる」
・・・「母分散の期待値を計算する」とは?
    Σ(Xi-標本平均)^2/nを計算する、という事ですか?
    そしたらこれは母分散より小さくなりませんか?
>「平均値が真値になる」
・・・「不偏分散の期待値を計算すると母分散になる」事を指しているのですか?
   不偏分散の平均値(=期待値)は母分散と等しい、という意味ですか?

物わかり悪くてすみません。
460132人目の素数さん:03/01/14 17:13
因みに459は私です。(名前入れるの忘れました。)
436は別の方です。
461経済学部生:03/01/14 17:14
すみません、460も名前忘れてました・・。
462420:03/01/15 00:14
>>442
442が僕の間違いを指摘しているようなので少し書き足しておきます。

まず最初の指摘ですが、これは別に間違いではありません。
普通の意味で収束するなら確率収束するのは定義から明らかですから。
何も確率変数列に限定する必要はありません。

2番目は確かにそう書かないとだめですね。

弱一致と強一致の違いを指摘している人がいます。
僕はこの二つの違いをうまく説明できません。
というのも僕はalmost sure convergenceというのがまだ
よくわかってないからです。もう少し勉強してきます。

>>455
誤差の許容限界内というのがよくわからないですが多分あってると思いますよ。

463420:03/01/15 00:15
>>434に関連して、中心極限定理について少し書いておきます。
中心極限定理と一口に言っても実はいっぱいあります。まず普通一番最初に習うのが
Lindeberg-Leby の中心極限定理というものでこれは独立同分布すれば
(正規化したものが)正規分布に分布収束するというものです。
次が多分 Lindberg-Feller の中心極限定理というものでこれは
独立だけど同分布でない確率変数用です。
同じくLiapounovの中心極限定理というのもあります。
独立でなくしかも同一の分布でない確率変数には例えば
Wooldrige-Whiteの中心極限定理というものがあります。
これは計量経済学を専門でかなりコアにやるつもりの人なら
そのうち知る事があるかもしれません。
他にもマルチンゲール差分列の中心極限定理だとかいっぱいあります。

これらの中心極限定理は例えば独立という仮定を緩めたりすると
モーメントに関する条件が強くなったり、いろいろと他の条件が強くなります。
そういう意味で独立性や同分布性とモーメントやら他の条件の間にトレードオフ
があるといえます。

434はLindeberg-Leby の中心極限定理を想定して言ってるんでしょうが
Lindberg-Feller の中心極限定理を想定するならこれはかならずしもこうで
ある必要はありません。もちろんその場合はさらに他の条件が必要になるんですが。

いろいろと長く書くのに疲れたのであとは他の人に聞いてください。では。
>>463
本当にわからないのだが、結局、434の指摘になにかまずいところでもあるの?(独立の条件と同一分布の条件を(同時
に)うまく変更することで、定理の変型がいろいろ考えられます、という話は434にどう関係があるの?いろいろ変型が
できるという事も書いておくべきでは?ってことかな?それとも425はそのままで間違いでは無いということかな?)
465464:03/01/15 16:35
>いろいろと長く書くのに疲れたのであとは他の人に聞いてください。では。

すくなくとも私にはいろいろと勉強になりました。どうもありがとう。
466経済学部生:03/01/15 19:49
今度は仮説検定の話に行きたいと思います。
χ^2基準を計算して有意水準を5%と設定し、Pr{χ^2>a}=0,05となるようなaを求め、
「χ^2基準の計算結果<a」であれば(理論値と観測値とがこの程度乖離する確率は5%以上あるから)仮説は棄却されず、
「a<χ^2基準の計算結果」であれば(理論値と観測値とがこれほど乖離する確率は5%以下しかない)仮説は棄却される、という道筋ですよね。

χ^2の値は理論値と観測値との乖離の程度を表す指標であり、その乖離が発生する確率が
5%以上あれば「まあその仮説は妥当と言えるだろう」と判断でき、
5%以下しかなかったら「そんなに小さい確率でしか発生しない乖離が生じるなんて、その仮説の妥当性は怪しいのではないか」と判断できる、
という趣旨ですよね。

ところが授業で課せられたレポートでは、こういった5%有意水準で棄却・受容という方式を採っていないのです。
χ^2基準の計算結果がaで、Pr{χ^2>a}=0,08という確率値を出して、
「この確率値は十分小さいとは言えないので帰無仮説を棄却することはできない」という道筋なのですよ。
確率値を算出する過程で、自由度(r−1)*(s−1)のχ^2分布を参照する他に何か色々やっているのですが・・。 

5%有意水準棄却/受容という論理展開も誤りでないとあって、むしろそちらの方がポピュラーだと思うのですが、
確率値の大小に対する客観的な判断基準ってあるんですかね?

それと初歩的な質問で恐縮ですが、χ^2分布でもt分布でも、
Pr{χ^2>a}=AとかPr{T>a}=Aとか言った場合に、
グラフの横軸に「理論値と観測値との乖離の程度」を示す値(a)が並び、
    縦軸に「そのような乖離(a)が発生する確率」の確率値(A)が並び、
確率密度関数を区間[a,∞]に亘って積分した値、すなわち[a,∞]の面積が、・・・・@
乖離の程度を表す確率変数χ^2或いはTがa以上になる確率を表す、ということで宜しいでしょうか?

@・・・場合によっては[−∞,a] 
>>466
>確率値の大小に対する客観的な判断基準ってあるんですかね?

それは、検定する対象によってちがうと思いますよ。たとえば、検定の
結果の誤りが命に関わるような場合は、(例え検出力を犠牲にしても)
なるべく安全側におちるように有意水準を低く低く設定したり。逆の
ケースでは有意水準を高めにしたり。(でも大体0.95とか0.98が多い
よね。これって慣習?>詳しい人)
>(でも大体0.95とか0.98が

0.05,
0.02 ?
いつの間にかレポートの質問スレに…
470132人目の素数さん:03/01/16 20:33
>>56
ものすごく遅レスだけど、統計学における未解決問題って例えばどういうのがありますか?
471質問:03/01/16 23:55
所謂「尤度比統計量」、「Neyman-Pearson尤度比基準」、「Bartlettの統計量」
は3つとも同じものと考えてよろしいのでしょうか。

間抜けな質問ですみません。
472471:03/01/16 23:58
つまり

χ^2=−2logλ

と。
473132人目の素数さん:03/01/17 06:06
先日の、中心極限定理の話題についていけなかった初心者です。
蒸し返してすみませんが、もう少し基礎的なところを教えても
らえないでしょうか?

参考書に中心極限定理は「確率変数 X1,X2,・・・・,Xn が互いに独立で
平均 m 分散が σ^2 の同じ分布に従うものとする。このとき
X1+X2+・・・+Xnを標準化した確率変数 Z=Σ(Xi-m)/((√n)σ) は
標準正規分布 N(0,1)に収束する」
って書いてあったのですが、これは
母集団(平均m 分散σ^2)から標本を1個とってきてその観測値をXiとする
と、 (ΣXi-m)/((√n)σ) は正規分布に収束するということですよね。
ということは、Xiの平均はmに近づくということでしょうか?
もし、そうだとすると、これは、大数の法則と同じ事(大数の法則を
含む事)を言っているのでしょうか?

よくわかってない質問ですみません。
はっきり言って、大数の法則と中心極限定理がよく区別できて
いないようです。
よろしくお願いします。

474473:03/01/17 07:22
473です。
もう少しさかのぼってログをよんだら、232,235,275,319 あたりでも
中心極限定理が話題になってたことがわかりました。でも、それをよんでも
今ひとつ、よくわかりません。

どうか、よろしくお願いします。


475458:03/01/18 06:35
>>459
あー、そうそう、小さくなる、で合ってます。間違えてごめんです。
小標本では一致性より不偏性か平均二乗誤差が小さいことが好まれる、
と言いたかったのさ。
>>464
434の指摘のうち「全てある一つの確率分布に従っていなければならない。」
という記述は誤りで、従っていれば中心極限定理は簡単に証明できるし、
同一の分布に従ってる必要はない、と言いたかったのでしょう。
477132人目の素数さん:03/01/18 12:41
統計のグラフの書き方について質問です。
y軸方向にエラーバーつけるときは、普通は標準偏差(SD)をとりますよね。
別に標準誤差(SE)をエラーバーにしても問題ないですか?
ちなみに、医学生物学系の論文です。
478132人目の素数さん:03/01/19 21:01
数理統計学でお勧めの和書ありますか?

そもそも数理統計学とは何なんでしょうか?汗;
東京大学教養学部「統計学入門」は数理統計学の教科書とは言えないのでしょか?
479132人目の素数さん:03/01/19 21:06
ちょっと初歩統計学試験に出るんで教えて欲しいんですが。
傾向分析の方法と公式と相関分析の求め方と、推定の
教えて君が集うスレはここですか?
481132人目の素数さん:03/01/21 08:04
>>478

翻訳でよければP.G.ホーエルの「入門数理統計学」(培風館)が定番。

数理統計とは−−ってよく分からんけど、証明を略さずに定理を公理
から厳密に導いて見せてるっていう叙述のスタイルなんじゃないの?
違ったらスマソ。詳しい人教えて。
すみません、初歩的で申し訳ないのですが、
質問させてください。

統計学で第一種のエラーと、第二種のエラーについて
具体的にはどういう例があるのかがピンときません。
どなたか、具体的に(魚を10匹釣って、とか)解説していただけないでしょうか。

また、有意水準を5%とすると
H0とH1を置いたとき、
H0が真なのに、H1を採択してしまう間違いが第一ですよね。
これはH1は95%の可能性でのみ正しいと言えばいいのですか?

第二種の場合は、H1が真なのに、H0を採択する場合ですよね。
この場合、H0は95%の可能性でのみ正しいと言って問題ないのですか?

すみません。
どなたか解説お願いします(ぺこぺこ)。
第一種の誤り 第二種の誤り 具体例
でgoogle

H0が帰無仮説ならまあそれほど間違いではない。
つーか教科書よみなされ。どれ読めばいいか分からんならとりあえず以下を。

わかりやすい統計学 松原望 丸善
統計学入門 東京大学教養学部統計学教室 東京大学出版会
484なみ:03/01/25 21:19
デルフォイ法について教えてください。デルフォイ法は○○の一種と穴埋めが
あったんですがわかりません。あと、デルフォイ法自体の概要もお願いします。
検索かけてもなくて(涙)
485132人目の素数さん:03/01/25 21:22
サイコロの分布関数はどのように表せばよいのでしょうか?
>>484
デルファイ法では?
487132人目の素数さん:03/01/27 00:50
数学や物理の場合、若いうちに開花していないとその後モノになることは無いと、
よく聞きますが、統計学にもそういうのあるのですか?
>485
ひょっとして、定義域を離散にしようとして困っていない?
出た目が x 以下である確率をF(x)とすれば、実数軸(R)上できれいに定義できる。
そういや確率密度関数の離散版を英語で probability mass function
ということがあるが、確率質量関数って訳語はあんまりみないな。
質点系と連続体の対比になってて分かりやすい言葉だと思うんだけど。
490132人目の素数さん:03/02/08 20:25
スレ違いでないことを祈りますが、
統計学を学ぶのにイイ大学院に心当たりはありませんでしょうか?
私は経済系の学部卒社会人です。
米国にはこういうパスを歩む人も多いみたいで、ちょっと考えてみました。
>>490
統計数理研究所つーか総合研究大学院大学
492132人目の素数さん:03/02/11 06:23
例えば当たり確率0.1(1/10)のAクジと当たり確率0.01(1/100)のBクジがあるとして、
ABどちらかわからないクジを引き続けて、
当たりの出現率から、95%信頼度でA,Bどちらなのか推定するとします。(AなのかBなのか判定したい)
この時に95%推定できる試行回数というのは、どのように求めればよいのでしょうか?

あまりにも基本的な質問でしたらゴメンナサイ。教えてください。
493132人目の素数さん:03/02/11 11:59
A,Bどちらなのかって検定は基本的にできないよ。

とにかくたくさん引いてそこから大当たり確率を推定して
それが0.1と有意に異なっているかどうかっていう検定はできるけど。

でもこれは大当たり確率が0.1かどうかって話で、もし棄却されたとしても
じゃあ0.01かっていうとそんなことはいえない。逆もしかり。
494132人目の素数さん:03/02/12 13:08
両方やればいいんだけどね。
495こう:03/02/12 21:16
技能検定の学科試験問題で悩んでいます。
問 ある製品Aの長さは、平均10.00mm、標準偏差1.00mmの正規分布に従う
ことが分かっている。この製品Aをランダムに16個取り出した場合、
その長さの平均値が10.50mm以上となる確立を求めなさい。

教科書を見ても解き方が書いてないし、工業高校で習ったおぼえも無し。
馬鹿な高卒でも分かる解説をできればお願いします。
>>495

大きな本屋か図書館へ行って、確率統計の入門書を何冊か
手に取ってみて、自分のレヴェルや性にあったものを探し
てみな。なるべく例題や練習問題の多い本を選ぶと良いだ
ろう。みんなそういう事をやって勉強しているんだよ。

495 の様な問題はスタンダードな練習問題だから、どの本
でも触れられているはず。「正規分布」「正規母集団から
の標本」などをキーワードにして探してみな。
497132人目の素数さん:03/02/14 01:37
>>493
基本的に検定をするのに標本数は関係ないよ。
もしその統計量の分布が正確にわかっているなら
例え一個の標本だろうと95%だろうが何%だろうが検定できるから。
標本数の大きさが重要になるのは、検定に漸近分布を使うときだけ。
>>394, >>395 あたりがいい説明をしてるからそれを見てみたら?
実際には493の場合は漸近分布を使う事になるだろうけど、
(493のような検定をするとして)
その場合にも何個以上とかいう明確な基準はないよ。とにかく大きければ
大きいほどいいというくらい。どれくらい大きければ正規分布をよく近似するか
とかはもとの分布に依存するし、そのための客観的な基準とかってないと思う。

498132人目の素数さん:03/02/14 02:36
>>492
素人考えでゴメン
ベイズ統計使うってのはダメ?
>>497

>基本的に検定をするのに標本数は関係ないよ。

関係はあるんじゃないですか?
同じ有意水準でも標本数nが増えると検出力が上がるのが
普通ですよね。検出力が高い方が「良い検定」ですね。

>例え一個の標本だろうと95%だろうが何%だろうが検定
>できるから。

できますね。

>どれくらい大きければ正規分布をよく近似するかとかは
>もとの分布に依存するし、

そうなんだけど、今回の場合はもとの分布は二項分布(と
いうかベルヌイ分布か)ですよね。ベルヌイ試行一回の
成功確率がpの場合、二項分布の正規分布による近似が
実用上十分な精度になる為の必要条件としてふつう言われ
ているのは、np>5かつn(1-p)>5だから、今回の場合は、
nは50か500以上ってことになるかな。また、nが小さい場
合は、(二項分布なんだから)近似しなくても求まる。
よって問題無し。
500聖帝サウザー:03/02/15 01:46
下記の本を読んだ人の感想をお聞かせください。

W・フェラー
確率論とその応用T(上下)U(上下) 紀伊国屋書店

かなり有名な本ですが、どうなんでしょう?


501らんま1/3:03/02/15 02:27
数量化理論について、多重共線性の問題が解決されていない、っていうのはどういう意味なんでしょうか?突然ですが・・・
502数学ダメ人間:03/02/15 04:58
経営学板住人です。経営学板ではこれら↓が簡単だといわれてるのですが、
みなさん的にはどう思われますか?なんでもいいので、この本をご存知の方、
ご存知でない方、感想をきかせてもらえると幸いです。

(1)初歩からの多変量統計    三土 修平 (著)
(2)数学の要らない因子分析入門  三土 修平 (著)
(3)誰も教えてくれなかった因子分析―数式が絶対に出てこない因子分析入門
             松尾 太加志 (著), 中村 知靖 (著)
503132人目の素数さん:03/02/15 22:17
「標本分散が不偏推定量ではない」ことを直感的に説明するには
どうすればいいのかな?まぁ二乗をとってるから偏るのは当たり前なんだけど
504132人目の素数さん:03/02/15 22:31
>>503
標本分散をとる基準である標本平均自体が平均からぶれるからでしょう。
>>503

>まぁ二乗をとってるから偏るのは当たり前なんだけど

二乗をとってるからってのは意味がよく分りませんが。

母平均の代わりに標本平均を使っているからでしょう。
n=2 の時にでも実際に期待値を計算して見せれば良いのでは?
506505:03/02/15 22:43
かぶってしもた。
507132人目の素数さん:03/02/15 23:00
超幾何級数について詳しく書かれた本をご存知の方いらっしゃいませんか?
508503:03/02/15 23:07
でも標本平均は一致推定量だよね?

とんちんかんなこと言ってるかな・・・.
>>508
>でも標本平均は一致推定量だよね?

なにが言いたいのかわからないぞ。
510503:03/02/15 23:55
すみません.もうすこしよく考えて見ますぅ
511132人目の素数さん:03/02/16 22:15
質問です。

条件付確率

P{A2|A1}=P{A1A2}/P{A1}

が成立する理由が解かりません。
これの証明は難しいのですか?

よろしくお願いします。
>>511
それは定義だ。証明することではない。

感覚的な説明が欲しければ、
A1∩A2≠0 となるベン図を描いて見よ。
A1 に対する A1∩A2 の比が、
A1 のなかで A2 の占める割合であることで
納得できないか?
513132人目の素数さん:03/02/21 20:05
記述統計学の詳しい書籍ってありますか?
探せど探せど見つかりません。
推測統計学じゃなくて記述統計学を詳しく学びたいのです。
東大や国会図書館のOPACで探すと書名に記述統計を含む図書が4,5冊ヒットする。
英語なら買えるものも結構ある。
ttp://www.amazon.com/exec/obidos/search-handle-url/index%3Dbooks%26field-keywords%3D%22descriptive%20statistics%22
>>514
ありがとうございました。
早速探してみます。

ただ日本語の物って本当に少ないんですよね。
516いぬ:03/02/22 18:53
コルモゴロフ(根本伸司 訳)
『確率論の基礎概念(第2版)』東京図書1975
を売っている本屋さんをしっている方いらっしゃいませんか?
古本でもいいです・・。
>>516
何でまたコルモゴロフが必要?
数学科の学部3年レベルの確率論の本なら含んでると思うけど。
どうしてもというなら英訳版なら第3版が安く出ているはず。

>>473
中心極限定理は大数の法則をさらに精密化したもの。

>>478
>数理統計学とは何なんでしょうか
統計学の成り立ちがいろいろな学問や現場の計量に起源を持っていて
それを確率論の言葉でもって数学的に整理したのが数理統計になるんじゃないかな。
本は 竹村彰道著 現代数理統計学 創文社 とかがいいと思う。
前にあったホエールの本もいい本らしいけど見たことない。
482
>第一種のエラーと、第二種のエラー
よく挙げられる例で刑事裁判で本当は無罪の人間に有罪を言い渡すの(冤罪)と
有罪の人間に無罪をいいわたしちゃうのとどっちだっけ?

>>490
>統計学を学ぶのにイイ大学院
そういう需要ってあるの? あったら入試対策とかいいバイトになりそうな気がするんだけど。
統計数理研究所は博士だけだから無理。

>>500
>W・フェラー 確率論とその応用T(上下)U(上下) 紀伊国屋書店
いい本だけど統計だけやりたい人がお勉強で読む必要があると思えない。
趣味で読むとか確率論や数理統計のことまで必要なら別だけど。

とりあえずぜんぜん考えなくて済むところだけいくつか答えてみました。
519500:03/02/23 13:56
>>518
ありがとうございました。
520473へ:03/02/23 14:52
>>473
>517に
「中心極限定理は大数の法則をさらに精密化したもの。」
って書いてあるけど、もう少しぶっちゃけていうと・・・。
あくまでも、Sn=X1+X2+X3+X4+X5+X6+・・・
が正規分布に従うってことで、Xnが正規分布に従うことじゃないよ、
具体的には、東大ばかり集めた会社でも、日大だけ集めた会社でも
集団が大きくなると同じような会社になるってこと。


521473へ:03/02/23 14:53
ちなみに大数の法則も弱法則と強法則があるので、どこが違うのか
調べてみると勉強になると思います。
522132人目の素数さん:03/02/23 15:22
>>473

以下、こまかい話は抜きにして。

まず、教科書に載っている大数の法則と中心極限定理のそれぞれの主張の仮定に着目してみると、大数の法則の方はX1,X2,X3,...の平均と分散が全て等しければそれで良くて、中心極限定理の様に分布の形まで同じである必要はない。

次に、それぞれの主張の結論を見比べると、大数の法則からは(X1+…+Xn)/nの確率が平均の近くに集中していく事が分かるが、中心極限定理からはさらに、(X1+…+Xn)/nの極限分布の形まで分かる。

つまり、中心極限定理は、大数の法則の仮定を強くし、その分、結論も強くしたものと見ることができる。(一つの見方として。)
523132人目の素数さん:03/02/23 15:53
>>522
大数の法則では分散は無限でもいいのですか?
統計の文脈で極限定理が説明されるときは収束の速さが無視されがちなのが気がかり。
Chebyshevの不等式しか使えない状況も多いと思うんだが。
525132人目の素数さん:03/02/23 16:35
なかなかややこしそうなんだけど・・・
分布の収束の速さを評価するのは困難だけど、平均の推定をするとき
n回の測定の平均を極限分布に当てはめて議論できるとは限らない、
ということだけでも触れておくのがいいんじゃないかなと、ふと思った。
>>526

収束の速さに言及するかどうかについてもそうだが、
もっと一般に、どの程度のところまで(厳密に詳しく)
説明するのが良いかは、質問者の学習の習熟度(もっ
ている予備知識)によってかわってくる。

従って、一般にはどちらが良いとも言えないのでは
ないかい?
528132人目の素数さん:03/02/24 22:05
SAS使いですがexcelを舐めてました。

Excelで統計解析をする上でのお勧めの本が知りたいのですがありますか?
ちなみに統計学の知識は修士終了レベルです。
洋書、和書どちらでも構いません。
VBAも得意です。

よろしくお願いします。

好みもあるから大きな本屋にいって選ぶのがいいんでは?
統計自体の入門になってるのを除けば迷うほどはないだろう
ttp://www.amazon.co.jp/exec/obidos/search-handle-url/index%3Dbooks-jp%26field-keywords%3DExcel%20%E7%B5%B1%E8%A8%88
530132人目の素数さん:03/02/25 20:41
>>522も聞きましたが、
大数の法則では分散は無限でもいいのですか?

それと大数の強法則と弱法則の違いを数式じゃなく言葉で説明願います。
>>529
レスありがとうございました。
ただ、実際に購入して使ってる人の意見を聞いてみたいと思ったわけで…

いずれにしろバイブル的な本は無さそうですね。
>>530
和をとる個数を増やすにつれ
大数の強法則では平均からのズレが小さくなっていくことが確実
大数の弱法則では平均からのズレが小さくなる確実さが増していく
533132人目の素数さん:03/02/28 19:02
t検定の両側検定と片側検定の使い分けがよく分かりません。簡単に判別する方法ってあるんでしょうか?
私なりに手順を以下のようにまとめてみたのですが。

@「μ=X」という仮説を有意水準a%で検定する場合・・・
 帰無仮説H0:μ=Xを両側検定する。
 検定統計量をTとして、「T<(下側a/2%点)もしくは(上側a/2%点)<T」であれば仮説は棄却される。
 棄却域は両側にある。

A「μ>X」という仮説を有意水準a%で検定する場合・・・
  帰無仮説H0:μ=Xを対立仮説H1:μ<Xに対して片側検定する。
  検定統計量をTとして、「T<(下側a%点)」であれば仮説は棄却される。
  棄却域は左側にある。
 
B「μ<X」という仮説を有意水準a%で検定する場合・・・
  帰無仮説H0:μ=Xを対立仮説H1:μ>Xに対して片側検定する。
  検定統計量をTとして、「(上側a%点)<T」であれば仮説は棄却される。
  棄却域は右側にある。

検定すべき仮説が「・・・は・・・である」であれば両側検定で、有意水準がa%であれば、上側及び下側a/2%点に着目して、
「・・・は・・・より大きい(小さい)」であれば片側検定で、下側(上側)a%点に着目する、という事でいいのでしょうか。
>>533

いいんじゃない?
535132人目の素数さん:03/03/01 03:45
>>532
もうひとつの質問の大数の法則では分散は無限でもいいのですか?
の答えは??

それと
>大数の強法則では平均からのズレが小さくなっていくことが確実
>大数の弱法則では平均からのズレが小さくなる確実さが増していく
弱法則で、確実さが増していくなら、言っている意味は強法則を
同じじゃん!確実さが増していったら確実っていえるんじゃない?
>>535

大数の法則は、分散はnに関して一様に有界な事が重要なんだと思うけど?自分で調べてみなよ。>535

大数の弱法則はいいとして、大数の強法則を数式使わずに正確に言うのは大変だと思う。(>>532の気持ちもわからんでもないけど。そりゃ数式使わずなんだからある程度の不正確は仕方ない。)自分で調べてみなよ。>535

もしかして教えて君?
535じゃないですが、強法則(以下(S))と弱法則(同(W))の違いを考えていたら
分からなくなりました。以下でおかしな点があれば指摘して下さい。

まず、(W)と(S)をそれぞれ次のように記述します。
(W) lim{n→∞} P{|m - Σ{k=1〜n} X[k]/n| > ε} = 0 for ∀ε>0
(S) P{(lim{n→∞} |Σ{k=1〜n} X[k]/n|) = m} = 1

次に余事象の確率と確率の連続性を使って(W)を(W')に、
また等価な極限による置き換えを使って(S)を(S')に書き換えます。
(W') P{(lim{n→∞} |m - Σ{k=1〜n} X[k]/n|) ≦ ε} = 1 for ∀ε>0
(S') P{(lim{n→∞} |m - Σ{k=1〜n} X[k]/n|) = 0} = 1

d(n) = |m - Σ{k=1〜n} X[k]/n|,d(∞) = lim{n→∞} d(n) とおくと、
(W'') P{d(∞) < ε} = 1 for ∀ε>0
(S'') P{d(∞) = 0} = 1

この(W'')と(S'')は同じことではないのですか?
(W'')を以下のように訂正します。

(W'') P{d(∞) ≦ ε} = 1 for ∀ε>0
(S'') P{d(∞) = 0} = 1

この(W'')と(S'')は同じことではないのですか?
539132人目の素数さん:03/03/02 17:44
モーメント母関数についていくら書籍を読んでも理解できません。
サルな私に説明できる方いますか?
>>537

ぱっと見、おれには変なところは無い様に見える。
「確率の連続性を使って」ってところは、「独立な確率変数の和の確率収束とa.e.収束の同値性を使って」とした方が良いかもね。
あとは偉い人よろしく。
>>539
積率母関数 φ(t) = E(exp(tX)) からtに関する微分によってXのすべての積率を作れる:
E(X^1) = φ(0)
E(X^2) = φ'(0)
E(X^3) = φ''(0)
E(X^4) = φ'''(0)
E(X^5) = φ''''(0)
…ということだが。疑問は何か。
542132人目の素数さん:03/03/03 02:43
>>537
i.i.dの時の(独立の時でも良いけど)WLLNとSLLNの成り立つ
必要十分条件をチェックしてみたら如何でせうか?
>>540 が言えるような条件の時はどっちも成り立つということでそう。
概⇒確率
543132人目の素数さん:03/03/03 21:53
ついでに、お勧め。
「初めての確率論 測度から確率へ」佐藤 坦 著(共立出版)

真面目に読むと結構大変れす。
544132人目の素数さん:03/03/05 16:28
なんでだろう〜、なんでだろう〜なんでだなんでだろう〜
高校の数学さっぱりだが、統計学だけはちょっとマシだったの、なんでだろ〜
>>544

さてなんででしょう。

1. 統計の先生が良かった。
2. ギャンブルと関係ありそうなので勉強に気合いが入った。
3. 「統計学だけはちょっとマシだった」という思い込み自体が気のせいだった。
546132人目の素数さん:03/03/08 22:51
>>544
4.他が酷すぎた。
547132人目の素数さん:03/03/09 01:58
質問
大学が合格者の平均点と標準偏差を公表してます。このとき合格者の6割が合格者平均±標準偏差の間に集まるって聞いたんですが、これは的を得ているんですか?
548132人目の素数さん:03/03/09 02:15
>>547

合格者の得点の分布が正規分布ならそうなる。
「シグマ範囲」でググってみ。
それから、「的」は「得」るよりも「射」たほうがいいぞ。
549132人目の素数さん:03/03/09 02:32
ありがとうございます。
ググリたいんですが携帯なんで…。
漢字の指摘までしてもらいありがとうございます。
550132人目の素数さん:03/03/09 09:45
>>547
うそだー。
>>548 の言ってる条件がs成り立つならそうなるけど、そんな奇妙な得点分布に
なると思えない。受験者集合の得点分布が双峰分布にでもなきゃおこらないよ。
そういう奇妙な分布になっている模試の結果を見たことは一応あるけど。
551548:03/03/09 11:59
>>550

>そんな奇妙な得点分布になると思えない。
>受験者集合の得点分布が双峰分布にでも
>なきゃおこらないよ。

そうだね。受験者全体の分布なら正規分布になっても
おかしくないけど、合格者の得点だけ集めて正規分布
になるとは考えにくいね。うっかりしてました。スマソ。
552132人目の素数さん:03/03/09 12:10
一般化双曲線分布とか一般化逆ガウス分布ってのが出てきたんですけど、
これらの分布が詳しくかかれている本を教えてもらえませんか。
553132人目の素数さん:03/03/09 19:07
ってことは、受験のやつで合格者平均周りには山がないor小さいってことですよね?
つまり山がない分バラける=合格者が全体平均で考えた>>548さんのものより広い範囲に分布すると考えてかまわないんですか?
554548:03/03/09 20:34
>>553

どうだろうね。

>>550の人も言っているけど、受験者全体の分布が正規分布なら、
合格者の得点だけ集めた分布は、「ほぼ正規分布の形をしたヒス
トグラムから、合格最低点以下の部分をばっさり切り取ったよう
な形」になるはず。特に、合格最低点が受験者全体の平均より
高いか低いかで、合格者の得点だけ集めた分布の形は決定的に
違ってくる。

「合格者の75%が合格者平均±2標準偏差の間に集まる」くら
いは、分布の形によらずに言えるけど、>>547のようにはなって
いない事もあるかも。
555132人目の素数さん:03/03/11 20:31
質問です。

相関係数分析、回帰分析(含む、重回帰、ロジスティック回帰)をする時に
データ数が多すぎる場合において弊害が生じたりするのでしょうか?
検定時に問題が生じそうな気はするのですが、それ以外にありますか?

それともデータ数は多ければ多いのでしょうか?



556山崎渉:03/03/13 13:05
(^^)
557132人目の素数さん:03/03/15 00:15
データサイエンスのすすめ

統計学のパラダイムは消滅する
自画自賛、おだて
558132人目の素数さん:03/03/15 07:11
>>557
消滅じゃなくて包含では?


といってみる
559132人目の素数さん:03/03/15 14:04
 
560132人目の素数さん:03/03/15 22:29
スモールオーダーh(o)ってどういう意味ですか?
ラージオーダーH(o)ってあるんですか??
561高校2年生:03/03/16 17:05
すいません、高校生なのですが、質問していいですか?
最適化について質問です。
@共役勾配法ってなんですか?
A非凸計画問題ってなんですか?
B2次最適化ってなんですか?

すいませんお願いします。
562132人目の素数さん:03/03/16 17:21
>>560
h(o)ってよく知らないんだけど、二次の項以下をまとめて表す時に使うよね。
563132人目の素数さん:03/03/17 23:39
東京大学出版の統計三冊本。
三巻でいきなりレベルアップしちゃってついていけない。
なんかベクトルなんかでてるし。
2巻と3巻の橋わたしになるような本ってないですか?
564132人目の素数さん:03/03/18 00:05
>>563
線形代数勉強するしかないと思うけど。
565132人目の素数さん:03/03/18 01:38
>>563
橋渡しというよりも、「自然科学の統計学」は難しいのでホーエルの「入門数理統計学」
などを読んだほうがいいと思う。
566563:03/03/18 21:29
ありがとうございます。
やはり3巻は難しいのですか。
1、2巻はそれなりに読めた(完全に理解はできてないが)ので
その勢いで3巻に挑戦したのですが・・・・。
数理統計の本を探して下積みに入るとします。
567ヌーン:03/03/19 08:24
突然ですが、 「Mann-Whitney U 検定」及びノンパラメトリック分析
について知っている人がいたら教えてください。
どういう時に用いる統計手法ですか?
568132人目の素数さん:03/03/19 18:09
>>560
ランダウの記号じゃない?
例えば、
\lim_{x\to 0}\frac{f (x) }{ g (x)}=0ならば,f(x)=o(g(x))

ある正数Mが存在して、0の近傍で| f(x) | ≦M| g(x) |
の時、f(x) = O( g(x) )
ってやつ。
570アホ:03/03/20 01:26
アホな私の初歩的な質問で誠に恐縮ですが、何卒ご教授ください。
日本人男性の平均身長を170p、標準偏差を6pと仮定するとき、
身長176p以上は、およそ6人に1人
身長182p以上は、およそ44人に1人
身長188p以上は、およそ740人に1人
と推定されますが、
身長200p以上は私のパソコンでは、およそ350万人に1人で、
身長206p以上は、およそ10億人に1人となり、このような人は実在可能性が低いことになりますが、
現実にはこれより高い人がいるみたいです。
これは統計的推測と現実が異なるからでしょうか?
それとも、私の持っているパソコン程度では、推測不能ということなのでしょうか?
571132人目の素数さん:03/03/20 02:34
2m10越えてる人は、巨人症の人が結構いるからな。
572ヌーン:03/03/22 08:31
>>569
本はありませんか?

なんか調べてると医学の分野で使っているみたいです。
そっちの分野ぜんぜんわかりません。
誰でもいいので教えて〜
>572
・Nonparametric Statistical Methods, Second Edition.
 Hollander M, Wolfe D. New York NY: John Wiley and Sons, Inc (1999).
・Introduction to the Theory of Nonparametric Statistics.
 Randles RH, Wolfe DA. New York, John Wiley & Sons (1979).
・W. Mendenhall and R.J. Beaver. Introduction to Probability and Statistics
 - 9th edition. Duxbury Press, International Thomson Publishing,
 Pacific Grove, CA (1994).
・Kasuya, E. Mann-Whitney U test when variances are unequal.
 Animal Behaviour,61:1247-1249, (2001).
574132人目の素数さん:03/03/23 15:57
統計に詳しい方が多いので教えてほしいのですが、

大数の法則って分散が無限でも成り立つのでしょうか?
>>574
逆に質問だが分散が無限になる分布の例を挙げてみて
576132人目の素数さん:03/03/23 16:23
>>575
今手元に例がないけど。
どっかの本格的なテキストに書いてあったんだけど。。。、
しらなきゃいいっす、すんません。
a面のさいころをn回ふって出た目から、
π(奇数回目の目)×π(-偶数回目の目)
を計算したとき、
平均はゼロで良いんだよね。

で、n→無限大でも平均はゼロ?
578132人目の素数さん:03/03/23 22:33
>>575
ベキ乗分布とか
579132人目の素数さん:03/03/25 05:27
>>563
岩波の入門の確率統計も案外いいのでお勧め。
580ヌーン:03/03/25 15:04
>>573
ありがとうございます。
早速読んでみます。
581132人目の素数さん:03/03/26 12:40
グラム・チャーリーとかエッジワース展開について詳しく載ってる本をご存知有りませんか?
582ヌーン:03/03/26 17:17
>>581

漸近展開なら「三宅敏恒著」『入門微分積分』(培風館)が
分かり易かった。
583563:03/03/26 21:51
>>579
ありがとうございます。
さっそくアマゾンで買いました。
そうやって即買する香具師の部屋には、たいていのバヤイ、
ほとんど手付かずの本が床が抜けそうになる程大量に山積みに…。
585132人目の素数さん:03/03/27 16:32
>>581
ジョンソン・コッツかケンドール・スチュアートでも読めば?
586581:03/03/30 01:38
>>582、585
ありがとうございます。
明日図書館行って見まする。
ジョンソン&コッツはイマイチ嫌いなんだよなぁ・・・。
587132人目の素数さん:03/03/30 14:16
経済学で質問です。

Y=A・K^a・L^(1-a)
〔Y:国民所得、A:技術進歩、K:資本、L:労働、a:資本分配率、1-a:労働分配率〕

というコブ=ダグラス型生産関数から、aが一定のもとで対数を取り時間で微分すると、

凾x/Y=凾`/A+a・凾j/K^+(1-a)・凾k/L
〔凾x/Y:経済成長率、凾`/A:技術進歩率、凾j/K:資本増加率、凾k/L:労働増加率〕

という公式が得られるのですが、これは対数を取ることによってどういう操作をしているのでしょうか?
どなたか分かりやすく説明していただけませんか、よろしくお願いします。
5887:03/03/30 14:19
7
589132人目の素数さん:03/03/30 14:40
経済学のことは知らないけど、式を理解しやすいように書き換えるための
式変形なんじゃない?

元の式の労働とか技術進歩って算出しづずらそうだし、具体的に
どういう指標なのか分かんないけど、技術進歩率とか
労働増加率といわれたほうが概念が把握しやすいって感じるし。

あくまで素人の意見だけどね。
微分するために対数をとった。それだけじゃねーの?(俺も素人)
591132人目の素数さん:03/03/30 16:42
だから単にd/dt(logA)=(1/A)*(dA/dt)=(dA/dt)/Aってなるから、対数を取った
ものを微分すると変化率が求まるって、それだけのこと。

592587:03/03/30 17:15
>>591
そう、そこなんですよ。
もうちょっと詳しく教えてもらえませんか?

Y(t)、A(t)、K(t)、L(t)を時間tで微分すると成長率=単位時間あたりの変化率が求まるのは分かるのですが、
何で対数を取ったらY、A、K、Lがtに対する変数になるのかなって。

自分でも調べたつもりなんですが、「Y、A、K、Lをそれぞれ時間tに対する変数にするため」「線形にするため」に自然対数を取る。
これぐらいしか分かりませんでした。
593132人目の素数さん:03/03/30 17:27
Y、A、K、Lは、t に対する変数じゃなくて、t に関する関数ね。
対数をとっても取らなくても、やっぱり t の関数だよ?
594587:03/03/30 17:31
Y(t)、A(t)、K(t)、L(t)を時間tで微分すると単位時間あたりの変化分=成長率が求まるのは分かるのですが、
何で対数を取ることでY、A、K、Lをtに対する変数にできるのかなって。
それとも、ただ単に計算

自分でも調べてはみたのですが、「Y、A、K、Lをtに対する変数にするため」「線形にするため」ぐらいしか説明がなくて。
595587:03/03/30 17:35
ごめんなさい、二重になっちゃいました。
もしかしてただ単に計算しやすくするために対数微分法を使った、それだけですか?
もしかして、増加率の意味が分からないってことか?
「単位時間あたりの変化分=成長率」っていう理解が間違ってるような気がする。

成長率は全体を1として、どれくらい伸びたかで、単位は[無次元]。
単位時間の変化分は、単位時間のってだけだから、単位は[量/時間]だよ
598591:03/03/30 18:18
>>597
偉そうだけど、間違い。

>>592
logA(底はeね)を微分すると1/Aになるって高校の時習わなかった?
あと合成関数の微分とか。

統計学とは関係ない話になってるね。
もっともこの程度の微績の計算も知らないような人間はまともに統計学は
勉強できないと思う。
599:03/03/30 18:19
〇微積
600132人目の素数さん:03/03/30 18:26
http://www.pink-angel.jp/betu/linkvp2/linkvp.html
↑ ↑ ↑ ↑ ↑ ↑ ↑ ↑ ↑ ↑ ↑ ↑
★みんなの情報局★みんなのリンク集★ココ最高★
601591:03/03/30 18:34
>>592
しょうがないので詳しく教えてやると・・・
Aをtで微分したって単位時間当りの変化量しか出ないのでlogAをtで微分する。
logAをtで微分したものは、logAをAで微分したものとAをtで微分したものの積。(合成関数の微分)
logAをAで微分すれば1/Aとなるし、Aをtで微分すれば単位時間当りの変化量がでるので
この積は単位時間当りの変化率になる。
602587:03/03/30 18:48
>>601
やっと分かりそうです、一度高校の数学の教科書を見てみます。
経済であまり複雑な計算は使わないんで、ずっと引っかかってたんです。

ほんとお騒がせしました、ありがとうございました。
603591:03/03/30 18:57
経済学部は理系にしたほうがいいかもね・・・
604132人目の素数さん:03/04/06 18:16
Copula(コピュラ)ってなんでしょうか?
606132人目の素数さん:03/04/06 19:45
>>604
ここにそんな高度なこと知っている人いないよ。
607132人目の素数さん:03/04/07 23:14
>>604
まるちぽすとうざい。
608初心者:03/04/10 02:35
質問です。
標本が十分に大きいのに、平均値と50%値が極端に異なる場合は、
その調査方法に何か誤りがあると考えてもよろしいんでしょうか?
>>608
もともとそういう分布だった可能性もある。

たとえば1億個の標本で99,999,999個が0、1個が100,000,000という値を取れば
平均は1で50%値は50,000,000
610初心者の608:03/04/12 04:24
>>609
なるほど。そういう特異値の存在を考えればですか。。

それでは、特異値がないものと仮定して、
標本の大きさと平均値と50%値の3者間に成り立つ関係はありませんか?
611132人目の素数さん:03/04/12 17:01
>>610
正規分布だとか対称な分布だとかわかっていれば平均とメディアンが
離れていると何かおかしいとわかるけど、そうでない分布なら離れてて
当たり前ということになるよ。
所得とか預貯金の金額と人数の分布は一部の金持ちが平均をあげて
大半は貧乏だから 平均 >> メディアン で対数正規分布とか
のほうが当てはまりがいい。
612初心者の608:03/04/13 02:05
>>611
>610が正規分布だと仮定しての話です。
613132人目の素数さん:03/04/15 20:18
excelで
平均 μ 標準偏差 σ に従う乱数を発生する事はできますか?
関数ではなさそうですが・・・・

よろしくお願いします。
614132人目の素数さん:03/04/16 00:08
>>612
それはその調査した対象が理論的に正規分布に従うのが正しいと
わかっているってこと?
そうでなしに正規分布と仮定してもまずいですよね。
分布が正規分布かどうかチェックする方法も複数あったはずだけど。


>>613
一様乱数をたくさん(12個とかで十分)足し合わせると正規乱数。
平均と分散は中心極限定理を見ながら適当にあわせればいい。
615132人目の素数さん:03/04/16 20:20
重回帰分析はモデルに交絡因子を組み込む事はできないのですよね?
616570:03/04/17 00:06
>>571
分布曲線の両端に近づくと、巨人症や小人症のような病的な人が出現するので、
統計的推測とは合わない、ということですね。
ありがとうございました。
617570:03/04/17 01:59
エクセルでNORMSDIST(0)をつくると、0.499999999781721……と出てきます。
本来は0.5と出るべきなんでしょうが、これはパソコンの性能の問題でしょうか?
計算機の内部では、浮動小数点数は有効桁数以下の
情報は抜け落ちてるからね。
Σ[i = 1 to 10] 0.1 = 1 にならないのといっしょじゃない?
619山崎渉:03/04/17 08:47
(^^)
620132人目の素数さん:03/04/17 11:20
ぼむん
621students:03/04/19 13:51
>74 :132人目の素数さん :03/03/23 15:57
> 統計に詳しい方が多いので教えてほしいのですが、
コーシー分布。
622students:03/04/19 13:54
> 計算機の内部では、浮動小数点数は有効桁数以下の
> 情報は抜け落ちてるからね。
> Σ[i = 1 to 10] 0.1 = 1 にならないのといっしょじゃない?
ちがう。計算誤差、丸め誤差、別の概念だ。
623students:03/04/19 13:57
>613 名前:132人目の素数さん :03/04/15 20:18
> excelで
> 平均 μ 標準偏差 σ に従う乱数を発生する事はできますか?
> 関数ではなさそうですが・・・・
どの程度の精度で欲しいかによるが、統計数理研究所の物理乱数のこぴぺ
が良いと思う。 
624students:03/04/19 14:00
>615 名前:132人目の素数さん :03/04/16 20:20
> 重回帰分析はモデルに交絡因子を組み込む事はできないのですよね?
できる。
625students:03/04/19 14:03
>570 :アホ :03/03/20 01:26
> アホな私の初歩的な質問で誠に恐縮ですが、何卒ご教授ください。
> 日本人男性の平均身長を170p、標準偏差を6pと仮定するとき、
Sugiyama Kouichi の研究がある。
626132人目の素数さん:03/04/19 19:17
重回帰分析は交互作用はモデルに組み込めません。あしからず
627ロバスト:03/04/19 20:10
ロバストってなんですか?
628ロバスト:03/04/19 20:12
>>613
正規乱数でもいいの?
>>627
きみの名前。
630ロバスト:03/04/19 20:22
>>629
知らないなら、余計なコメント書くな、死ね。
631132人目の素数さん:03/04/19 20:26
 _, -=''"" ̄ ̄""=-―,.、
  _,=、            ̄=.、    うっせ、しぬぇぇぇ!
   彡             "" - ,
    >                ヽ
   :"  .__=__  ̄=.、   \
  /  彡⌒  | |    ̄=--,、    ヽ       .'  , .. ∧_∧
  /彡" /~ニ | j|∧_∧   "ヽ     ヽ    .∴ '     (>>630 )
 /   ( /_/  |( ´Д`)     \   ミ     ・,‘ r⌒>  _/ /
     ヽ ミ  .|ヽ,-  ⌒ヽ. ,_   ミ   ,i      ’| y'⌒   ⌒i
       ̄| ミ   ノ|ヽ Y|三)  ヽ  .|       |  /  ノ |
       |  |   / \_ノ    |ミ  ij       , ー'  /´ヾ_ノ
       ヽ ヽ  |         |  |i       / ,  ノ
        "ー、  |        |   ノ     / / /
           ヽ ヽ      ノ / /     / / ,'
            ヽ ヽ    // /   /   /|  |
            /   )    / /    !、_/ /   〉
           / /    /           |__/
          |  |
          \_|
633統計初心者:03/04/19 21:19
統計の問題でわからない問題がありましたので
皆さんから知恵をお借りしたいです。
問題を書き込みしたかったのですが、わかりにくそうに
なってしまったのでうpしますた。よろしくお願いします。
http://bunri.zive.net/~alex_/upload/img/109.zip
634132人目の素数さん:03/04/19 21:21
>>633
zipファイルってコワイですよ
635students:03/04/19 22:09

>626 :132人目の素数さん :03/04/19 19:17
> 重回帰分析は交互作用はモデルに組み込めません。あしからず
どうぞ。線形模型の式をながめてごらん。
636students:03/04/19 22:12
> ロバストってなんですか
推定量にかんしては、Shibuya & Takeuchi をみられたい。
637132人目の素数さん:03/04/19 22:30
統計とちょっと違うかも知れないけど、
確率微分方程式のいい本ありますか?
エクセンダールは省略が多いので不満です。
数学的には幾ら難しくても結構です。
638132人目の素数さん:03/04/19 22:46
>>637
カラザス&シュレーブ
639637:03/04/19 23:10
早速のレス、ありがとうございます。
カラザス&シュレーブって、確か訳書が出てたと思うけど、訳書の方でいいですか?
640統計初心者633:03/04/19 23:41
>>634 ごめんなさい。docをうpできるところが見つからなくて・・・
http://www.kari.to/upload/source/d/1504.xxx
にうpしました。ただ拡張子がxxxになっているため
開けないので、ファイル名を入力して保存する際に
docと入力してください。お手数をかけますがお願いいたします。
641132人目の素数さん:03/04/19 23:44
>>635
それは交互作用をモデルに組み込める事を示唆しているのですか?
2変数の積を独立変数としてモデルに組み込む事を言っているのでしょうか?
642132人目の素数さん:03/04/20 00:11
林知己夫ですが何か?
>>622 計算誤差という言葉は専門用語としては使わないので別とは言い切れない。
>>617 アルゴリズムが分からないのでなんともいえない。
>>618 それは丸め誤差。
644132人目の素数さん:03/04/20 01:59
統計学で出た数値ってどの程度まで誤差があると推測できますか?
>>617
パソコンの性能というよりアルゴリズムの性能の問題
646132人目の素数さん:03/04/20 02:32
t検定か中央値検定かで迷っています。
データ数が少ないときにはノンパラメトリックが有効と聞きますが、
使い分けの境界線は、一般的にはどのくらいが目安なんでしょうか?
647山崎渉:03/04/20 03:57
   ∧_∧
  (  ^^ )< ぬるぽ(^^)
648132人目の素数さん:03/04/20 12:10
えっと・・・算術平均と幾何平均と調和平均なんですが、必ず算術平均>=幾何平均>=調和平均が成り立ってますよね・・・?
この3つの差は、どんな時に大きくなるのですか?
やっぱり近い値ばっかだと3つの平均値の差も小さくて個々の差が大きい場合は3つの平均値の差も大きくなるんですか?
64921:03/04/20 12:15
調和平均って何ですか?
650132人目の素数さん:03/04/20 12:16
大人の出逢いから ピュアな出逢いまで・・・。
素敵な お相手が貴方を待っています!
もちろん 女性は完全無料です!
http://www.sweet.st
651132人目の素数さん:03/04/20 12:36
>>649
数学辞典によると
1/〔Σ(1/xi)/N〕
と出ている。
653student:03/04/20 20:48
654648:03/04/20 21:55
>>652
648です。ごめん、読んでも分かんない・・・
俺が知りたいのは、どういう時にこの3つの差が大きくなるのかなんだけど・・・
聞いてばっかでスマソ
655132人目の素数さん:03/04/20 22:03
>>639
訳書で別に悪い評判は聞きませんが。
ちょっと用語を訳しすぎの感じはないわけではないですが、まあそれもいいのではないかと。

ちなみにエクセンダールは訳書のほうがいいという評判。
656student:03/04/20 22:17
> 654
"どういう時にこの3つの差が大きくなるのか"
等号成立は、全ての数が等しい時。 (全ての数が正として)
3つの数x,y,zの場合で考えてみてね。(自分の力で)
>>653
658132人目の素数さん:03/04/24 08:22
すいません、標準偏差とかいうのは統計学の範疇なんですか?
医療系専門学校で実験とかしたあとにデータをまとめなければ
ならないのですが、標準偏差とかバラツキとかをレポートにして
います。これが専門では全くないので詳しい知識は必要ないの
ですが(それこそ式に代入して値さえ出せば合格)、ある程度の
内容を知りたいと思っています。
漫画で分かる統計学的な簡単な本とかはあるでしょうか?
確率変数Xの標準偏差σは

 σ = √(<X^2>-<X>^2)

ここで、Xの期待値を<X>と表わす。Xをとる確率をp(X)と置けば

 <X> = 嚢p(X)

和はXについてとる。
661132人目の素数さん:03/04/26 16:05
わからない問題でお聞きしたらこっちだっていわれたのでこちらでお聞きします。

95%の信頼区間という意味がよく解らないです。
サンプルの平均値の分布において、| |≦1・96となる部分に母平均が
入っているとするものをたくさん作るとその95%の分布の中に母平均が
含まれている。
というのがよく解りません。
出来上がったたくさんの分布の95%というのと、あるサンプルから出来た
分布の95%内というのとの、二つの95%の関係がよく解らないのでつ。
どなたかよろしくおながいします。
662132人目の素数さん:03/04/26 17:11
>>661
何を見て、どういう文章なのか一字一句正確に書いてください。
663132人目の素数さん:03/04/26 19:25
>661
あなたが何を言いたいんだか良く分からないんだけど、
ある母平均を仮定したときに標本平均がそれと近いほどその母平均の
仮定は正しく、遠ければ仮定は間違ってるっていえるよね。そしてある母平均を
仮定したとき標本平均の分布は正規分布なりt分布に従うんだけれど、その
標本平均が中心(母平均)より95%の範囲の外にあった場合その母平均の仮定で
標本平均がそんなに遠くにあるのは5%以下ってことになるよね。だからその仮定は
間違ってると言える(棄却される)。
これが検定。
逆にある標本平均を得た時、母平均はその標本平均が自らの95%の範囲内に
あるような所にあると考えられる。そこで母平均の範囲を推定できる。
これが推定。

図をかいてよく考えてみること。
664132人目の素数さん:03/04/26 20:38
マジレス。>>661
これはけっこう難しいので、いいかげんな記述ではわからなくて当然かもしれません。

>>663のとおり、
>逆にある標本平均を得た時、母平均はその標本平均が自らの95%の範囲内に
>あるような所にあると考えられる。そこで母平均の範囲を推定できる。
ということなのですが、「母平均」を推定しているのではなく、「母平均を含む区間」
を推定しているということを正確に説明しようとすると、どうしても「たくさんの推定
区間を作ったとき…」という分かりにくい記述になってしまうのです。

長くなりますが次項で丁寧に説明してみます。
665664:03/04/26 20:39
(続き)
推測統計学の考え方には、ちょっとトリックがあります:

(1)「標本平均」は、実際にはただの数値なのに、それを確率変数と考える。
(実際に調査をして得られた数値は、その確率変数の実現値のひとつと思うことにする)

(2)「母平均」は未知なだけで、確定した数値と考える。
(確率論では、確定しているはずの数値も、情報不足で未知なうちは確率的に考える、
ということをよくやります。たとえば「終了した試合のニュースがまだ入ってきていな
いときに、あるチームが勝っている確率」など。この場合、確定しているはずだが未知
な数値を、確率変数と考えていることになります。しかし、(2)に書いたように、「母平
均」は、そのようには扱わないようです。)

このことが実際にどう働くか、具体例で説明します:
 母平均をμ、標本平均をXとするとき、Xがたとえば正規分布に従うことを用いて、
P( -c≦X-μ≦c )≧0.95 となるcが定まりますが、ここで-c≦X-μ≦c のXに実際の
データを代入してμについて解くと、a≦μ≦b となり、これがμの「95%信頼区間」
です。
しかしここで、P(a≦μ≦b)≧0.95 と書くことは許されません。μは未知だけれども
確定値であり、確率変数ではないからです。じゃあ、「μは95%の確率で区間[a,b]に
含まれる」と言ってはいけないのか? いけないならどう言えばいい?

区間[a,b]は何だったか。確率変数Xに実現値を代入して得たものです。つまり、a,bの
ほうがもともと確率変数で、そのひとつの実現値として得られた数値なわけです。
再度標本を取り直して計算すれば、Xの実現値も変わり、a,bもそれに応じて変わります。
しかしμは不変です。
結局、(1)(2)に基づいた正確な解釈は、「標本調査を何度も繰り返したとき、その都度
区間[a,b]が定まるが、そのうち95%はμを含んでいる」となります。
666665:03/04/26 20:41
(駄目押しで665の続き)
つまり、「μは95%の確率で区間[a,b]に含まれる」でなく、「区間[a,b]は95%の確率で
μを含む」という感じです。いや、主語をどっちにするかが問題じゃなくて、確率的に
定まるのはどっちかという意識の問題。
[a,b]が確率変数のままなら「95%の確率でμを含むように実現されるだろう」という確率
論では普通の言い方になるのに、すでに実現値のひとつにしてしまっているため、確定し
てしまった区間[a,b]が、確定しているはずのμを「(95%の)確率で」含むということの
意味がわかりにくくなり、ともすれば確率論でよくあるパターンの、「未知のμがそうい
う確率で実現される」と間違えがちです。

高校の教科書でも、ここのところで嘘を書かないように苦労して説明しているようです。
(が、高校生に真意が伝わるかどうかは疑問?)
667132人目の素数さん:03/04/27 02:21
>>666
詳しいご説明をありがとうございます。実は、カキコの後に、本屋でホールの数理統計学と初等統計学を立ち読みして
理解してきてたのですが、さらに、
>a,b]が確率変数のままなら「95%の確率でμを含むように実現されるだろう」という確率
の説明で、さらに自分の理解がクリアになった気がしました。
このあたりはなかなか答えてもらえないんじゃないかと思ってたのですが、すばらしいレスで、ほんとありがとうございます。
668132人目の素数さん:03/04/27 02:27
>>663
質問がわかりづらかったと思うのですが、レスしていただいてありがとうございます。
今度は上手く質問できるようにします。
669多重比較って?:03/04/27 16:51
すいません、統計をよくわかっていないのですが、3群比較をしたいので、
Bonferroniの比較法について教えて下さい。3群の有意差検定をする場合、
組み合わせは3C2=3通りだから5%有意水準を組み合わせの和で割ると、0.01666
AとB群の間のp値が0.04だった場合、2群なら5%で有意差あるのに、A,B,C3群
の多重比較だからこれはダメ=有意差なしっつうことになるのでしょうか?
3群は互いに独立で対応もしてないのですが...
670多重比較って?:03/04/28 14:07
>>669
自己レスです。具体的に再度質問いたします。
A, B, Cの3つ別々の細胞群にに細胞死を起こす薬を使用するという実験系を考えます。
A群、 B群、C群には薬を各10mg, 20mg, 30mg使用したとします。
生存曲線はKaplan-Meier法で計算し、long-rank testで比較検定しますが、
StatView等で3群検定で得られた値が、p=0.04だった場合 5%の危険率で有意差がある
とは言えても、これがA群とB群なのか、B群とC群なのかということは判りませんよねえ?

ですから、A群とB群、A群とC群、B群とC群という3つの組み合わせで別々にlong-rank
検定して、そのp値がどうかをみてやることにしました(これって間違ってますか?)

その結果A群とC群でp=0.04だった場合、5%の危険率で有意差ありとして良いのか、
これは多重比較だから、Bonferroniの比較法によれば、5%=0.05を組み合わせの3で
割った 0.01666を真の危険率として厳しく評価し、有意差なしと判定するのか、いったい
どっちが正しいのでしょか? よろしくお願いいたします。 m(_ _)m
671RでDunnettできる?:03/04/30 00:40
multcompというパッケージがあるにはあるが、
個々で使える?多重比較法の一つDunnett検定は
群数がそろってなくても使えるのかいまいちわからん

誰か知っていたら、おしえ、、、って、いってみたりする
672RでDunnettできる?:03/05/05 12:16
できると思う、、、、、ことがわかった、、かも、、

それにしてもDunnett検定ができるのって結構少ないね。
(Freeでは)
673132人目の素数さん:03/05/05 22:42
ところで

Rでロジスティック回帰は可能ですか?
674132人目の素数さん:03/05/08 02:12
多変量解析でお勧めの本は何?
675132人目の素数さん:03/05/08 09:27
テストの成績表で、10000人換算で自分の順位が乗っていますが、
あれは実際どうやって求めているのでしょうか??
知っている方、教えて下さいまし!!
>>675はその前になぜ、単発スレの削除依頼を出さないのでしょうか??
知っている方、教えて下さいまし!!

10000人換算
http://science.2ch.net/test/read.cgi/math/1052328095/
677132人目の素数さん:03/05/08 17:49
>>674
奥野他「多変量解析法」がレベルが高くまたわかりやすい(計算過程をはしょっていないので)。
柳井他「多変量解析法」はレベルの割にわかりにくいが、図形的説明の所はよい。
>>675
それって「実際の順位×(10000÷実際の人数)」とは違うのか?
679132人目の素数さん:03/05/08 20:37
判別分析専門の本ある?
これだけみつからないんだよね。
680初心者:03/05/08 22:32
すみません、超初歩的で申し訳ないのですが、質問させてください。

偽札と真札の下部マージン幅や長さのデータから、
平均や標準偏差、分散、最大、最小などを利用して、
偽札と真札の見分け方法見つけるためには、
どのようにすればよいのでしょうか。
必死に考えてみたのですが、出てくる答えはどれもぴんとこないものばかりで…。

参考にするといい本などでもいいので、
何か教えていただけたらと思います。
>>680
一般的な方法はないと思われ。
高精度で印刷される円紙幣はズレてれば偽と判定して良いものもあれば
米ドル紙幣のように真券もズレまくりで判定できない紙幣もある。
682132人目の素数さん:03/05/09 08:15
>>680
階層構造使えばいいんじゃないの?
683bloom:03/05/09 08:23
684ゆうじ:03/05/09 08:53
私は、大阪に住む25歳の男です。
私は有事法制に反対です。
その意思を表明するために
5月7日から、無期限のハンガーストライキを
自宅にて開始しました。

有事法制(戦争法)を認めてしまうと、
日本は「戦争国家」になってしまいます。
平和のために、有事法制はやめさせなければいけません。

有事法制反対の運動を、多くの人たちと共に
盛り上げていきたいと考えています。
685132人目の素数さん:03/05/09 22:56
度数分布で一番多いところが2つ以上あるときのモードはどうなるのですか?
例えば、1,3,3,3,4,5,5,5,6,6,6,7,7,8などはどうなんでしょうか。
686_:03/05/09 22:57
687_:03/05/10 00:25
688_:03/05/10 01:53
689_:03/05/10 03:21
690_:03/05/10 04:48
691_:03/05/10 06:15
692_:03/05/10 07:42
693_:03/05/10 09:10
694教えてちゃん:03/05/10 09:31
勝手サイトでいいのですが、
初心者向けに統計を解説しているお勧めサイトを
教えていただきたいのですが?

わたしは文系卒の事務をしているのですが、
6シグマがどうのとかを勉強させられる羽目に
なったものです。。。
難しい用語等はぜんぜんしりません。。( ゚д゚)ポカーン
695132人目の素数さん:03/05/10 10:36
ってか、いまさらそのレベルから勉強しても無駄だよ。

統計ソフトで機械的に結果を出して分析してると思い込んでる香具師がいると
笑えるし迷惑なんだよね。
696_:03/05/10 10:37
697教えてちゃん:03/05/10 11:00
意見を聞きたいわけではなく、
サイトを教えていただきたいだけなのです。
知らない人は返事しなくて結構なんですけど。。
698教えてちゃん:03/05/10 11:29
>>695
まったく。。。
あなたのような馬鹿には聞いてませんよ。
分からないのなら黙っててください。
恥を晒すだけですからね。
馬鹿は下手にでないと誰も教えてくれないぞ。
700132人目の素数さん:03/05/10 12:37
特に理系の奴らは、独自の世界を持っているからな。

彼らが部屋で引きこもって勉強している間に
遊びまくって、ろくに勉強もしなかった
奴らにたいしては、自業自得だよって思ってるよ。

いまごろ昔のこと言ってもしょうがないのにね。

検索しても、確かに初心者向けって言うのは
見当たらなかったな〜。

おれが教えようか?
教えてちゃんガンがれ。
「仕事で使えと『言われた』ところだけ」じゃなくて、
大事な1点、
統計の対象の全体(たとえば「日本人成人男子」)と
サンプルに選んだ数(たとえば「1000人にアンケート」)から、

71.35%の人が、と言うべきか
70%の人が、と言うべきか
ほぼ7割が、と言うべきか
2/3を若干超える程度が、と言うべきか

は、決まります。が、わかってないで、数字だけ出してしまう人が多いです。

この点だけは押さえておいて下さい。

他の人が(意図しなくてでも)でっち上げた数字を鵜呑みにすることがなくなり、
結果として仕事に活きてくると思います。

あと、たとえの「1000人にアンケート」でも、
本当に無作為に1000人なのか、
「たまたま調べた時間に電話に出られるような職種・生活をしている」1000人なのか
で、かなり結果は異なりますので、

その辺を押さえておくことが、
「本当に役立つデータを得る」そして「会社も発展する」か、
「仕事をした気になる」「自分にまわったノルマだけはこなす」そして「潰れそうだから適当に辞めよう」
になるかの分かれ目になりますので、
自分の勤め先が、この先どういう商売をしていくのかの判断材料にもなると思います。

がんがれ。
特に理系の奴らは、女に困ってる香具師が多いからな。
ネット上で女を装えば優しく教えてくれるのもいるよ。

頭悪そうだけどガンガレ。
703132人目の素数さん:03/05/10 13:30
よくこんな頭悪そうなの相手にするな。
その上、701のような低レベルな話をしてるわけか?
704たれか教えてくれる人いますか?:03/05/10 16:18
ブリッジで南北に位置する二人の手にどちらもちょうど
2枚ずつのエースが来る確率はいくら?
知っている方がいればお教えください。
705132人目の素数さん:03/05/10 18:01
>>704
意味を教えてくれれば計算できる人はたくさんいると思うのですが、
706教えてちゃん:03/05/10 20:39
>>700
ホントに教えてくれるの?(・∀・)イイ!!
キモイ
708132人目の素数さん:03/05/11 01:43
>>706
何が知りたいのですか?
709132人目の素数さん:03/05/14 02:06
英語の文献を読んでいたら「the within-subject factor of the two repeated measures」という文がでてきたのですが、どのような統計処理なのか分かりませんでした。
被験者内要因のニ要因分散分析かな?と思ったのですが、それだと「within-」も「repeated」も被験者内という意味になってしまいませんか?
それにニ要因分散分析の場合は「two-way repeated measures」になるのに「way」がないですし…。
ネットや統計の本を見ても結局理解できませんでした。
申し訳ないですが、この文がどのような処理を指すのか教えていただけないでしょうか。
>704
6*(13/52)*(12/51)*(13/50)*(12/49)
ってか、統計と関係ないsage。
711132人目の素数さん:03/05/14 11:34
>>709
実験系がわからないので何とも言えませんが
two-way repeated measures でいいんじゃないでしょうか。
反復測定で得られたデータなんですよね?
712132人目の素数さん:03/05/14 15:03
明後日の課題なんです。みなさんにとって相手にしたくないレベルだってのは 分かってるんですが、優しい方よろしくお願いします。 共分散を σxy=ΣΣfij xj yi/f..-μxμy で計算してよいことを示せ
>>712
図書館にいって確率論の教科書を探しなされ。
714712:03/05/14 15:13
>>713 わかりましたー。うざくてすみません。ショボイ本屋に売ってる参考書とかには載ってるでしょうか?
σxy = E[(X-μx)(Y-μy)] = E(XY-μyX-μxY+μxμy) = E(XY)-μyE(X)-μxE(y)+μxμy = E(XY)-μyμx-μxμy+μxμy = E(XY)-μxμy.
716712:03/05/14 16:13
717712:03/05/14 17:40
>>715 ありがとうございます!
無理を承知で言えば軽い解説ほしいですが
もちろん忙しかったら無視してください。
718709:03/05/14 23:51
>711
>反復測定で得られたデータなんですよね?

お返事ありがとうございます!
そうです。反復測定されたデータ(=被験者内要因ですよね?)です。
719132人目の素数さん:03/05/16 02:23
遅レスですが...
>>672
CRAN にある multcomp パッケージで Dunnett test ができるそうです.

>>673
ロジスティック回帰分析はこんな感じかな?
result<-glm(y ~ x1 + x2 + x3, family=binomial(logit))
summary(result)
720動画直リン:03/05/16 02:23
721711:03/05/16 11:31
>>718
医学系の文献であれば私の方でもみることができるかもしれません。
もしよかったら雑誌名や巻数、著者名などの情報を教えてください。
722718:03/05/16 20:18
>721
ありがとうございます。
Kurosawa, K. 1996 System variables in eyewitness identification: Control experiments and photospread evaluation. Japanese Psychological Research,38,25-38.
29ページ右側の真ん中よりやや下にでてきます。
心理学系の文献です。もしご覧になれそうでしたら、よろしくお願いします。
723132人目の素数さん:03/05/17 11:08
確率・統計の問題です〜誰かおせぇてくださいm(__)m

”ある製造業者は1枚の金属板に4箇所の欠点があると予想している。
この業者は一枚につき6箇所以上欠点があると返品できるようにしている。
何%の板が返品されると予想すべきか?”

です。ボアソン分布を用いるらしいのですがなにがなんやら...
724132人目の素数さん:03/05/18 00:48
問題がおかしいだろ
725723:03/05/18 01:04
>>724
そうなんですか?
月曜までにやっていかなくちゃ
いけないんです(TдT)
ボアソン分布表などをみながら解くらしいのですがぁ... 
726132人目の素数さん:03/05/18 01:23
統計学を独学で勉強するのにいい教科書を教えてください
今のところ東大出版のやつ買おうと思ってんだけど
727132人目の素数さん:03/05/18 03:48
東大出版のやつも良いが全くの初心者には
宮川公男「基本統計学」を薦める。
>>723
ポアソン分布: P[λ](r) = e^(-λ) λ^r / r!
ポアソン分布の解釈(のひとつ): 一区画あたり平均λ個の粒子を落とすとき、
特定の一区画の上に実際にr個落ちる確率

(↑このくらい教科書に載ってるはずだぞ!ちゃんと勉強しろ!)


「一区画」を「一枚の金属板」、「粒子数」を「欠点」と読み変えれば、
723の問題の確率は Σ(r=6〜∞)P[4](r) であることがわかる。

計算は余事象を使って 1 - Σ(r=1〜5)P[4](r) としたほうが楽。
ポアソン分布表を使えば、P[4](1), P[4](2), P[4](3), P[4](4), P[4](5)
の値がわかる。

以上。
729728:03/05/18 04:27
r=0が抜けてる。スマソ。
730132人目の素数さん:03/05/18 07:47
>>728
するってーと、この問題は おかしくないってこと?

ついでに、そのあとどのような、展開になって
解はいくつになるかの教えていただけませんか?
731132人目の素数さん:03/05/18 08:32
>>726
東大出版のは、本文の記述はいいが、演習問題が少ないと思う。
演習問題は、他の本で補わないとな。
732132人目の素数さん:03/05/18 08:53
>>731
AMAZONでレビューを見たら

またこの本の良い点は、問題演習が非常に充実している

ってなっていますね。

http://www.amazon.co.jp/exec/obidos/ASIN/4641160562/qid%3D1049095835/br%3D1-6/ref%3Dbr%5Flf%5Fb%5F5/250-7732586-2491403
733132人目の素数さん:03/05/18 09:38
>>732
良く731を読め。彼は東大出版の本の事を言っている。
宮川さんの本のリンクを貼ってどうするんだ。
734132人目の素数さん:03/05/18 10:16
フィッシャーのz変換の意味がよく解らないのですが、
なぜz変換すると正規分布に従うのかもわからないし、
その平均と分散の意味もよく解らないです。
お願いします。

解説されてるHPとかあったら、それをおしえていただいても結構です。
お願いします。
735728:03/05/18 12:20
>>730
やり方を全部教えてやっているのに、「答」が要るってか?

>>728,>>729を読んで、解答が作れないようなら、あきらめろ。
「丸写しするための全文」など提供する気はない。
736132人目の素数さん:03/05/18 12:24
728は女なんだろう
甘 え る な
737723:03/05/18 16:50
728さんありがとうm(__)m
ちなみに730は俺じゃないですからね〜。
738132人目の素数さん:03/05/18 17:58
>>735
(゚Д゚)ハァ?

他にわかる方いませんか〜!
739132人目の素数さん:03/05/18 18:11
>>738
頭がわるくて甘ったれと思ってたら、性格も悪いな
俺は728ではないよ
740132人目の素数さん:03/05/18 18:17
730=738は数学能力ゼロのバカ女
甘えるな
738 は確かに煽ってるね。
でも730 は単に 丁寧に質問しているだけでは?
ということで730と738は別人ではないだろうか?
この解が正解である確立はおまえらの得意な統計学では何%になる?

それに勝手に根拠もなく女性と決めつけて侮辱していますけど、
そういう言動は同じ統計学に興味を持つものとして恥ずかしく思います。

やはりこの統計学に興味をもつ人は女性も相手にされず、
引きこもっているから女性に対する偏見も多いのでしょうね。
童貞なんでしょうか?

週末のお昼時ぐらい、コンピュータのそばから離れて
外にでてはいかがでしょうか?
といっても、秋葉原とか書店の専門書コーナーに
はびこっていては意味がありませんが。。。

どうでもいいけどヒステリックやなぁ。病的だね。
743132人目の素数さん:03/05/18 21:32
何人ぐらいの人がこのスレッドに書き込んでいるんだろうね。
3人ぐらいかな
745711:03/05/19 17:15
>>722
遅くなってすみません。
心理学系はちょっと見ることができそうもありませんでした。
どこかのサイトで掲載されているようだったら教えてください。
もしくはMethodsをメールしてください(添付ではなく、テキストで)。
746132人目の素数さん:03/05/19 20:29
>>741
お前も俺のこと女にもてない童貞って決め付けんなよ
747132人目の素数さん:03/05/19 22:50
次のうちどれが統計学的に確率が高い?

1) 730と738は別人。
2) 730と738の少なくてもどちらかは女性である。
3) 統計学に興味をもつ人は女性に相手にされない。
4) 統計学に興味をもつ人は引きこもっているから女性に対する偏見を持っている。
5) 統計学に興味をもつ人は童貞である。
6) 統計学に興味をもつ人は週末に秋葉原とか書店の専門書コーナーにはびこっている。
7) 746は女にもてない童貞。
748132人目の素数さん:03/05/20 20:46
主成分分析は分散が最も大きくなるように第一軸をとりますが
なぜこれが総合変量(総合得点)と解釈する事ができるのでしょうか?

ある種の「決め」の基準が必要なだけなのでしょうか?
749132人目の素数さん:03/05/20 23:49
だれか
多次元正規分布について教えてくれよ
だれか
>>723の問題について答えを教えてくれよ
751132人目の素数さん:03/05/21 00:29
>>750
役21.5%と
出ました
752132人目の素数さん:03/05/21 00:30

役じゃなくて約
753750:03/05/21 00:52
>>751
ありがとう。感謝感激。
もしよろしければ、途中計算式も教えてもらえませんか?
754132人目の素数さん:03/05/21 02:56
>>753
教科書の巻末にポアソン分布の表が載ってるだろうからそれを調べれば
甘えるな
755名無しさん@Emacs:03/05/21 12:28
おしえてで申し訳ないですが
数理統計の英語テキストでお薦めありませんか
日本語で言えば竹村(創文社)、稲垣(出版者ど忘れ)レベルを想定しています
書店で見たところMendenhallがよさげだとは思うのですが、
識者の声を聴かせて下さい
>>748
ん?第一主成分の主成分得点のことを「総合得点」
というのですか?
757山崎渉:03/05/21 21:51
━―━―━―━―━―━―━―━―━[JR山崎駅(^^)]━―━―━―━―━―━―━―━―━―
758132人目の素数さん:03/05/21 22:20
確率変数Xの期待値をE(X)で表すと
E(c)=c (cは定数)
という式はXが連続型の確率分布を持つときにも成り立つのでしょうか?
もし成り立つのであればXの確率密度関数f(x)は
δ関数になるのであっているでしょうか?
>>758
δ関数の定義によるがまあ正しい。

その分布の確率分布関数のグラフは ___ ̄ ̄ ̄ こんな感じになるのだけど、

この微分を表すためのものがδ関数。
つまりδ関数に代表される超関数は微分の拡張概念と思っておけば良い。
760758:03/05/22 20:21
>>759
レスありがとうございました。

あと
E(X+Y)=E(X)+E(Y)
を厳密に証明したいのですがX+Yの確率密度関数と
X,Yの確率密度関数との間の関係式が分かりません。
どなたか教えていただけないでしょうか。
>>760
E(g(X,Y))
= ∬g(x,y)f(x,y)dxdy
= ∬xf(x,y)dydx + ∬yf(x,y)dxdy
= ∫xf[X](y)dx + ∫yf[Y](y)dy
= E(X) + E(Y)
連続性や偏微分可能性を仮定した。初等的な確率論の教科書にある。
より一般的にやるなら測度論方面。
762760じゃないけど:03/05/22 22:36
だから単なる積分の加法性からの証明でなく、その測度論からの証明
を知りたい
763132人目の素数さん:03/05/22 23:26
>>761はg(x,y)とx+yがごっちゃになってるYO!

>>762
測度論って言っても、離散的な場合や特異な場合(絶対連続でなく密度関数が
定義できない場合)も、測度を変えたルベーグ式積分で表現できる、という
だけのことだから、一般測度によるルベーグ式積分の加法性(というより、
周辺分布の定義とフビニの定理かな)に帰着されるわけで。
>>761のように書くなら、
E(X+Y)
= ∬(x+y)μ(dxdy)
= ∬xμ(dydx) + ∬yμ(dxdy)
= ∫xμ_X(dx) + ∫yμ_Y(dy) ただしμ_X, μ_Y はそれぞれの周辺分布
= E(X) + E(Y)
という感じか。
764760:03/05/23 00:06
>>761,763
なるほどフビニの定理ですか。
ルベーグ積分はまだ知らないのでとりあえず今は
フビニの定理の仮定を満たす関数で妥協しておいて
一般的な場合はもう少し勉強してからにします。
ありがとうございました。
765132人目の素数さん:03/05/23 02:28
>>764
>フビニの定理の仮定を満たす関数で妥協しておいて
>一般的な場合はもう少し勉強してからにします。

「フビニの定理の仮定を満たす関数」が、一般性の限界なんですけど…。

ルベーグ積分を知らないとのことなので、本物の「フビニの定理」のことでなくて、
「リーマン積分における、フビニ型定理の仮定を満たす関数」(連続かつ云々とか)
で妥協する、という意味かな?
766722:03/05/24 03:40
>745
>どこかのサイトで掲載されているようだったら教えてください。
>もしくはMethodsをメールしてください(添付ではなく、テキストで)。

こんにちは。
先日、テキストをメールさせていただきました。
返事が遅くなってしまい、すみません。
お時間の空いたときにでも返事をいただけると嬉しいです。
767711:03/05/27 17:18
>>766

すいません。うまく届いていないようです・・・。
もう一度送ってもらえますか?
768766:03/05/28 02:29
>>767
すみません!
s が抜けていました。。
再度送信しましたので、よろしくお願いします。
769132人目の素数さん:03/05/29 04:38
確率密度関数が
W(x) = { 1 / √(2πσ^2) } exp[-{(x-μ)^2}/(2σ^2)]   (正規分布)
で与えられているとき、|x-μ|の期待値は何ですか?(μはパラメータ)
∫|x-μ|W(x)dxだけど
これくらいの積分は自分で計算できたほうがいいような気がする
高校レベルだし
771132人目の素数さん:03/05/29 20:53
統計学が専攻できる良い大学院教えてくれ
772132人目の素数さん:03/05/29 22:51
恥ずかしい質問なのですが、量対数グラフのプロットの仕方というか、目盛りの読み方が分かりません。なので教えて頂きたいです。
773132人目の素数さん:03/05/29 22:59
>>771一橋
774132人目の素数さん:03/06/02 17:20
2群間で正答率(%)についてそのまま分散分析するのって、本当はマズイのでしょうか?
正答率を何らかの形で変換する必要があるのでしょうか?
申し訳ありあません。ご教示いただけるとありがたいです。
775132人目の素数さん:03/06/04 21:44
Rで行列のランクを求める関数ってありますか?
いくらみつけても無いのですが・・・・
776132人目の素数さん:03/06/05 00:12
>>775
qr(x, tol=1e-07)$rank
パラメーター tol は「x の列中の線形従属性を検出する際の許容度」
(tolerance) だそうです. (数値計算には丸め誤差があるので,
ある列が他の列の線形従属になるかどうか厳密に判定するのは
困難なため)
ありがとうございました。
778132人目の素数さん:03/06/07 17:33
S-PlusはWindows版よりLinux版の方が高いようですが実際の購入価格はどれぐらいになるのでしょうか?
    ,,  ,
   /ヾヽ .|
   |丿.||丿
   |乂 ||丿
   |⌒/ヽ,
   /゚゚| <生中
   /  |
  /  |
  |  /
  | /
  | /
  V./' <レモンサワー
 /゚゚ヽ
 |文||ヘ,
 |乂||ヘ,
 ゞ ノ |,
  ´`

780132人目の素数さん:03/06/07 19:11
一応、基本的な確率・統計の知識はあり、面白くなってきたので更に勉強したいと思います。
竹村彰道著 現代数理統計学 創文社 は良書とのことですが、独習がきついと聞きました。
実際のところはどうなのでしょうか?他にお薦めありますか?
難しいとしたら他には、
稲垣宣生著 数理統計学 裳華房
野田一雄、宮岡悦良著 数理統計学の基礎 共立出版
なんかも考えていますがどうでしょうか?
>>769
782132人目の素数さん:03/06/09 21:20
教えてクンでスマソ。
誰か数理統計と確率統計の違いを教えてくれませんか?
783132人目の素数さん:03/06/13 11:32
回帰分析、重回帰分析を学べる(・∀・)イイ!!サイトをご存知の方いらっしゃいませんでしょうか?
784132人目の素数さん:03/06/13 11:40
統計学って、うさんくさくて、しかたない。
統計学批判、統計学基礎論みたいな論点の本ないですか?
 教科書としては、ラオ「統計的推測とその応用」が
 よいと思います。
785132人目の素数さん:03/06/13 12:17
>>780
竹村彰道『現代数理統計学』の参考文献リストは参考になりませんか?
そのなかで上げられている
 柳川尭『統計数学』
は難しいという評判ですが。Lehmannが良さげですね。
http://gamble.2ch.net/test/read.cgi/slot/1049071545/l50


誰か、このスレの1に統計学を教えてやってくれ
787132人目の素数さん:03/06/14 16:45
>>780
演習問題に関して
竹村は解答がついていない
稲垣は解答しかついていない(しかも問題こりすぎ)
ので当方も良い本をさがしております。1000 exercizesって誰か買った方いませんか
788132人目の素数さん:03/06/16 18:45
純粋数学はつまらないが、統計学は楽しいよ。
789132人目の素数さん:03/06/21 20:30

相関係数っていくつ以上だと正の相関があり、
いくつ以下だと負の相関がある、という明確な区切りはあるの?

例えばある相関係数が0.556って出たんだけど
これってどう結論付ければいいの?

790132人目の素数さん:03/06/22 03:09
         -─ヽ ` v '⌒ ゝ
         /          \
        /        ∧.    ヽ 
      i    , ,イ/  ヽト、!  N 
       │r‐、 ノレ'-ニ」  Lニ-'W   
       |.| r、|| ===。=   =。==:!     
       │!.ゝ||. `ー- 1  lー-‐' !    0.5以上なら
     /|. `ー|! r   L__亅 ヽ|     いいんとちゃう?
   /  |  /:l ヾ三三三三ゝ|
 ‐''7    | ./  `‐、, , , ,ー, , ,/ヽ_
  7   ./K.     ` ー-‐ 1   ヽ-
 /   / | \       /|ヽ   ヽ
791● ◆H1jS.eveTw :03/06/22 13:45
>>789
順位相関とかもしようしてみれば?
792132人目の素数さん:03/06/22 16:21
純粋数学は素晴らしいが、統計数学はクソ。
793132人目の素数さん:03/06/25 00:07
成功の確率 p の 二項過程 { N(n) , n = 1, 2,… } において
時間区間 [ 1 , T ] で事象が2つ起こったという条件のもとで
ある時刻 t ( 1 ≦ t ≦ T ) までに事象が1つ起きている確率を求めよ。

という問題なんですけど教えてください。

「わからない問題はここに書いてね」では答えが出なかったので
よろしくお願いします。
794132人目の素数さん:03/06/25 01:09
「二項過程」って、ベルヌイ試行のことかな?
もしそうなら、これでいいんじゃない:

以下T,tは自然数とする(そうでない場合は整数部分[T], [t]で置き換
えればよい)。

A:Tまでに事象が2つ起こる
B:tまでに事象が1つ起こる
とすると、

A∩B:tまでに事象が1つ起こり、tからTまでに事象が1つ起こる

二項分布の公式と試行の独立性により

P(A) = TC2 p^2(1-p)^(T-2)
P(B) = TC1 p^1(1-p)^(T-1)
P(A∩B) = TC1 p^1(1-p)^(T-1) × (T-t)C1 p^1(1-p)^(T-t-1)

∴ P(B|A) = P(A∩B)/P(A)

代入して計算すると 2(T-t)/(T-1) × (1-p)^(T-t) になるみたいですが?
795132人目の素数さん:03/06/25 01:31
宿題なんですがアホ私文なんですみませんが教えてもらえませんか・・? 問題(分数とべき乗を用いて簡潔に表せ) 1、二項分布BN(6,p)のp=1/6,2/6,3/6に対する確率それぞれf1(k),f2(k),f3(k)の式を導け。
796132人目の素数さん:03/06/25 01:32
2、f1(k)の値をk=0,1,2,…,6に対して計算し、kの値を列にとった表を作成せよ。また、比f(k+1)/f(k)の値を次の行に示せ。f2(k),f3(k)について続けよ。3、2で作成した表に基づいて分布f1,f2,f3のmodeの値を示せ。
797132人目の素数さん:03/06/25 01:33
4、任意のpに対する二項分布BN(6,p)のmodeを記号を使って示せ。modeが複数になるpは存在するか。 5、任意のn,pに対するBN(n,p)についてはどうか。
798793:03/06/25 07:43
>>794
サンクス!!!
cool!!!!
ホントありがとうございました。m(__)m
>>795
とりあえず二項分布BN(n,p)の公式書ける? ていうか、書いてみ。
800793:03/06/25 10:30
>>794

> P(B) = TC1 p^1(1-p)^(T-1)
訂正
  P(B) = tC1 p^1(1-p)^(t-1)

> P(A∩B) = TC1 p^1(1-p)^(T-1) × (T-t)C1 p^1(1-p)^(T-t-1)
訂正
  P(A∩B) = tC1 p^1(1-p)^(t-1) * (T-t)C1 p^1(1-p)^(T-t-1)

で答えは
2t(T-t)/T(T-1)でし
801132人目の素数さん:03/06/25 10:43
確率過程論についてのいい参考書を教えて下さい。
>>801
Stochastic differential equations and diffusion processes / by Nobuyuki Ikeda, Shinzo Watanabe.
EDITION: 2nd ed. PUBLISHER: Amsterdam ; New York : North-Holland Pub. Co. ; Tokyo : Kodansha ; New
York, NY, USA :
803_:03/06/25 11:06
804132人目の素数さん:03/06/25 17:01
>>802
801がどのレベルを希望してるのかは知らんが、
いきなり池田・渡辺かよ(;´Д`)

>>801
おいらはIto, Mckeanをお勧めするYO
805丸三角四角:03/06/26 01:09
>802,804
いやらしいな、お前らは。

んじゃ、俺は
J. Jacod and A. N. Shiryaev "Limit Theorems for Stochastic Processes"
なんかを勧めてみるテスト
806795:03/06/26 21:19
>>799 すみません習ってないんです…
807132人目の素数さん:03/06/26 21:24
過程論なら田中がいいんじゃないか?
808132人目の素数さん:03/06/26 23:13
>>806
ウソつけ。
二項分布習ってない者に、どうして

>1、二項分布BN(6,p)のp=1/6,2/6,3/6に対する確率それぞれf1(k),f2(k),f3(k)の式を導け。

なんて「宿題」が出るんだ?
809795:03/06/26 23:46
>>808 すみません言い訳なんだけど教授がひどくてノート見ても何が何やら…
P(Sn=k)=(nk←下)pk乗qn-k乗のことでつか…?
810丸三角四角:03/06/27 00:09
>>795
言い訳する前に、そもそもBinomial modelって何かを考えてみるべき。
んで、Bernoulli 試行から導出すればよし。
811795:03/06/27 01:06
>>810 はぁ…まぁやってみます
低レベルなことでスレ消費しちゃってスマソ
812801:03/06/27 06:02
>>802,804,805,807
有り難う御座います。
学校の図書館で見てみます。
813132人目の素数さん:03/06/28 10:34
ここってどんな人が書き込みしてんの?
ちなみに俺は計量経済学専攻なんだけど。
漏れは確率解析専攻。
815丸三角四角:03/06/28 23:36
専攻は確率微分方程式の推定と分布論。
>>804,805
漏れは“いきなり池田・渡辺”で確率過程を勉強したよ。
当時、ルベーグ積分と関数解析はひととおりやってたが、確率論の知識は皆無だった。
>>816
いきなり池田・渡辺かぁ。
おいらは最初Shiryaevだった。
ロシア語萌え〜(*´Д`)
計量ってどんなことをやってるん?
>>817
やっぱり、統計学っていうか確率論専攻してる人間は
英語以外にもロシア語とかフランス語とかも読む必要あるわけかい?
>>819
ロシア語は文字すらわからんが、漏れの場合、フランス語はバリバリに必要だった。
使用が認められてることが多いせいか、フランス語の論文多すぎ。
漏れも英・仏は読めるな。
je suis japonais.
823132人目の素数さん:03/07/04 17:28
すみません。
四分位偏差より標準偏差のほうが大きいのはなぜですか?
824どなたか:03/07/05 09:25
一般化線形モデルとか統計モデルの本で良い本ご存知ありませんか?
朝倉の統計モデルの本は持っています。
825132人目の素数さん:03/07/05 09:35
826直リン:03/07/05 09:35
はじめまして。大学一年で文系なのですが、
どうしても分からないことがあるので質問させてもらってもよろしいでしょうか?

先日、先生から課題を出されまして、茎葉図を調べてこいとのことでした。
本屋に行っても、図書館に行っても、GOOGLEで調べても2件しかヒットしません。
この茎葉図なるものを詳しく扱っているサイト、もしくは書籍がありましたら教えてもらえませんでしょうか?

一応統計の授業で扱ったということでここに書かせて頂きました。
もし分かる方がいらっしゃいましたら、よろしくお願いします。
828132人目の素数さん:03/07/07 21:55
>>827
組み合わせを考えるやつじゃないの?
829132人目の素数さん:03/07/07 22:18
>>827
いきなり「茎葉図」という言葉が出てきたわけじゃないだろ。
それで悩むっていうのはあんたが授業に出てない証拠。
まぁあきらめるんだな。
すごく基本的なことなんですが(たぶん)単回帰分析の手法はこれでいいのでしょうか?

@ 最小二乗法で係数の推定値を求める
A Rを求める
B Rの二乗を求める
C 回帰式の信頼性を求める(分散分析と相関分析両方で??)
D 回帰係数と定数項の検定

激しく間違ってても優しく教えてくださいお願いします(´Д⊂グスン
>>827
stem-and-leaf display (あるいは plot, presentation) のことでしょうか?
日本語だと, 幹葉表示とか樹葉図と呼ばれています.
数値の分布の表現方法で, 上位の桁の分布を「幹」で表現し, その下位の
桁の分布を「葉」で表現します.
たとえば, {1.2, 1.5, 1.8, 2.0, 2.0, 2.3, 2.7, 2.8, 3.1, 3.5} という
分布は,
1の位 | 小数第 1位
  1 | 2 5 8
  2 | 0 0 3 7 8
  3 | 1 5
  ↑ | ↑
  幹 | 葉
のような幹葉表示で表わすことができます.
(http://www.qmss.jp/appstat/contents/presentation/3adv-chart.htm
を参考にしました.)
833132人目の素数さん:03/07/08 00:59
簡易ヒストグラムみたいなもんか。
834827:03/07/09 07:40
調べてみた所、832さんの幹葉図と同じでした。先生にメールで、これでいいのか聞いて確認済みです。

とても参考になりました。回答して下さったみなさん、ありがとうございました。
特に832さんには、わかりやすく説明して頂き、とても助かりました!
835132人目の素数さん:03/07/10 00:29
明日統計学の試験なのですが
エクセルを使ってジニ係数を求める方法がわかりません。
ローレンツ曲線のグラフはかけたのですが。
助けて下さい!!
お願いします。
ここが最後の望みです。
837132人目の素数さん:03/07/10 20:57
明日までなんですがお願いします!無理でしたらヒントでもいいので…。
互いに独立にX1がP0(λ)に従い、X2がP0(λ2)に従えば、
和X1+X2はP0(λ1+λ2)に従うことを、
積率母関数の関係Mλ1(t)Mλ2(t)=Mλ1+λ2(t)によって示せ。
838132人目の素数さん:03/07/10 23:00
>>837
Mλ1(t)とMλ2(t)を積率母関数の定義から求めてそれらを掛け合わせれば
丁度P0(λ1+λ2)の積率母関数と等しくなることを示せばよいだけ。

積率母関数って何?って質問はやめてね。
839837:03/07/10 23:28
>>838 ありがとうございます。低レベルな質問ですみませんでしたぁ
840132人目の素数さん:03/07/11 13:07
こんにちは。
ボクは中学レベルの数学しかわからないのですが
(高校は適当にこなした、大学は私大文系)
エクセルを使って統計解析ができるようになりたいです。

おすすめの本がありましたら教えてください。
>>795,837
は同じ講議ですね(笑)

ところで、私も>>795-797の問題がよく分かりません。
どなたか教えていただけると有り難いです。
ちなみに837のほうは一応解けました。


私の状況としましては、

P(S6=k)=6Ck*p^k*(1-p)^(6-k)
上式に p=1/6, p=2/6, p=3/6 をそれぞれ代入して
f1(k)=6Ck*(1/6)^k*(5/6)^(6-k)
f2(k)=6Ck*(1/3)^k*(2/3)^(6-k)
f3(k)=6Ck*(1/2)^6

という感じで1番を解きました。
これにk=0,1,…,6を代入して2番の表を作りました。
そして、比の値を示そうとして、

f(k+1)/f(K)={6C(k+1)*p^(k+1)*(1-p)^(6-k-1)}/{6Ck*p^k*(1-p)^(6-k)}=p/(1-p)*6C(k+1)/6Ck=?????

んんん?なんかよくわからん!! <−−−終了!!>

と、なりました。

1行目からすでにあやしげです(汗)
講議のノートを見てもよくわかりません。
お手数をおかけしますが、ささやかなアドバイスでよいので、教えて下さい。

842132人目の素数さん:03/07/12 01:23
>>795
ノテーションを言わんと分からんよ。
f1ってなによ?
843山崎 渉:03/07/12 12:25

 __∧_∧_
 |(  ^^ )| <寝るぽ(^^)
 |\⌒⌒⌒\
 \ |⌒⌒⌒~|         山崎渉
   ~ ̄ ̄ ̄ ̄
>>841
合ってんじゃない?

6C(k+1)/6Ck は 約分すると(6-k)/(k-1)かな。 ( nCr = n!/(r!(n-r)!) を思い出せ)
845841:03/07/13 21:36
>>842
f1=f1(k)=6Ck*(1/6)^k*(5/6)^(6-k) で、
単に、二項分布BN(6,1/6)の確率という意味だと思うのですが。。

>>844
ありがとうございます。
それでいいんですか。。よかったです。
そういえば!そうでした!!

あと、3番以降の問題について、modeの値を示せ、とは
どんな風に答えれば良いのですか?
modeについては授業でもほとんど説明されず、
私はこの手の問題に初めて取り組むので、どうして良いものか
困っているのです。おねがいします。


846132人目の素数さん:03/07/15 05:33
あのーx1,x2,x3が3元の正規分布に従っていて、その分散共分散行列は、
{{1,0.5,0.5},{0.5,1,0.5},{0.5,0.5,1}}で、平均ベクトルは0だとすると、
2*x1+3*x2+x1は、どういう分布に従いますか?
847132人目の素数さん:03/07/15 10:25
統計学を確率論的に厳密に記述した本ってありますか?
ご存知の方いたら是非教えてください。
848山崎 渉:03/07/15 12:35

 __∧_∧_
 |(  ^^ )| <寝るぽ(^^)
 |\⌒⌒⌒\
 \ |⌒⌒⌒~|         山崎渉
   ~ ̄ ̄ ̄ ̄
849132人目の素数さん:03/07/15 17:16
>>847
測度論的な確率論に基づいたってことかい?
邦語なら鍋谷清治の本はどうよ?
850846:03/07/15 23:10
誰かたすけてくらはい。。。
課題が出来ない。。。お願いします。。。
851132人目の素数さん:03/07/16 08:52
誰かこの問題わかる人いますか?

確率密度関数が   p(x) = 1/μ * exp(-x/μ) (x>=0)
0 (x<0 )

で与えられる確率分布はパラメータμの指数分布と呼ばれている。
ただし、μ>0とし、この分布の平均と分散はそれぞれ、μ、μ**2
となることがわかっている。

いま、母集団分布がパラメータμの指数分布に従うものとする。た
だし、μは未知である。この母集団から無作為に抽出した n 個の標
をXi(i=1,2,3,..n)とする。

この標本の総和をSnとするとき、Snの平均、分散を求めよ。

よろしくお願いします。
>>851
私程度のものには、貴方が何が分からないのかすら分かりません
このような若輩者の意見を容れて下さるのなら、
http://www.amazon.co.jp
に一度足をお運び下さいますよう、よろしくお願いします
854795=837:03/07/16 20:29
>>841 何で分かったの?もしかして同じ大学ですか?

こういう課題が出る講義のテストっていかなる問題なんでしょうか?いい参考書あったらどなたかお教えください
856hushianasan:03/07/16 20:31
ねるべ
857132人目の素数さん:03/07/18 02:00
完備十分統計量について詳しい本挙げてください。。。
漏れ文系でつ。
858132人目の素数さん:03/07/18 02:48
すいません、どなたか教えていただけないでしょうか?
対照群(5匹)および薬剤投与群(5匹)の動物に対し、
コレステロール値の測定を行い、両群の平均値を求めます。
さらに、両群に対して、同じ測定を別の日に2回繰り返し行い、
合計3回の両群の平均値を算出します。
この平均値の値を用いて、両群に差があるかどうかを統計的に
検定(例えばt-testもしくはマンホイットニーなど)してよいものなのでしょうか?
論文を読んでて、この方法はアリなのかなあと思いまして。
よろしくお願いいたします。

859841:03/07/19 22:04
>>854
私もその授業を受けているからです!
だれかテスト情報をくれーーーーーーーーー(切実)
860132人目の素数さん:03/07/19 23:29
χ2乗分布では正規分布のような再生性は成り立つのですか?
861132人目の素数さん:03/07/20 01:49
>>860
たたみこみをやって計算すればX+Yもχ^2分布に従うらしいね
862132人目の素数さん:03/07/20 14:07
仮説検定について質問です。
両側検定と片側検定、どのように見分ければいいのですか?

例)ある小売店の1日の売上額は従来平均30万円、標準偏差4.8万円であった。
ところが近所にスーパーマーケットが開店して依頼36日間の毎日の売り上げの実績は標本平均28万円である。
日々の売り上げは相互に独立な確率変数であるとみなし、かつ標準偏差は以前と同じとして、スーパーの開店がその小売店がの売り上げに影響を及ぼさないと言う仮説を、スーパー開店が小売店の売上をを減少させているという対立仮説に対してサイズ5%で検定せよ。

という問題を片側検定でうちの先生はやってました。何故でしょうか?要は棄却域をどこに設定すればいいかが分からなくて・・。
お願いします。
863132人目の素数さん:03/07/20 15:35
2500人にアンケートをとったところ、900人が内閣を支持すると答えた。
内閣支持率を信頼度95%で区間推定し、その範囲を求めよ。
おながいします。
864?:03/07/20 15:36
>>860
ガンマ分布の再生性によりχ^でも成り立ちます。
>>862
対立仮説が以前の売り上げの平均 > 以後の売り上げの平均
だからでしょ?
>>863
超幾何分布
>>858
どうなんだろ。薬物って1日たっただけで効果が薄れるものも多いよね。
870132人目の素数さん:03/07/22 21:59
学校の宿題なんですけど、経済学部の統計の授業が私には全然
わかりません。
よかったら教えて欲しいです。問題全部書きます。^は何乗です。
@ 変数Xが正規分布N(5,2^2)に従うと仮定する。
  このとき P{2≦X≦10}である確率を求めよ。
A 一日の平均売上個数は正規分布(μ,σ^2)に従うと仮定する。
  30日間の平均の一日の売上は700個、その標本標準偏差は30個
このときの一日の平均売上個数の信頼係数95%の信頼区間を求めよ。

B 授業成績は正規分布(μ,σ^2)に従うと仮定する。
100人の成績の平均は60点、標本分散は25点だった。
このとき、成績の母分散σ^2の信頼係数95%の信頼区間を求めよ。


です。教えてさんで本当にゴメンナサイ。
図書館なり本屋に行き
「統計学入門」てな感じの本を読んで見ましょう。

練習問題とかでまったく同じ形式の問題が
載っているはず・・・
872132人目の素数さん:03/07/22 22:16
>>871
870です。ありがとうございます。
ただ、これの提出が明日なんです………。
もっと早く聞いてれば良かったです……なんとかなりませんか?
>>872
統計は数学でもどちらかってとマイナーなのでレスがつきにくいのです。
1日ではむりかも。
標準化、t分布、χ^分布
875132人目の素数さん:03/07/23 01:31
>>874
やさしいのぉ。
876132人目の素数さん:03/07/23 07:08
>>870 面倒なのでヒントのみ
1 標準化して、分布関数を使えば良い。
2 信頼区間の公式そのまま使え。標準化とか書いてあるだろう。
まっがんばれや
877132人目の素数さん:03/07/25 12:33
2chのレス-スレッド数はχ^2分布をする
878???:03/07/25 12:38
879132人目の素数さん:03/07/25 14:52
ど う し て こ の 国 は こ ん な に

風 俗 で は た ら い て い る ひ と が

大 量 に い る ん で し ょ う か ?

ど う し て こ の 国 は こ ん な に

風 俗 で は た ら い て い る ひ と が

大 量 に い る ん で し ょ う か ?

ど う し て こ の 国 は こ ん な に

風 俗 で は た ら い て い る ひ と が

大 量 に い る ん で し ょ う か ?

ど う し て こ の 国 は こ ん な に

風 俗 で は た ら い て い る ひ と が

大 量 に い る ん で し ょ う か ?
880132人目の素数さん:03/07/25 20:28
ますまにあ、879に答えてやれ。お前の得意分野だろ
881132人目の素数さん:03/07/28 13:25
教えて下さいp://www.e.okayama-u.ac.jp/~zhxy/lec/stat1/ex3.pdf
この問題で1の(2)でn=3となってますが
それはどうやってみちびくのでしょうか?
http://www.e.okayama-u.ac.jp/~zhxy/lec/stat1/ex3a.pdf ←解答には3と
ある
>>881
問題きちんと嫁
883132人目の素数さん:03/07/28 13:32
>>882わかりません
教えて下さい
884132人目の素数さん:03/07/28 13:40
告白したいけど、自分に自信がない。それでも胸の奥が苦しくて・・・
そのような方、諦めないで。
ここでは、異性に効果を発揮する香水、合法ドラッグなどがおかれています。
小売価格一万円以上の品が、半額以下の値段で取引されています。
是非ここでゲットして、貴方の気持ちを打ち明けて下さい。
相手の方も、きっとそれを待っていますよ。

http://www.adultshoping.com/index.cgi?id=1057809839
【平成14年度 行政モニターでのアンケート結果 】
【水道事業民営化への意見】
 質問7 生命や健康に直接的なかかわりを持つなど、水道は住民の日常生活に直結して
いることから、我が国では公共事業として地方自治体が実施しています。しかし、イギリス
などの諸外国では、民間会社が水道事業を運営している例があり、我が国でも構造改革
の一環として、水道事業の形態についての検討がなされています。そこで、水道事業にお
ける民営化について、あなたのご意見をお聴かせください。 (○(まる)は1つだけ)
   1 従来どおり地方公共団体が実施した方がよい
   2 水道事業自身を民間会社が経営し、事業運営を行う方がよい
   3 公共の監視の下で、民間会社が水道の事業運営を行う方がよい
   4 わからない

結果
   1 従来どおり地方公共団体が実施した方がよい             → 42.5%
   2 水道事業自身を民間会社が経営し、事業運営を行う方がよい    → 11.7%
   3 公共の監視の下で、民間会社が水道の事業運営を行う方がよい  → 31.5%
   4 わからない                                  → 13.2%

大阪府の解析結果
 水道事業の民営化について意見をたずねたところ、「地方公共団体が実施した方がよい」
と答えた人が42.5%で最も多く、次いで「公共の監視の下で、民間会社が水道の事業運営
を行う方がよい」(31.5%)、「民間会社が経営し、事業運営を行う方がよい」(11.7%)の順であっ
た。「地方公共団体が実施した方がよい」と「公共の監視の下で、民間会社が水道の事業運営
を行う方がよい」の両方を合わせると、全体の4分の3が水道事業について公共の関与を求め
ている。また、「わからない」(13.2%)と回答した人が全体の1割強であった。

http://www.pref.osaka.jp/suido/jouhou/monita1/monikek1.html


URL内のディレクトリ名が2バイトコードになっているところ辺り、何考えてるんだろ…

http://society.2ch.net/test/read.cgi/koumu/1052488470/795
【平成14年度 行政モニターでのアンケート結果 】
【水道の自爆解析結果を斬る @!】

>「地方公共団体が実施した方がよい」と「公共の監視の下で、民間会社が水道の事業運営
>を行う方がよい」の両方を合わせると、全体の4分の3が水道事業について公共の関与を求
>めている
水道職員が対外発表するために、苦心して考えた結論は
@+B = 74%

しかし、少なくとも小学6年生程度の頭を持つ良い子の児童なら
@ → 設置:役所、経営:役所、維持管理:役所
A → 設置:役所、経営:民間、維持管理:民間
B → 設置:役所、経営:役所、維持管理:民間
の意味合いの質問であると、「事象分解」を行います。
いわゆる「ちゃいろのおおきいうさぎ」と「しろのちいさいハムスター」などの複合的な
特徴をもつ事象を認識するために、小学生でもすることです。

【小学生レベルで解析しなおした結果】
経営方式は → 役所経営:74%、民間経営:11.7%
維持管理方式は → 役所運営:42.5%、民間運営:43.2%

と解析され、
市民は「官設で大阪府などの監視の元に民間が運営するのがいい」というのが結論です。

統計の取り方を極めて恣意的にして、恣意的に解釈しても、水道レベルの企画・解析能力
は低いですね。
こんな、水道部職員に水道事業を任せっぱなしにするのは、賢い市民の
選択肢としてはちょっと考え物です。
   http://www.pref.osaka.jp/suido/jouhou/monita1/monikek1.html

  http://society.2ch.net/test/read.cgi/koumu/1052488470/796
「はじめての統計学(日本経済新聞社)」
「統計学入門(東京大学教養学部統計学教室)」
と学習を進めてきました。
演習問題を数多くこなしたいのですが
いい演習書はないでしょうか?

候補としては・・・
http://www.amazon.co.jp/exec/obidos/ASIN/4320010345/qid=1059581363/sr=1-2/ref=sr_1_2_2/249-9903639-0194716

http://www.amazon.co.jp/exec/obidos/ASIN/4563008095/qid=1059581363/sr=1-6/ref=sr_1_2_6/249-9903639-0194716

あたりが良いのではと考えているのですが・・・
難易度的には標準くらいで、説明が丁寧なのを
希望しております。
     ∧_∧  ∧_∧
ピュ.ー (  ・3・) (  ^^ ) <これからも僕たちを応援して下さいね(^^)。
  =〔~∪ ̄ ̄ ̄∪ ̄ ̄〕
  = ◎――――――◎                      山崎渉&ぼるじょあ
889132人目の素数さん:03/08/02 22:13
http://www.videor.co.jp/index.htm
ここでの視聴率測定方法を見ると
サンプルは東京の場合600世帯だそうです。

自分はこれを少なく感じるのですが、統計学的にはどうなのでしょうか?

890132人目の素数さん:03/08/02 23:11
人気サイト
http://pocket.muvc.net/

891その1:03/08/02 23:43
>889
ちと天下りだが、こういう場合、
その算出された率%の表している誤差は
±(精度に対応する値)×√(%(1-%){1-(標本数-1)/(母集団-1)}/標本数)
になります。
母集団と標本の桁が違うときはだいたい
±(精度に対応する値)×√{%(1-%)(1/標本数-1/母集団)}
でいいでしょう。
母集団の桁がデカければ
±(精度に対応する値)×√{%(1-%)/標本数}
と、標本の数だけ気にしていればよくなってしまいます。

※精度に対応する値とは、その算出%がただしい確率に対応する正規分布点のことで
たとえば、その計算結果が正しい確率が
90%のときは1.65(表の中の数字がはずれる確率(1-0.9)/2=0.05になるのが1.65の所)
95%のときは1.96、99%のときは2.58です。
892その2:03/08/02 23:43
さて、「東京」が23区なら380万世帯、都なら540万世帯なわけだが、
1/600=0.001666666...
1/600-1/380万=0.00166640...
1/600-1/540万=0.00166648...
有効数字4桁で、実際の世帯数は気にしなくて良い話になっています。

そのあとは
http://www.videor.co.jp/rating/wh/07.htm
のページの通りです。
中央の表で、例を出せば

計算された視聴率が10.0%の場合、標本数が600ならば、
95%の確率で、本当の視聴率が7.6%〜12.4%の間にある。5%の確率で、その範囲外にある
ということです。
計算された視聴率が5.0%の場合、標本数が600ならば、
95%の確率で、本当の視聴率が8.2%〜11.8%の間にある。5%の確率で、その範囲外にある
ということです。
ちょいと計算し直せば、

計算された視聴率が10.0%の場合、標本数が600ならば、
90%の確率で、本当の視聴率が8.0%〜12.0%の間にある。
95%の確率で、本当の視聴率が7.6%〜12.4%の間にある。
99%の確率で、本当の視聴率が6.8%〜13.2%の間にある。

計算された視聴率が5.0%の場合、標本数が600ならば、
90%の確率で、本当の視聴率が8.5%〜11.5%の間にある。
95%の確率で、本当の視聴率が8.2%〜11.8%の間にある。
99%の確率で、本当の視聴率が7.6%〜12.4%の間にある。
とわかります。
893132人目の素数さん:03/08/03 00:22
式の通り、標本数n^2倍で誤差は1/nになりますから、
視聴率20%の1の位が厳密にあっているためには、
90%の正確さを求めるなら22000世帯、
95%の正確さを求めるなら26000世帯、
99%の正確さを求めるなら34000世帯、
必要ですね。
視聴率10%の1の位が厳密にあっているためには、
90%の正確さを求めるなら11000世帯、
95%の正確さを求めるなら14000世帯、
99%の正確さを求めるなら18000世帯、
必要ですね。
視聴率5%の1の位が厳密にあっているためには、
90%の正確さを求めるなら6500世帯、
95%の正確さを求めるなら8000世帯、
99%の正確さを求めるなら10000世帯、
必要ですね。
また、
「視聴率が誤差±2%あるところで、0.1%の区別をする」
をごく「大ざっぱ」な話だが身長にたとえると、
身長は1日の間に±1cm程度増減するとして、
身長0.5ミリの区別をする、ということになりますな。
「いやー昨日は身長172.34cmだったのに今日は172.33cmに縮んじゃったよ〜」
894889:03/08/03 12:54
>>891-893

丁寧な解説、ありがとうございます。
ビデオリサーチの言い分にも納得できましたし、
とても勉強になりました。感謝します。
895名無し募集中・・・:03/08/05 08:47
Aという行動をした時X%の確率でBという事象が起こる。

今、Y回行動Aを取った時Bの事象が起こった。
この時の信頼区間の求め方はどうすればよいのでしょうか?
896名無し募集中・・・:03/08/05 08:49
日本語が変でした・・・。

今、Y回行動Aを取った時Bが起こる回数の
信頼区間の求め方はどうすればよいのでしょうか?

ですm(__)m
897132人目の素数さん:03/08/07 22:21
 
あーそうだ。オマケの話。
何が当たるかわからないオマケで、
全部揃えるには何個買えばいいかって問題。周期的に質問スレに来るやつ。

期待値を求めるまでは良いんだよ。既出中の既出。
でも、
何個買えば何%の確率で全部揃う、っての、どんな分布になるんかな。
n種類の場合、k個買ったとして、
k<nの場合確実にゼロだし、逆はk→∞まで分布は伸びるわけだし。
899132人目の素数さん:03/08/08 07:21
すみません、統計の質問かどうかわからないのですが・・・。

質問
1/256で当たるルーレットと、1/1024で当たるルーレットを、
どちらかが当たるまで、試行を繰り返す 場合と、

1/256で当たるルーレットを当たるまで試行する。ただし1023回目の試行までに
当たらなかった場合は1024回転目は無条件に当たりとする場合。

この二つの場合は当たりまでに要する平均の試行回数は違ってきますか?
これらはどういった計算式で表現すればよいでしょうか。
実はExelである計算をしているのですが、関数を使うにしても
何を使えばいいのかわからず、困り果てています。
Exelに関するスレッドが見つからなかったもので、ここに書きこませて
いただきました。板違いだったらすみません。
900 ◆U8x.lax536 :03/08/08 09:02
800
900 : ◆U8x.lax536 :03/08/08 09:02
800
902132人目の素数さん:03/08/08 18:53
χ2乗検定の時、

平均値や標準偏差がわかっていると
自由度がかわりますが、
これはなぜですか?
903ビッグバン宇宙論は完全に大間違いだった!!!!!!!!:03/08/08 19:29
科学者よ、恥を知れ!
ビッグバン宇宙論は完全に間違いだった!
科学の原則を無視した、デタラメのインチキ理論だったのだ。
そして、そのビッグバン宇宙論の世界的な浸透は
アメリカ、ユダヤ・キリスト教勢力による世界支配のための思想的な戦略なのだ!
また、ビッグバン宇宙論の思想によって戦争が起こり、
貧富の差がひらき、終末的な絶望感が世界に蔓延しているのだ。
ビッグバン宇宙論は世界の平和を揺るがす、悪の元凶となっているのだ。
ビッグバン宇宙論とは、
「宇宙は『無』からビッグバン(大爆発)によって誕生した」という理論である。
この理論は、ユダヤ・キリスト教の創造神話(神が天地を創造した)そのものである。
ビッグバン宇宙論の実態は、科学理論ではなく宗教思想なのである。
『無』は科学的に証明できるものではなく、
そして、『無からの誕生』も科学では証明できるものではないのだ。
ビッグバン宇宙論が科学の正統であるという思想を、世界中の人々に
浸透させる戦略が成功したことにより、ユダヤ・キリスト教勢力の
世界における優位性が確立されていったのだ。(20世紀に)
そして、その思想的支配の最大の例が、アメリカやイギリスによるイラク戦争なのだ。
ビッグバン宇宙論の浸透により、世界中に終末思想(世界の終わり)が蔓延してしまっている。
そのことにより、自己中心的、せつな的、短絡的な考え方が社会に広がっている。
科学的に間違っているビッグバン宇宙論から脱却しなければならない。
そして、宇宙は無限だということを理解しなければならない。
人間は本当の宇宙観、世界観を構築し、
新しい時代に進んでいかなければならないのだ。
ビッグバン宇宙論が世界を支配している限り、平和な世界にはならないのだ。
そのことを科学者は重く受けとめるべきである。
平和の時代へ!!!!!!!!!!!!!!!!!
>>902
母集団のことか?
905132人目の素数さん:03/08/09 09:04
>>904
そうです
906_:03/08/09 09:11
907132人目の素数さん:03/08/09 09:15
★☆ 夏休みは GETDVD で満喫・満喫!! ★☆★
★☆★☆★☆★☆★☆★☆★☆★☆★☆★☆★☆★☆★☆★
☆★ 送料激安!  スピード発送!  商品豊富!   
★☆      http://www.get-dvd.com        
☆★ 激安DVDショップ 「GETDVDドットコム」 
★☆      http://www.get-dvd.com        
☆★ 今すぐアクセス Let’s Go・Go!!   
★☆★☆★☆★☆★☆★☆★☆★☆★☆★☆★☆★☆★☆★
908山崎 渉:03/08/15 19:01
    (⌒V⌒)
   │ ^ ^ │<これからも僕を応援して下さいね(^^)。
  ⊂|    |つ
   (_)(_)                      山崎パン
909132人目の素数さん:03/08/24 21:34
落下してるぞ
910132人目の素数さん:03/08/24 22:46

おかねもうけ情報見つけました

http://pocket.muvc.net/job/index.html
911132人目の素数さん:03/08/26 18:44
初心者の質問です.

実験データの解析をしていたのですが,
測定時間によるデータの違いの検定を一元配置で行ったところ,有意差が出ませんでした.
しかし,同じデータを水準が測定時間と被験者の二元配置で行ったところ,両水準でかなりの有意差がでました.

こういうことは起こりうるのでしょうか?
二元配置分散分析はかなり判定が甘いのですか?

あと,パラメトリック検定を行う場合に最低限欲しい標本数はどのくらいでしょうか?
912132人目の素数さん:03/08/26 18:52
色白美巨乳の綾ちゃんです。
サムネイルの通り騎上位での下からのアングルが
最高の抜きどころですかねぇ。
冒頭のビキニでのオナニーシーンもいいし・・・
とにかく抜きどころが満載ってことです。
それにしても綺麗なオッパイです。
無料動画はこちら
http://www.exciteroom.com/
913132人目の素数さん:03/09/02 22:57
kotaere
914132人目の素数さん:03/09/10 06:22
母集団のデータから標準偏差を求めて、その標準偏差の分散を定式化したいのですが、
どうすればいいのでしょうか?
915●のテストカキコ中:03/09/10 06:52
http://ula2ch.muvc.net/ (このカキコは削除しても良いです)
916132人目の素数さん:03/09/12 20:10
 専門家の皆様,たすけて〜!!

 あることがきっかけで,ある集団(160世帯,500人)における生ごみの排出量を2年間にわたって調査したのですが,そしたらどうやらその分布はガンマ分布らしいことがわかりました。
 もっと細かく言うと,水,土の週2日,全20班でステーション収集,各班ごとに収集量を測定し,それぞれがやはり(というか当然)ガンマ分布らしい。もしや人数が少ない班(2世帯)では指数分布が出るかと思ってみてみたが,出なかった。(でも指数分布には近い)

 このような事実は環境社会学では知られているのでしょうか?(そういえば,滋賀大の金子研の卒論見てたら全国自治体における一人当たり排出量がガンマ分布に似ていたのが記憶にある。)
 
 私は社会学も統計学も素人なのでこの辺を詳しくは知らないのです。どうか教えてください。また,検定法とかも。

 なお,環境社会学屋さんが詳しそうなので,社会科学板にも投稿させていただきます。よかったらメールちょ!
917132人目の素数さん:03/09/12 22:35
>>916
>ある集団(160世帯,500人)における生ごみの排出量を2年間にわたって調査したのですが

ストーカーきもい
918132人目の素数さん:03/09/12 23:02
>918

 いやいや,ストーカーではなくて廃棄物処理関係の仕事をしているのです。そもそもこれだけの規模の調査はストーカーごときには不可能ですよ。

 廃棄物処理の世界ではここ10年ほど有機物リサイクルがはやってまして,それについては賛否両論あるんだが,国が「バイオマス戦略」を閣議決定するに至ってその流れは決定的なのです。
 それで基礎データとしてごみ排出パターンの調査が必要となって,ある自治会の同意を得て調査をさせてもらっているんです。まあ,安定して有機物が確保できなくてはリサイクルできませんからね。この調査はまじめで大切なのです。

919132人目の素数さん:03/09/12 23:08
>>916 Γ分布言われても、パラメータによって形だいぶちごぅし。
実際、指数分布もΓ分布の特別な場合やから。

けど、指数分布ぽくのぉて原点通るような形になってるのとちが
いまっか。独立した指数分布を足し合わせるとΓ分布になります
んや。Erlang分布とも言いますぅ。

分布の検定って普通のKolomogorov-Smirnovの検定でダメですの。
>>916 社会科学板ってどこ? ってゆうか、報告書をどっかに
出すんだったら、定番以外の統計手法を使う場合は、専門家
を雇うか共同研究者にしてくれ。社会科学系、人文系だとデ
ンパとかいいたくなるような勝手な数式をもちだす奴とか、
コンピュータ使ったから正しいと信じてる奴とかいるんだ。
921132人目の素数さん:03/09/13 22:02
922132人目の素数さん:03/09/17 01:15
質問よろしいですか?
統計学を学んでいて出会ったのですが、

 KLdivergence(KL=カルバック・ライブラ)

ってなんなんでしょうか?
特にどんな時に使うとよいのですか?
>>922
検索くらいしろ馬鹿
924解けないよー:03/09/17 10:48
他のスレッドでも聞いたんですが誰も答えてくれなかったので、ここでもう一度お願いします。

確率の問題です。

52枚のトランプがあります。
そこから3枚引いて合計が21になる確率は?

K,Q,Jは10。Aceは1または11。その他のカードはその数字通りです。
誰か教えてください。(=´ー`)ノ ヨロシク
>924
とりあえず、21になる組み合わせが何通りあるか
自分で数えろ。
926132人目の素数さん :03/09/23 16:59
他スレでも書いたのですが、質問です。

ある物体の質量を5gの分銅と天秤を使って測定することにする。一方のさらに物体を置き、他方の皿に1つずつ置いていく。
今、12個目の分銅をおいたときに物体の皿があがったとすると物体の質量Xは55gから60gの間のいずれかということになるので、
Xは一様分布U[55,60]に従うと考えることができる。
(1)Xの平均と分散を計算しなさい
(2)皿に分銅を10個までしかのせられなかったとする。このとき物体を二つに分けてそれぞれの重さを測ることにした。
   それぞれの物体の質量の測定値をX@、XAとするときX@+XAの分散を求めなさい
(3)5gの分銅の正確な重量を測定したところ、平均5.001g、標準偏差0.020gの正規分布N(5.001、0.020^2)
   にしたがっていることがわかった。100個の分銅の重さが499.5gから500.5gの範囲に入っている確率を計算しなさい

よろしく、お願いします
927132人目の素数さん:03/09/23 17:03
>926
とりあえず平均と分散は自分で計算できるよね?
928926:03/09/23 17:22
>>927
(1)は余裕でいけます。
(2)、(3)がわからないのですが・・・
929132人目の素数さん:03/09/23 17:37
>>926
(2)は、n個目で皿が上がったとして
(1)と同様に分散を求めて、分散の加法性を持ちいる
(3)正規分布の確率変数の和はまた正規分布に従い、N(5.001*100, 0.020^2*100)
後は正規分布表で求めて
930926:03/09/23 17:46
>>929
(2)は例えばX@が6個目で皿が下がったとすると 
  XAは6の場合と7の場合の2通りあると思うのですがどう処理したらいいですか?
931926:03/09/23 17:47
>>930

>6の場合と7の場合

6個目で下がる場合と7個目で下がる場合の間違えです。
>>931 独立な確率変数の和の分散に、各確率変数の平均が関係しますか。
933926:03/09/23 23:24
>>929
>>932
ありがとうございます。とりあえずやってみます。
934132人目の素数さん:03/09/24 02:25
指数分布族,ワイブル分布族,ガンマ分布族,対数正規分布族
が指数型分布族であるかどうかについて調べています。

指数分布族,ガンマ分布族,対数正規分布族が指数型分布族であることについては
わかったのですが,ワイブル分布族が指数型分布族であることについてはわかりませんでした。
というか自信がありません。

ちなみに

f(x)={r/(s^r)} {x^(r-1)} exp{ - (x/s)^r } I[0<x<∞], r,s>0

がワイブル分布の密度関数です。( I は定義関数)

rが固定されているときは指数型になると思いますが,そうじゃないときがわかりません。

どなたかアドバイスをお願いいたします。
935132人目の素数さん :03/09/24 11:40
X@ XA・・・・Xnをパラメータλの指数分布に従うランダムサンプルとするとき
指数分布の確率密度関数はf(x)=1/λ*e^(1/λ)である。このとき
X@ XA・・・・Xnの最大値Ymaxまたは最小値Yminのいずれかは再び指数分布に
従うと言うことなのですがどちらが従うのですか?理由付でお願いします。
937132人目の素数さん:03/09/24 17:29
確率分布をフーリエ変換して対数をとり,テイラー展開をしたときに現れる微係数がキュムラントですよね?
キュムラントと,キュムラントを求めるまでの計算にはどのような物理的意味があるのでしょうか?
どなたか知っているかた,お願いします
938132人目の素数さん:03/09/24 18:44
>937
例えるならおまんことおちんぽの関係だよね
939KingOfMath ◆p38EzHwbPY :03/09/24 18:53
937へ、演算として意味のあるものが物理的な意味を持つとは必ずしもいえない。
確率統計学も、いわば数学の一分野であり、数学は数理現象を研究するものといえる。
物理現象が数学の言葉で表せるのは、物理現象に数理現象が現れたときだといえる。
とりあえず、実際に物理的な意味があるのは数学理論の応用の一部だけだといってもよいだろう。
940132人目の素数さん:03/09/25 21:40
サイコロを120回振ったとき1の目が出X回出るとする。
次の問いに答えよ。危険率は5%で検定すること。
(1) X=25のとき、このサイコロは1の目が出やすいと判定してよいか。
(2) Xが何回以上であればこのサイコロは1の目が出やすいと判定してよいか。

この問題を解いてください。
○投げ?
942132人目の素数さん:03/09/25 22:57
>>940 丸投げは止めてください。教師はできるかできないかを
確認したいのです。とりあえずヒントを出しますから。

6 が出る回数 r を確率変数とするとサイコロがまともであれば、
r は平均 m = 120(1/6)、分散 s^2 = 120(1/6)(1 - 1/6) の二項
分布に従います。これで確率を計算するのは、事実上無理なので、
正規分布で近似することになります。
(1) r ≧ 25 の確率を正規分布表から求めてください。
z = (r - m)/s で標準化するのを忘れないようにしましょう。
(2) 正規分布表から z を求めて、今度は r = m + zs と逆に変換
します。

片側検定(0.05)か両側検定(0.05/2 = 0.025)かは自分で考えてくだ
さい。

それから、どこかで統計スレへと言われても、すぐにこちらに来
ないでください。どちらに回答していいのか困ります。興味があ
る人が少ないので、他の分野にくらべてレスがつく時間が長い傾
向がありますが、どのスレでも大体レスはつきます。
943132人目の素数さん:03/09/26 08:37
>>934 exp の中に入れて x が入ってるのは、
(r-1)log x - x^r * 1/s^r
なので、x^r がネックで内積の形にできないと思う。

>>935 e^x のかわりにexp x と書き、λは入力が面倒なので bに変え
ます。上側累積確率 を q とすると、どれについても
q = exp (-x/b).
x = x_1 ≦ x_2 ≦ ... ≦ x_n になる上側累積確率は、積分が
たくさんでてくるけど、上ので置換すると簡単になって、1/(n!)q^n.
したがって、最小値が x なる上側累積確率は n! * 1/(n!)q^n = q^n.
これを改めて Q とおくと、
Q = (exp (-x/b))^n = exp (-nx/b) = exp (-x/(b/n))
ってことから判断してください。
944132人目の素数さん:03/09/26 23:16
ある正規母集団から大きさ10の標本を抽出して標本平均59、
標本分散31.5を得た。このとき、母平均mは64であるといえるか。
有意水準5%で検定せよ。

これを解いてください
丸投げは止めましょう。電卓片手に計算して、表を引いてください。

小標本で母分散が分からない場合の平均値の検定にはステューデントの t 分布
を使います。なお、下では平均の上線の代りに~ を使います。

標本数 n = 10, 標本平均 X~ = 59, 標本分散 S^2 = 31.5 (だから、S = √31.5)
母平均の推定値 m = 64 のとき、t 統計量 t = (X~ - m) / (S/√n)
は自由度 (n - 1) の t 分布に従います。この値と t分布表の値を比べます。
自由度 (n-1) の両側 5%の t の値を t_0 とすると、
- t_0 < t < t_0 であれば、棄却されません。

なお、t分布の表は教科書の最後の方に載っているはずです。
946132人目の素数さん:03/09/27 23:15
日本人の血液型A,B,AB,Oの比率は4:2:1:3であることが知られている。
ある学校の生徒200人の血液型を調べたところ
A:70人、B:42人、AB:24人、O:64人という結果になった。
この資料は母集団分布に適合しているといえるか。
危険率5%で検定せよ。
この問題を解いてください。
丸投げは止めましょう。電卓片手に計算して、表を引いてください。

カテゴリーデータの観測度数が期待度数に適合するかどうかは、
カイ二乗検定の中の適合度検定を用います。

まず、それぞれの期待度数を計算します。例えばAについては、
E_1 = 200 * (4/(4+2+1+3)) です。他の血液型についても同様
に計算してください。これらの期待度数と観測度数 O_1 = 70,
O_2 = 42, O_3 = 24, O_4 = 64 を公式に代入します。

χ^2 = Σ[i=1;4](O_i - E_i)^2/E_i
= (O_1 - E_1)^2/E_1 + (O_2 - E_2)^2/E_2 + (O_3 - E_3)^2/E_3 + (O_4 - E_4)^2/E_4.
この統計量は 自由度 df = (カテゴリーの数) - 1 = 4 - 1 のカイ
二乗分布に従います。この値が、カイ二乗分布の表の値を比べて
小さければ棄却されません。

初歩の段階では「こういう場合はこの検定」とパターンで覚えるため
に、教科書の例題を何度も解いてみてください。

…あぁ、もうだめ。脈拍が110越えた、関節炎で指がきしむ…。けど、
苦しくて眠れない。
948132人目の素数さん:03/09/28 23:10
離散型確率変数X,Yの分布が
P(X=xi)=pi,P(Y=yi)=qi(i=1,2)
であるとき、以下を示してください。
(1) E(X+Y)=E(X)+E(Y)
(2) XとYが独立な確率変数であるとき
  V(X+Y)=V(X)+X(Y)
949948:03/09/28 23:12
>>948
訂正
(2) V(X+Y)=V(X)+V(Y)
950132人目の素数さん:03/09/28 23:57
>>948
基礎の基礎の公式なんだから、こんな所にすぐに丸投げしないで自分で
調べてね
951132人目の素数さん:03/09/29 04:29
多変量解析について根本的なこと聞きたいんですが
主成分分析,判別分析,重回帰分析って
それぞれ具体的にはどういうときに使うんですか

現実問題で使う時にどういうときに
どれを使えばいいのかわかりません
952948:03/09/29 23:14
>>948
(2)の途中で、E(XY)=E(X)E(Y)を示すところが出てくると思います。
そこだけお願いします。
953しょうがねえなあ:03/09/30 00:19
>>952
V(X+Y)=V(X)+V(Y)+2cov(X,Y)だが
cov(X,Y)=E{(X-E(X))(Y-E(Y))}=E(XY)-E(X)E(Y)であり
X,Yが独立のときE(XY)=∫XY*h(X,Y)dXdY=∫XY*f(X)g(Y)dXdY
=∫X*f(X)dX∫Y*g(Y)dY=E(X)E(Y)となるためcov(X,Y)=0となり
題意が証明された
953さん、あげあしを取る気はありませんが、948さんは離散型を聞いてるみたいですよ?
まあ、ほとんど∫が狽ノ変わるだけだと思いますが。
955948:03/09/30 23:19
離散型で、お願いします。
956953しょうがねえなあ:03/10/01 19:01
>>955
X,Yが独立のときE(XY)=ΣXY*h(X,Y)=ΣXY*f(X)g(Y)
=ΣX*f(X)ΣY*g(Y)=E(X)E(Y)となるためcov(X,Y)=0となり
題意が証明された
>>951
「現実問題」って言われてもジャンルによって違うでしょうし、なんとも漠然としすぎて答え
ようがありません。

ちなみに私の場合、主成分分析はポジショニング・マップを作るときに使ったりします。

重回帰分析は“全体”に対する“構成要素”の影響の度合いを測るために使っています。
多重共線性の問題があるので、間に直交回転の因子分析を挟むこともあります。


ところで、「共分散構造分析って何に使うの?」って上司に訊かれたのですが、
なんて答えれば良いでしょうか?
958132人目の素数さん:03/10/09 09:21
推定量の有効性について質問いたします。
クラメール・ラオの不等式を用いて集中楕円体(y-ν)'Ψ(y-ν)=q+2を
正規分布において1変量で解け。
というというのはどういう方向で進めばいいのでしょうか?
959上位駅弁落ちこぼれ一歩手前から:03/10/10 23:02
標本の期待値と標準偏差
母平均m、母標準偏差σの母集団から大きさnの無作為標本X1.X2.X3,,,,Xnを抽出するとき、
標本平均 X=(X1+X2+X3,,,,+Xn)/n の期待値と標準偏差を求める。
X1.X2.X3,,,,Xnの各々は大きさ1の標本とみなされるから
E[X1]=E[X2]=,,,,E[Xn]=m
σ[X1]=σ[X2]=,,,,σ[Xn]=σ
したがって
E[X]=(E[X1]+E[X2],,,,+E[Xn])/n ←これはまあ理解できる 平均=npじゃないの?と思うが 
=m  

復元抽出の場合 X1.X2.X3,,,,Xn は独立であるから

V[X]=(V[X1]+V[X2],,,,+V[Xn])/n^2 ←??分散=npqじゃないの? 
=σ^2/n
σ[X]=σ/√n

標本平均の標準偏差が母集団偏差にくらべて小さくなることは
直感的に理解できるのですがこの式のつながりがよくわかりません。
どうかお願いします。
前期統計の授業ろくに出ないで落としました。
受験時は偏差値67〜130だったんですが
960上位駅弁落ちこぼれ一歩手前から:03/10/10 23:03
とりあえず
分散の分母にどうしてn^2が来るのか意味不明
961ドキュソ:03/10/10 23:21
これって数Cなんだけどね
文系馬鹿のおれにはよく理解できんのですわ
962test ◆tsGpSwX8mo :03/10/10 23:27
1
130て……。
まぁ、130まで行ってなくてもそゆふうに言うことはできるけどね。
964132人目の素数さん:03/10/11 00:46
>>959
平均がnp、分散がnpqなのは二項分布。この問では、分布の形は仮定してない。
母平均m、母標準偏差σ、X1,X2,...,Xnが独立という3つの条件からE[X]とV[X]を
求めよという問題。
a1,a2,...,anを定数としたとき、
E[a1X1+a2X2+...+anXn]=a1E[X1]+a2E[X2]+...+anE[Xn]  ・・・@
V[a1X1+a2X2+...+anXn]=a1^2*V[X1]+a2^2*V[X2]+...+an^2*V[Xn]  ・・・A
なんていう公式はどんな教科書にも載ってると思うんだが。
a1=a2=...=an=1/n、E[X1]=E[X2]=...=E[Xn]=m、V[X1]=V[X2]=...=V[Xn]=σ^2
を@、Aに代入すればいい。
965132人目の素数さん:03/10/11 00:53
>>959
何がわからないかがわからない。

V(X+Y)=V(X)+V(Y) (XとYは独立)
V(aX)=a^2V(X)

これ知ってれば明らかだと思うのだが
966ドキュソ:03/10/11 01:03
そうですね でも
E(aX)=aE(X)
V(aX)=a^2V(X)
の証明はどこにものってません
967ドキュソ:03/10/11 01:07
自明ですね 失礼しました
大学の教科書と数Cの教科書で記述が違うので
混乱しました 
968132人目の素数さん:03/10/11 01:15
>>967
自明というほどではないけど証明は簡単かと。
証明が教科書に載ってないわけはないと思うが。
969| ・肉・)ノィョゥ:03/10/11 11:43
すみません。
重回帰分析のダミー変数というのはいくつ設けても大丈夫なのでしょうか?

例えば、季節ダミーを設けると「春」「夏」「秋」「冬」とあって
それぞれを
1000
0100
0001
0010

と表して計算しますよね。この場合は季節ダミーは4種類なのですがいくつまでしか計算できないということはあるのでしょうか?
また統計ソフトでダミーも計算できるのでしょうか?

レベル低い質問ですみません
970132人目の素数さん:03/10/11 19:02
>>969
そのまえに、そのダミー変数の作り方おかしくないか?
971132人目の素数さん:03/10/11 21:23
ヤフー・共同通信・民主党のプロパガンダ疑惑
http://news2.2ch.net/test/read.cgi/newsplus/1065869158/

448 :隣の名無しさん :03/10/11 21:00 ID:j0L0UsvD
散レスで申し訳ないのですが、>>248さんご提供の資料でちょっと単純な回帰分析してみました。

民主党投票数=α + β×自民党投票数

結果、
R^2が0.999を超えましたw。状況証拠だけで言えば明らかな作為が見られます。

498 名前:隣の名無しさん 投稿日:03/10/11 21:07 ID:Wu5y+MhF
>>448
相関を出したもっと笑えた

自由民主党 公明党 民主党 日本共産党
自由民主党 1
公明党 0.999624978 1
民主党 0.9998203190.999398175 1
日本共産党 0.998534081 0.99899655 0.998344414 1

        自由民主党    公明党     民主党  日本共産党
自由民主党        1
公明党    0.999624978         1
民主党    0.999820319 0.999398175        1
日本共産党 0.998534081 0.99899655  0.998344414        1

相関0.999以上って....

↑これってどのぐらい不自然なことなんですか?教えてくださいm(__)m
972| ・肉・)ノィョゥ:03/10/11 23:13
>>970
え!?どうおかしいか指摘してください
お願いいたします。・゚・(ノД`)・゚・。 うえええん
T.A.先生が検定すると必ず有意差が出てくるので、
T検定と呼んでいます。
どこのT.A先生か教えて欲しいw
975ダミー変数:03/10/19 21:35
>>972
亀レスごめん

とりあえず、ぐぐったらこんなとこしかなかったが、
ttp://sun.econ.seikei.ac.jp/~kawaji/class03/dat3/dat11.html

>分類変数 季節(春夏秋冬) → ダミー変数 (z1,z2,z3) = (1,0,0) , (0,1,0) , (0,0,1) , (0,0,0)
>ダミー変数は、分類数−1個だけ必要となり、どれかが1またはすべて0の組み合わせとなる。

ってことなので、あなたの書き方に従えば
 春 100
 夏 010
 秋 000
 冬 001
としなくちゃならない。

あなたのやり方のままだと、相関係数がどうなるか、やってごらん。
976ダミー変数:03/10/19 21:38
>>972
あと、変数の数だけれども、一般的には重回帰の説明変数は10個ぐらいが限界と
聞いたことがある。ダミー変数でも同じでしょうね。
他スレで答えてもらえなかったのでこちらで質問します。
解ける方おねがいします。

平均μの指数分布に従う母集団からの大きさnの標本の標本平均をYとするとき

T=(2n/μ)・Y

が自由度2nのカイ二乗分布に従うのってどうしてでしょうか?
978132人目の素数さん:03/10/22 12:44
使う側としては色々手法を発表せんといて欲しい。
方法選択の方法を勉強させんといて欲しい、時間を奪われてかなわんで。
とにかく生物医学系の統計手法はやたらと作られすぎである。
student's tはもはや古い手法であるとかな。
次々と手法を出してくるのは統計研究者が利用側から無視されんようにと、
必要も無いのにわざと「研究」しているように思えて成らぬ。
ためにする「研究」としか思えぬ。どうせ真理発見の方法にあらずして、
各自の主張の人為的根拠にするだけやからな。とくに医療系には
新しい統計分析手法とやらをする導入するクセがあるようやが
雑誌への採択確率を高めて分野内の競争で抜け出る不純動機ためかな。
採択確率への影響には、流布しておらん手法やと審査員には理解できんから
freepassする可能性もあるのではと思ってします。なんとなれば
医学生物系の統計処理には間違いが「非常に」多いという「研究」が存在する。
これが意味することは、審査員は対象論文の統計処理のsectionをpassして
読んでおるということやな。それもあって、生物医学系の統計処理では
新しい手法を今後は作るなというのが私の主張でアール。そして
統計研究者は大学を辞めて保険会社に転職したらよいのでアール。
979132人目の素数さん:03/10/27 01:17
>>978

作る側から言わせて貰えば
>とくに医療系には新しい統計分析手法とやらをする導入するクセがある
とか
>採択確率への影響には、流布しておらん手法やと審査員には理解できん
とかさ、

要するに
前者は、医学生物系の研究者はオリジナルな研究するよりも
とりあえずジャーナル載せときたい、と考える人間が非常に多い。
後者は、医学生物系ではレフェリーすらアホ。
ってことを言いたいんだよね?

自分の研究分野を(結果的に)貶めてどうするよ。
あるスレで最近話題の視聴率の話になって、>>892にある
ttp://www.videor.co.jp/rating/wh/07.htm
を参照して誤差は±いくつと言ってる人がいたので、この
ページの説明は各変量(サンプルから求めた視聴率)間の相
関を考えてないから間違いだと言ったらアホ扱いされたん
ですが、この場合は各変量は独立として考えても良いもん
なんでしょうか。
結局テレビの視聴率による基準なんて半分神秘主義だべ
982。
983。
984132人目の素数さん:03/10/29 23:35
だれか
積率および積率母関数について
さるでもわかるように教えてくれませんか?
よくわからないんですけど
>>977 とりあえず、T = (2n/μ)Y = (2n/μ)(1/n)ΣX = Σ(2X/μ).
さて、2X/μ = x とおくと、X = (μx)/2 だから、
∫[0;X](1/μ)exp(-X/μ)dX = ∫[0;x](1/2)exp(-x/2)dx.
ここで、(1/2)exp(-x/2) = (1/(2^(2/2)Γ(2/2)))x^{2/2-1}exp(-x/2)
なので、2X/μは自由度2のχ^2分布に従う。これは、正規分布変数の2乗 2個
の和の分布ということ。最初にもどると、これをn個まとめるので、正規分布
変数の2乗 2n個の和の分布をする。いいかえると、Tは自由度2n のχ^2 分布
に従う。
>>984 原点周りのr次積率(moment)というのは、確率変数をXとするとき、
X^r の平均にすぎない。r = 1 のときはそのまま普通の平均。r = 1, 2 が分
かれば分散が計算でき、r = 1, 2, 3 で歪度、r = 1, 2, 3, 4 で尖度が計算
できるので便利な存在。

積率母関数(moment generating function)というのは、M'(0) が1次積率、
M"(0) が2次積率、M"'(0)が3次積率、M""(0)が4次積率、… となるように巧妙
にテイラー展開を利用する、積率を産んでくれるお母さんのような関数。

と胡麻化すことにしている。
987ああ:03/10/30 02:43
 ビデオリサーチが関東で依頼しているサンプル世帯は600軒。
毎月25世帯ずつ入れ替えるから2年で全世帯が変る。
対象世帯は統計理論によって無作為抽出。
引き受けてくれた家庭には最高8台までのPM(ピープルメータ)が設置され、4歳以上の家族全員にテレビの見はじめと終わりに個人別ボタンを押してもらう。
それによって世帯視聴率と個人視聴率が記録され、自動的にコンピューターセンターに送られる。
そのサンプル世帯を興信所を使って調べたうえで買収依頼したというのだから手が込んでいる。
まさに無作為抽出した家庭にはどういう人物がいるかも不明であって、露見すれば番組そのものが打ち切りになり、自分も解雇されることは明々白々である。
それなのになぜ、というのがいちばんの問題である。

988132人目の素数さん:03/10/31 01:57
>>984

こういうコト書くのはなんだけど、>986の続き風なことを書くと、
しばしば子を産めないお母さんもいるわけで、
そういう時は、特性関数つかって人工授精させる、と。
989984:03/10/31 15:47
>>986 >>988
ありがとうございます
なんとなくわかりました。
要するに計算に便利だから積率を導くのですね
990132人目の素数さん:03/10/31 16:21
990
991ひみつの検閲さん:2024/05/06(月) 05:45:56 ID:MarkedRes
このレスは権利侵害の申し立てや違法もしくはその疑いにて不可視または削除されました。
削除日時:2016-07-08 19:58:21
https://mimizun.com/delete.html
992。