統計学なんでもスレッド2

このエントリーをはてなブックマークに追加
1 ◆OHr6mNLYV6
(´Д`;三;´Д`)
語って下さい.偉大な統計学を...
質問にはやさしいお兄さんが答えてくれます.

前スレ
http://science.2ch.net/test/read.cgi/math/1012782106/

関連スレ
【 確率論・統計学の実用の仕方 】
http://science.2ch.net/test/read.cgi/math/1041865872/
こんな確率もとめてみたい その1/2
http://science.2ch.net/test/read.cgi/math/1029400897/
■確率制御■
http://science.2ch.net/test/read.cgi/math/1017042903/
2132人目の素数さん:03/11/08 20:04
  数学教えろ!!ひきこもりのくせに、
           中学3年生の翔太が>>2をゲットしちゃいます

>>3 二次方程式ってめっさむずいよね。おしえてよ、ねぇおしえてよ
>>4 えーいいなーー  おれ理科も出来ないんだよね
>>5 まじ数学できんのよ、理系いきたいんだけど おれ、国語はけっこーできるよ!!!!
>>6 あ、おれスカトロならいっぱいもってるよー。 すきなら交換しよ
>>7 いふ あいきゃん せっくす のはなしをしてるの いや、文法ちがうとかいわないでまじ、英語にがてだし
>>8 かてーきょーしのお姉さんと頑張って東大か 京大の 文系にいこーっと
>>9 あーーきも あーーきも あーきも あーきも  あーきも あーきも もぃくぃ
>>10−1000 ひ き こ も り の く せ に 
3132人目の素数さん:03/11/11 18:38
データxが平均60,標準偏差5の正規分布に従うとする。
(1)65≦x≦72となる確率を求めよ。

(2)10個のサンプルの平均が57未満となる確率を求めよ。

文系にできるかー・゚・(ノД`)・゚・ウワァァン
おねがいします。。。
4132人目の素数さん:03/11/11 18:53
>>3
まず標準化。
z=(x-60)/5
で変数変換すると、zはN(0,1)に従う。
5132人目の素数さん:03/11/11 18:59
F(x) は次の条件を満たすとする.
1.単調非増加関数.
2.右連続.
3.F(-∞)=1,F(∞)=0

このとき,任意のa∈(0,1)に対して,F(c)≦a≦F(c-0)となる実数cが存在する.

という命題を証明しようと思ってます.

c=inf{x:F(x)≦a}
とおけば証明できると思い,F(c)≦aまで示すことができました.
しかし,a≦F(c-0)の証明がうまくいきません.
正しいということはイメージで沸くのですが・・・.
どなたか解決して頂けると助かります.
ちなみにこの命題はネイマン=ピアソンの基本補題の証明中に使っています.
6132人目の素数さん:03/11/11 20:20
>>5
>c=inf{x:F(x)≦a}

supじゃないの?
7132人目の素数さん:03/11/11 20:32
supではsup{x:F(x)≦a}=0となるであまり意味がありません.

ちなみに単調非増加とは

x<yならばF(x)≧F(y)

となることをいいます.
87:03/11/11 20:34
まちがえました.

忘れてください.
97:03/11/11 20:34
やば!まちがえた.

ちょっとまってください
107:03/11/11 20:35
まちがえました.
117:03/11/11 20:38
ホントですね.
supならば証明できそうです.

連続投稿すいません.
sup型力士
137:03/11/11 20:56
といったものの・・・.
なんだかこんがらがってきた.

sup{x∈R:F(x)≦a}って存在するの?
{x∈R:F(x)≦a}は上に有界じゃないし.(F(∞)=0より)
下には,有界だと思うけど.
ちなみに下に有界の証明は,

c ∈{x∈R:F(x)>a}をひとつ固定する.
b ∈{x∈R:F(x)≦a}を任意にとるとき,

F(c)>a≧F(b) より,c ≦b
だから下に有界.

やっぱりinfで証明すると思うんですけど.
F(x)は分布関数ではないんですよね.
単調非増加関数なので.
>>13

sup{x∈R:F(x)≧a}では?
15132人目の素数さん:03/11/11 21:31
>>14
そんなのどっちでもいいんじゃ?
c=inf{x:F(x)≦a} とおいたんなら、a<F(c-ε)だから、ε→0とすればa≦limF(c-ε)=F(c-0)
16132人目の素数さん:03/11/11 21:48
>>15さんの言う通りでした.
どっちでも良さそうです.

任意の自然数nに対してa<F(c-(1/n)).
(なぜなら,ある自然数が存在してa≧F(c-(1/n))と仮定すると,
c-(1/n)∈{x:F(x)≦a}
となる.ゆえに,
c=inf{x:F(x)≦a} ≦c-(1/n)
これは,矛盾.)

以上より,a ≦lim F(c-(1/n))=F(c-0)

なるほど.
>>15ありがとうございました.
また,一緒に考えてくれた>>6さん>>14さん>>sup型力士さんもありがとうございました.
>>sup型力士さんもありがとうございました
ワロタ
18:03/11/14 22:03
ぶっちゃけ、>>4サマだけだと答えがわからないのです・・・すみません、答えまでご教授くださいましぃ〜m(_ _)m
19132人目の素数さん:03/11/16 14:26
age
20132人目の素数さん:03/11/16 14:52
>>18
とりあえず出来るとこまで書いて。
21132人目の素数さん:03/11/16 23:52
(1)
Z=(X-60)/5 とおくと.
P(65≦X≦72)=P(1≦Z≦2.4)=P(Z≦2.4)-P(Z<1)=P(Z≦2.4)-P(Z≦1)
後は数表を読め!

(2)
X1,…X10 i.i.d. N(60,5^2)
とし,X'=(X1+…+X10)/10とおくと,
X' は N(60,(5^2)/10)に従う.
Z'=(X'-60)/(5√10)とおくと,
P(X'<57)=P(Z<(57-60)/(5√10))=P(Z≦(57-60)/(5√10))
後は数表嫁!
2218:03/11/17 22:46
>>20
当方、経営学科一年です。
データ分析=統計学という枠組みの単位が与えられている授業を受けています。
度数分布表というやつを前期に習いましたが必死勉強した結果、穴埋め形式でやっとこさ解答は、出来るレベルです。。。
>>21サマ、ありがとうございます
エクセルを使って解けと言われたんですが…
「2500個からなる無作為標本を考える。この標本は平均1,分散2であり,
正規分布ではない分布に従っている」
このとき,標本平均がxより小さくなる確率が0.025となるxを求めなさい。

という問題なんですが,最初の,平均1っていうのは
標本平均の平均という意味なんでしょうか?
2423:03/11/21 14:37
ひょっとして母集団の平均が1で,分散が2という意味でしょうか?
すると,標本平均を標準化すると,中心極限定理から,
平均1,分散2/2500 の正規分布になるんですか?

問題の文章の意味がいまいち把握できてないんです
2523 連続すみません:03/11/21 16:12
一応の答えを出してみたんですが…
1.055 って出たんですが小さすぎるような気がします
2623:03/11/21 16:23
ageないとやっぱり答えてもらいにくいですか…
27132人目の素数さん:03/11/21 16:37
>>26
>>24の考えで正しいと思う。
NORMSINV(0.025)=-1.95996 だから
標本平均がxより小さくなる確率が0.025となるxは
x=1-1.95996*√(2/2500)=0.94456
2823:03/11/21 16:53
>>27
なるほど!
Zが(x+1)/√(2/2500)で,それがー1.95996になって
xに戻すと,0.94456になるということですね。
よくわかりました!ありがとうございます!

できればもう1つ…これはわからなければ飛ばしてもいいっていわれたんですが
「平均480,標準偏差320の分布から抽出して,
 標本平均520になる確率が5%未満であるための標本の大きさを求めよ」
ってあったんですけど,
Z=(520−480)/(320/√n)=0.125√n より
NORMSINV(0.95)*8 したものを平方して
答え173.1547 となったんですが,あってるかどうか判定お願いできますか?
2923:03/11/21 17:30
>>28
2行目は
(x+1) じゃなくて (x-1)の間違いです…
>>28
「標本平均がちょうど520になる」確率は0
「標本平均が520以上になる確率が5%未満になるための標本の大きさ」なら
それであってる。
3123:03/11/21 17:41
>>30
ありがとうございます!
そこは自分も悩んでいるところなんです。
今また教科書を読み直しているところなんですが,
信頼区間というのを使うのかな,とも思ったんですが
それはまた違うのですか?
一様分布の偶数積率は1、奇数積率は0?
>>31
「信頼区間」は、母数が未知の場合に母数の推定に使う。

たとえば「母平均の95%信頼区間」とは、「母平均がその区間内の値であれば、標本
平均が実現値以上または以下になる確率が5%未満になる」ような区間。

確率変数である標本平均のひとつの実現値から、逆に定数パラメータである母平均を
確率的に推定する話なのがややこしい。
(「95%の確率で母平均は95%信頼区間の値を取る」と言ういい方はまずい。母平均は
確率変数ではないから。)

>>28のように母平均がわかっている場合に標本平均の実現値の分布を調べるのは、単
なる普通の順序の確率推測で、「95%の確率で標本平均は440以上520以下の値をとる」
というだけのこと。(標本調査=試行はまだ行う前であることに注意)
3433:03/11/22 00:50
最後の部分の数値訂正。
>>28の例だと「95%の確率で標本平均は520以下の値を取る」あるいは「90%の確率で
標本平均は440以上520以下の値を取る」ですな
3523:03/11/22 11:08
昨日なぜか書き込めなくて返事&お礼が遅れましてすみません
>>33-34
わかりやすい説明本当にありがとうございました!
もう一度教科書の方も読んできっちり理解しなおそうと思います
>>32
確率変数の範囲が a ≦ x ≦ b の連続一様分布の平均まわりのr次
積率は、rが奇数なら 0, 偶数なら ((b - a)/2)^r / (r + 1).

原点まわりなら、(b^(r+1) - a^(r+1))/((b - a)(r + 1)).
待ち行列モデルの問題集を教えて下さい。
お願いします。
38132人目の素数さん:03/11/25 12:57
あげ
39132人目の素数さん:03/11/25 13:04
  ドラえもん。なんで、あの半島は嫌われてるの

  ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄V ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
       / ____ヽ           /  ̄   ̄ \
       |  | /, −、, -、l           /、          ヽ
       | _| -|  ・|< ||           |ヘ |―-、       |
   , ―-、 (6  _ー っ-´、}         q -´ 二 ヽ      |
   | -⊂) \ ヽ_  ̄ ̄ノノ          ノ_/ー  |     |
    | ̄ ̄|/ (_ ∧ ̄ / 、 \        \     |      /
    ヽ  ` ,.|     ̄  |  |         O===== |
      `− ´ |       | _|        /          |
         |       (t  )       /    /      |
                       まず平気で他人のものをパックたり、
                       ウリナラ起源に捏造するからだよ。例えば
                       テコンV、トンチャモン、パワモン、キティ
                       ワンピース、ロンバケ(ドラマ)トリビアの泉、等その他多数
                       茶道、居合、日本刀、合気道、サムライ、相撲、
                       盆栽、弓道、寿司、等その他多数

                       次に人の歴史教科書にケチをつけておきながら
                       自分の国の歴史教科書や、言う事成す事、全てが捏造だらけなんだよ
                       
                       他にも海の名前にケチをつけたり、日本の領土を占領したり
                       日本のマスコミやいろんな団体に不当な圧力をかけたり
                       あげればキリがないね
= 統計解析フリーソフト R =
http://science2.2ch.net/test/read.cgi/math/1062650510/l50
41統計初心者:03/11/25 23:29
素朴な質問です。
男女別で薬物の投与群・非投与群の計4群、各群4例ずつで統計解析を行いたいです。
用いる検定方法は何がいいですか?
できるだけ検出力の高い奴がいいです、、、
宜しくお願いします。
42132人目の素数さん:03/11/27 00:28
互いに独立な確率変数X,Yがともに一様分布U(0,1)に従うとき
X+Yの密度関数をもとめよ

誰か助けてください
超初心者的質問で申し訳ないのですが、
アンケートをとろうと思っているのですが、統計学的には何人くらいとればいいのでしょうか?
例えば10人くらい調べて、3人が男、7人が女だとすると「人間の7割は女性である」というのは間違いですよね?
調べる人数が多ければ多いほど真値に向かって収束されていくと思うのですが、統計学的な最低ラインを教えて下さい
お願いしますm(__)m

44132人目の素数さん:03/11/30 15:24
age
質問させてください。
まったくの初学者が統計学を勉強するときに、最適な参考書を教えてください。
>>45
統計の初心者なのか
数学の初心者なのか
高校数学くらいはできるのか

初心者のうちは書店に並んでるやつを眺めて買うのが一番いいと思う。
4745:03/11/30 21:17
すいません。肝心なことを書き忘れていました。
高校数学くらいはなんとか出来ます。
お願いします。
50132人目の素数さん:03/12/03 01:33
>43
1人
だって100ぱーになんじゃん
51132人目の素数さん:03/12/05 01:18
(順位A)  (順位B)
9        9
3        3
12       11.5
5        6
8        10
14       13
1        1
7        5
6        4
11        11.5
4        7
2        2
15        15
13        14
10        8

見づらくてすいません。A,Bのスピアマンの順位相関係数を
求める手順(具体式)を教えていただけませんでしょうか?
おそらく0.949あたりになるはずなのですが、何回やっても0.976・・・
52132人目の素数さん:03/12/05 01:26
私がやったのは
ttp://aoki2.si.gunma-u.ac.jp/lecture/Soukan/spearman.html
の「同順位がある場合」を参考にしまして、

SUMPRODUCT(A,B) = 28.5
Ta=(15^3-15) / 12 =280
Tb={ (15^3-15) - (11.5^3-11.5) } / 12 = 154.2188
から
(280+154.2188-28.5) / 2 / SQRT(280*154.2188) = 0.976219
となってしまうのです。

CORREL(A,B)だと0.949062041になるのですが、どこが間違ってるのでしょうか?
>>51-52 入れる公式。青木先生のところにちゃんと公式が書いて
あるから、確認してみよう。

1 - 6 * 28.5 / (15^3 - 15) = 0.949... でしょ。
5453:03/12/05 02:43
ごめん、寝惚けてた。
公式は、
r_s = (Σx^2 + Σy^2 - Σd^2) / (2√(Σx^2y^2))

r_s = ((n^3 - n) - 6Σd^2 - (T_x + T_y) / 2) / √((n^3 - n)^2 - (T_x + T_y)(n^3 - n) + T_xT_y)
だった。ノンパラ久しぶりだから…。
5553:03/12/05 02:59
ごめん、完全に寝惚けてる。
上の公式は、
r_s = (Σx^2 + Σy^2 - Σd^2) / (2√(Σx^2Σy^2))
下の公式は多分、大丈夫だけど、まぎらわしいから
S_x = Σ(t_i^3 - t_i) (t_i はタイの数) と書き直そう。
r_s = ((n^3 - n) - 6Σd^2 - (S_x + S_y) / 2) / √((n^3 - n)^2 - (S_x + S_y)(n^3 - n) + S_xS_y)
君のは、下の式の別ヴァージョンだけど
T_x = (n^3 - n) - S_x を使ってるようだから、
Σd^2 の係数が落ちていると思う。
5651=52:03/12/05 12:50
>>53-55
ありがとうございます。
教えて下さった式に値を放り込んでみたのですが、
どうしても0.9490・・・になりません(T_T)

たぶん私が根本的なところで間違ってる(代入間違い?)のだと思うのですが、
よろしければ>>51から計算した具体的な数字を入れた式を書いていただけませんでしょうか。

これは学校で出た問題なのですが、青木先生の所の式を使うように
言われてしまっていて、つらいです・・・
5751=52:03/12/05 15:29
すいません、試行錯誤してるうちに解けてしまったようです(?)

>>51のデータだと、
同順位は11位だけだからn_x=1
で、11位は2個あるからT1=2

っていうことでいいんでしょうか・・・数字はあったのでこういう事かしら(?_?
58132人目の素数さん:03/12/08 20:16
ある集団の比率を求めるのに必要な最低限の人数は?
…って問題なんですが、是非解説をお願いします
じぇんじぇん分かりません…

正確には、ある制度の比率を推定するのに必要な最低人数を求めよ
です
誰か分かる方いらっしゃいませんか???
60132人目の素数さん:03/12/11 01:32
>>59
有意水準が与えられないと求められません。
その問題解くには、二項分布とか中心極限定理とか知ってる必要があるけど
君、知ってるの?

と、遅レスしてみた。
61132人目の素数さん:03/12/16 22:51
下がりすぎ
62132人目の素数さん:03/12/18 19:55
標本抽出の偏向を修正する方法・技術について説明しているお勧めの書籍などありましたら教えてください。
>>62
競馬?
64麻雀偏差:03/12/26 21:02
麻雀でじぶんの実力をはかるために平均順位というものがあります。
麻雀は4人でやりますので、1位、2位、3位、4位をとる可能性があります。
少ない試合数だと実力を測定するには偏りがあると思うのですが、何試合うてばまず誤差のない自分の平均順位を知ることができるのでしょうか?
数学でこれを求めることはできるのでしょうか?
65132人目の素数さん:03/12/28 16:06
無限区間で一様分布は定義できないんですか?
また、そういう試みって無いんでしょうか?
無限倍したら1になる数、っていうのを
作ったらなんとかできそうな気がしますが。
66132人目の素数さん:03/12/28 20:08
>>64
1着から4着までをとる確率をp1,p2,p3,p4(p1+p2+p3+p4=1)とする。
今n回麻雀をやって、各着順の実現値がn1,n2,n3,n4(n1+n2+n3+n4=n)とすると、
平均着順の推定値は、(n1+2*n2+3*n3+4*n4)/n
これの分散を求めて正規近似して条件を求めればいいよ。
平均は p1+2*p2+3*p3+4*p4。分散はちょっとややこしいな。
(p1*(1-p1)+4*p2*(1-p2)+9*p3*(1-p3)+16*p4*(1-p4)-2*(2*p1*p2+3*p1*p3+4*p1*p4+6*p2*p3+8*p2*p4+12*p3*p4))/n
かな?まちがってるかもしれんけど。

で、この分散をVとすると、たとえば確率99%で誤差が上下0.1以内、とかなら、
2.58*V^0.5<=0.1なんで、
n>665.64×(上の分散の分子)になる。
2.58が正規分布の0.005%点。有意水準を変えたきゃここを変えればいい。

p1〜p4はわからんから、p1+p2+p3+p4=1、各pi>=0の条件の下での(上の分散の分子)の最大値を求めて、これを
mとでもすれば、
n>665.64×mが答えになる。


>>65
一様の意味を、同じ長さの区間内の値を取る確率はすべて等しい、という
普通の意味で考えると無理だね、やっぱり。確率の定義を根本から変える
必要があるし、そんなのが仮にできても現在の測度論は使えないし、意味
のあるものにはならないんじゃないかな。
67麻雀偏差:03/12/29 02:44
>>66
詳細なレスありがとうございます
私確率についていまいちわかっていないので、レスについてじっくり考えさせていただきます。

質問があるのですが、n回麻雀をやって各着順の実現値がn1,n2,n3,n4(n1+n2+n3+n4=n)とあります。
この実際のデータがなければ、誤差は求めることは出来ないのでしょうか?
また正規分布ではなくて、2項分布を使うことは可能なのでしょうか?
>>67
いや、実現値って書いちゃったけど、n1,n2,n3,n4は確率変数と見て条件は出してるよ。
最後のnの条件にはn1,n2,n3,n4がいくらかって条件は使ってないでしょ。
実際のデータは実際に自分の着順の平均の推定値を求めるのには当然必要。

あと、2項分布じゃなくて正確にはこれは多項分布。だから分散の形が複雑になってる。
そのまま多項分布としてみても条件は出せるかもしれないけど、普通は回数多くなると
正規近似してしまう。2項分布の場合ですら計算が非常にめんどくさいから。

あと、誤差を求める、ってのはあんまり言い方が正しくない。あくまで確率・統計の世界
だから、誤差が〜以内になる確率が〜%以下になる、という言い方をする。
標準正規分布から無作為に5個の標本Z1,・・・,Z5を抽出するとき((Z1+Z5)^2)/2の分布はどんな分布に従うか
という問題が分かりません
感覚的にはカイ二乗分布だと思うのですが・・・
70132人目の素数さん:03/12/31 05:29
良スレage
>>69
自由度1のカイ二乗分布であってるよ。
Z1+Z5がN(0,2)に従う→(Z1+Z5)/√2がN(0,1)に従う→((Z1+Z5)/√2))^2はχ^2(1)に従う
という具合。
>>71
ありがとうございます
73132人目の素数さん:04/01/06 23:26
「仮説検定とは何か」についてレポートを出されて、今仮説検定を勉強しています。有意水準は0.1、0.05、0.01などの値に事前に定めると教科書には書いてありますが、1%と10%では全然ちがうものだと思うのですが、どのように有意水準を決めるべきでしょうか?
有意水準っていうのは、仮説が正しいけど間違った決定をする(第1種の過誤)確率。
だから小さい方がいいに決まっている。

だけど、間違い方にはもうひとつあって、仮説が間違ってるけど、正しいと決定してしまう場合(第2種の過誤)もあって、
これは同じ標本数なら有意水準が小さいほどその確率が大きくなってしまう。

だから、第1種の過誤、第2種の過誤のどちらの確率を小さくしたいか、とり得る標本数はどの程度か等を総合的に判断して
有意水準を決定するのが望ましい。

でも一般には教科書に書いてあるとおり、有意水準を1%か5%にすることが多い。
75132人目の素数さん:04/01/07 01:31
統計初心者です
わからないので教えてください!!!!
Zが標準分布に従うときE〔Z^k〕(k=1.2.3・・・)を求めよ
76132人目の素数さん:04/01/07 01:44
>>75
標準分布というのは
標準正規分布のことかな?

f(Z)を確率分布として
期待値の定義から

E[Z^k]=∫Z^k f(Z)dZ
77132人目の素数さん:04/01/07 01:50
76さん本当にありがとうございました^0^
わかりました!!!!
78132人目の素数さん:04/01/07 01:59
XとYは独立でE〔X^2〕<∞、E〔Y^〕<∞とする。
このとき
VAR〔aX+bY〕=a^2VAR〔X〕+b^2VAR〔Y〕
ってどうやるの?
79132人目の素数さん:04/01/07 02:02
>>78
分散の定義通り計算
plimについてよくわからないのですが、
試行回数n、成功確率pの確率分布があるとき、
成功した回数Xについて、
plim[n→∞](X/n)=p は正しくて、
plim[n→∞](X-np)=0 は正しくないというのを説明せよという問題を出されたのですが、

plimの定義の式で、
plim[n→∞]Xバー=μ とあったので、
plimというのは期待値に収束するのだと思い、
E(X)=npより、
E(X/n)=p E(X-np)=0となるからどちらも正しいのではと思ったのですが、
どこが間違っているのでしょうか?
81132人目の素数さん:04/01/07 02:11
>>80
plimを普通のlimと同じだと思っている時点で間違い

>plimの定義の式で、
>plim[n→∞]Xバー=μ とあったので

何をこのように書くと定義されているのか?
その元の命題を無視して
表現だけをみて期待値に収束だのなんだのいうのが間違い。

82まお:04/01/07 02:13
X=σZ+μとおく。ただしZは標準正規分布に従い−∞<μ<∞、σ>0のとき
cov(X,X^2)
VAR(x^2)を求めよ
をすいませんが教えてください。
83132人目の素数さん:04/01/07 02:16
>>80
∀ε>0,
lim P(|X~(n) -μ|<ε) =1 (n→∞)



X~(n) =X/n
μ=p

X~(n) =X-np
μ=0

をそれぞれいれたら明らか。
84132人目の素数さん:04/01/07 02:20
>>82
μとσって何かの期待値と標準偏差か?
85まお:04/01/07 02:21
これ以外何もかいてないんです。。
すいません、お手数おかけして、、
>>84
ただの実定数じゃないの?
>>82
定義どおり計算してみな。
Cov(X,Y)=E(XY)-E(X)E(Y)
Var(X)=E(X^2)-(E(X))^2
88まお:04/01/07 02:31
ごめんなさい、ありがとうございます
詳しい計算方法を教えていただけますと
本当に嬉しいのですが!!!!
すいません。。
何故自分の手を動かそうとしないんだ
90私も初心者:04/01/07 02:38
Φ(x)を標準正規分布の分布関数とする。
すなわち
Φ(x)=∫xから−∞ (1/√2π)e^-t^/2dtである。ただしxは実数。
このときG(x)=Φ(ax)は正規分布N(0.1/a^2)
の分布関数となることを示せ。a>0

の解法おしえてくれませんか?
91まお:04/01/07 02:39
すいません、ご親切にありがとうございます
統計全くやったことなくて
今日だされた課題に困っていまして。。、
92まお:04/01/07 02:39
ご面倒じゃなかったらやり方少しでよいのでお願いします
9380:04/01/07 02:44
>>81
>>83のlim P(|X~(n) -μ|<ε) =1 (n→∞)
という式は書いてあったのですが、
実際これを問題でどう使っていいのかわからず、
plimの見た感じの意味で解こうとしていました。

>>83
解説どうもありがとうございます。
plimの定義の式の使い方がわかりました。
それに代入すると明らかというのが
今考えていてまだ少しわからないのですが、
もう少し考えてみます。
>>92
Zの確率密度関数はf(t)=1/√(2π)exp(-t^2/2)なんだから
E(X・X^2)=∫[-∞,∞](σt+μ)・(σt+μ)^2f(t)dt
E(X)=∫[-∞,∞](σt+μ)f(t)dt
E(X^2)=∫[-∞,∞](σt+μ)^2f(t)dt
などを計算すればいいのでは?積分域を[0,∞)と(-∞,0]にわけてそれぞれの領域で
t=+√(2u)、t=-√(2u)などと変換すればΓ関数の値をもとめる問題に帰着できるハズ。
やってないから自信ないけど。
95私も初心者:04/01/07 02:50
んー
場合分けするってことですか?
標準正規分布については、
E(Z)=0,E(Z^2)=1,E(Z^3)=0,E(Z^4)=3
となる。3次、4次はモーメント母関数とかキュムラント母関数を知っていれば簡単に求まるし、
4次ぐらいまでは覚えていてもいいぐらい。

これから、
E(X)〜E(X^4)までも求まるよね?
例えば、
E(X^3)=E(σ^3*X^3+3μ*σ^2*X^2+3μ^2*σX+μ^3)
=σ^3*E(X^3)+3μ*σ^2*E(X^2)+3μ^2*σ*E(X)+μ^3
=3μ*σ^2+μ^3
ってかんじ。もちろん、ZがN(μ,σ^2)に従うことからいきなり求めてもいい。

で、
Cov(X,X^2)=E(X^3)-E(X)E(X^2)
Var(X^2)=E(X^4)-(E(X^2))^2
に代入すれば答えが出る。

前者が2μ*σ^2、後者が4μ^2*σ^2+2σ^4になると思う。
>>96
ZがN(μ,σ^2)に従うことから→XがN(μ,σ^2)に従うことから
の間違い
98まお:04/01/07 02:59
すっごい感謝です!
本当に本当にありがとうございました!!!
恩義を忘れません!
99132人目の素数さん:04/01/07 03:05
Xは平均λのポアゾン分布
f(x|λ)λ^x*e^−λ/x!
x=0.1.2.3...
に従うとする。
λ>0は未知
このとき指数分布族に従うことを示せ
また自然母数自然母数空間を明示せよ

を詳しく教えてください
期末試験対策で勉強してますが
よくわかってません。
上のかたがた同様初心者ですので
できるだけ詳しく教えていただけると
助かります
よろしくおねがいします
100132人目の素数さん:04/01/07 03:41
>>75
標準正規分布の密度関数に関する式
(1/√(2π))∫[-∞,∞]e^(-z^2/2)dz=1 においてαを正数としてz=(√α)xと置換して
(1/√(2π))∫[-∞,∞]e^(-αx^2/2)dx=α^(-1/2) が成り立つ。
両辺をαでn回微分し、α=1を代入すると
(1/√(2π))∫[-∞,∞](-x^2/2)^n * e^(-x^2/2)dx=(-1/2)(-3/2)・・・{-(2n-1)/2}
(1/√(2π))∫[-∞,∞]x^(2n) * e^(-x^2/2)dx=(2n-1)!!
標準正規分布の密度関数は偶関数なのでkが奇数のときE[z^k]=0
よって  E[z^k] = 0(kが奇数のとき) 、 (k-1)!! (kが偶数のとき)
>>99
なんか問題が変だけど、ポアソン分布が指数分布族の形になることを言えばいいんだったら

1/x!*exp(xlogλ-λ)

ってかけるから明らか。
自然母数空間は、expの中のxの係数を母数と見たとき、そいつが取る範囲。
(-∞,∞)でよいよ。
102132人目の素数さん:04/01/07 03:55
>>100
本当にありがとうございました!
感激しました!!!!!
103おしえてちゃん:04/01/07 04:14
X1、X2、X3・・・Xnをベルヌーイ分布
fθ(x|θ)=θ^x(1-θ)^1-x
x=0.1
θ∈(0.1)
からのランダム標本として
X={X1、X2...Xn}とし
S(X)=Σnからi=1とする
S=sがあたえられたときXの条件付確立
P(X=x|S=s)がθに依存しないことを
示すことにより
Sがθの十分統計量であることを確認せよ

おしえてください!
おねがいします
104132人目の素数さん:04/01/07 05:15
>>74 ありがとうございます!何となくわかりました。
105132人目の素数さん:04/01/07 12:12
すごく根本的な質問ですみませんが、仮説検定をすることで一体何がわかるのでしょうか?レポートの問題に出されたんですが、うまくまとめられません…
106132人目の素数さん:04/01/07 12:29
>>105
教科書を読め
107132人目の素数さん:04/01/07 17:25
根本的な質問ですみませんが、仮説検定をすることで一体何がわかるのでしょうか?レポートの問題に出されたのですが、よくわかりません…
「指数分布の原点周りの3次積率と平均値周りの3次積率を求めよ」という問題なのですが、
原点周りのやり方はどうにかできるのですが、平均値周りの積率が上手く求められません。

よろしくお願いします・・
>>103
問題を修正

> X1、X2、X3・・・Xnがベルヌーイ分布
> fθ(x|θ)=θ^x(1-θ)^1-x
> x=0, 1
> θ∈(0, 1)
> に従う独立な確率変数とする。
> Y={X1、X2...Xn}とし
> S(Y)=ΣXi(i=1 to n)とする
> S=sがあたえられたときYの条件付確率
> P(Y=y|S=s)がθに依存しないことを示すことにより
> Sがθの十分統計量であることを確認せよ

位にしておかないとNotationが混乱しててよくわかりません。
>>107
仮説を検定することができます。
検定結果を見て意思決定等を行います。
統計のエロイ人がいるみたいだ。勉強なるな。
112132人目の素数さん:04/01/08 01:09
こんなん聞いてもいいんですかね・・・
分散(Sx^2)というものがありますよね。
あれは、平均偏差を2乗した総和を平均して求めるのですが、
なぜ2乗するのかについては、本によると符号を統一するため、
とあります。
しかし、符号を統一するなら絶対値を取ればいいじゃないかと
思うのですが、なぜわざわざ2乗するんでしょうか。そのあと
ルートに放り込んで標準偏差を出すなら最初から平均偏差の
絶対値を取って、それらを平均した数値を標準偏差とすれば
簡単な気がするのですが。

共分散を求めるときに変数X、Yの平均偏差を掛け合わせますが、
それと合わせるためなのでしょうか。
>>112
絶対偏差の概念もないわけではないですし、時々使われます。ただ、
∫|x|dxと∫x^2dxなら、どちらが数学的に扱いやすいか、というと断然後者です。
もし、あなたが、「標準」として∫|x|dxか√∫x^2dxのどちらかに決めなければいけない
としたら当然後者にしますよね?
しない、というのなら基礎から積分なりを勉強しなおすべきです。

絶対値の平均よりは2乗の平均の方が断然(数学的には)簡単かつ応用が利くものなのです。
絶対偏差の平均より2乗の平均の方がよく使われるのは数学的な有用度故と思っていただいて
かまいません。
よくわかりました。後者の方が明らかに平易で扱いやすいですね。
結局、標準偏差を単独でポンと求める程度の段階では有用性は
あまりわからないが、もっと深い部分まで勉強していき複雑な数式を
駆使する段になると有用性が分かってくるのかもしれません。
>>114
その通り。共分散との整合性もその一例です。
116132人目の素数さん:04/01/08 02:05
ごめんなさい統計の途中の
決定係数が上昇するとt値の絶対値も上昇するという
証明にでてくるのですが
0<(A^2/B)<(C^2/D)<1
ならば
|(A/B)|<|(C/D)|
ということはいえるのでしょうか?

117質問をかえます。:04/01/08 02:17
単純回帰分析でX値を変化させて
決定係数をあげたとき
かならず回帰係数のスチューデントのt値の絶対値は前回と比べて
おおきくなるのでしょうか?
118>117:04/01/08 13:42
なるなり。
回帰係数を固定して、xの変動幅を大きくすると回帰係数の標準誤差が小さくなるので(x^2が分母にくるから)、回帰係数をその標準誤差で割ることによって作られるt統計量はかならず大きくなるなり。
119カイ2乗検定:04/01/08 15:46
カイ2乗検定についてお訊ねします。いわゆる多項分布の検定(与えられた観測個数
がある比率に従っているかどうか)の場合に、
χ^2=Σ(観測個数-期待値)^2/期待値
が公式として本に載っているのですが、自分としては何故期待値で割るのかが納得
できません。カイ2乗分布の定義からすると、例えば2項分布の時はサンプル数が十
分に大きいとき(np,np(1-p))の正規分布に近似できるので、
χ^2=Σ(観測個数-np(=期待値))^2/np(1-p)
ではないかと思うのです。先ほどの式と比べると分母部分が明らかに違います。
公式の証明をネット上で探したのですが、高度な数学知識が要求されるのでここで
は証明をとばす、という表現があったりして、なかなか見つかりません。
初歩的な質問かも知れませんが、どなたか分かる方がいらっしゃいましたら、よろ
しくお願いします。
>>119
ほかに詳しい人がカキコしてくれるかもしれませんが、
手元にある統計の本を見てみたら、
・「確率・統計入門」小針あき宏著 岩波書店
・「確率・統計」篠原昌彦著 朝倉書店
に書いてありました。小針の本から引用すると、次のようになります。
p.191命題7.11
母集団Eが、互いに共通部分のないn個のグループE_iから構成されており、
ランダムに選んだ一つの個体がE_iに属する確率がp_iであるとする。
いまその手段からランダムにN個の個体を選び、そのうちE_iに属するものが
x_i個であったとすると、Nが十分大きいとき
χ^2=Σ[i=1,n] (x_i-p_iN)^2/p_iN
は自由度がn-1のχ^2分布に従う。

証明は5ページにわたっていて難解ですが、丁寧に書いてあるので
一度目を通してはどうでしょうか。
121カイ2乗検定:04/01/08 19:30
>>120
ご返答ありがとうございます!今度探して読んでみます。しかし、証明に5ペ
ージ!やはり難解な証明だったんですね。それにしても、
χ^2=Σ(xi-p_iN)^2/p_iN
がカイ2乗分布に従うのは分かったのですが、前述の
χ^2=Σ(xi-p_iN)^2/p_iN(1-p_i)
もカイ2乗分布にしたがうような気がします。でも値は違うし、数学的な意味
の違いは何なんですかね?上の方は適合度をみるわけだから、期待値からのず
れを表しているというのは何となく分かるのですが...。

最近統計学の基礎を勉強し直し始めたのですが、統計学ってごく基礎的なこと
でも深く考えると、意味がイメージできなかったり、証明ができなかったりし
て奥が深いですね。使うだけなら、プログラムや例題に当てはめるだけでもで
きるんでしょうけど。もっと勉強せねば。
>>121
たとえば、n=2の時で、E1の確率がp、E2の確率がqとして、N回試行したときのそれぞれの回数がX1回、X2回とすれば、

(X1-Np)^2/(Npq)=(X2-Nq)^2/(Npq) (p+q=1、X1+X2=Nより)
は、自由度1のχ^2分布に(近似的に)したがうよ。でも当然足すとダメ。

(X1-Np)^2/Np+(X2-Nq)^2/Nqを上の関係式(p+q=1、X1+X2=N)に注意して計算したら、(X1-Np)^2/(Npq)になることは
すぐわかると思う。

これを一般のnに拡張したと思えばいい。っていってもそう簡単ではないが…。
123おしえてちゃん:04/01/08 22:58
X1、X2、X3・・・Xnがベルヌーイ分布
fθ(x|θ)=θ^x(1-θ)^1-x
x=0, 1
θ∈(0, 1)
に従う独立な確率変数とする。
Y={X1、X2...Xn}とし
S(Y)=ΣXi(i=1 to n)とする
S=sがあたえられたときYの条件付確率
P(Y=y|S=s)がθに依存しないことを示すことにより
Sがθの十分統計量であることを確認せよ
何度もごめんなさい
教えてください・・・・・!!!
>>123
y=(y1,y2,…yn)とすると、
P(S=s)=nCsθ^s*(1-θ)^(n-s) (足してsってことはX1,…,Xnのどれかn個がs)
P(Y=y,S=s)=θ^s*(1-θ)^(n-s) (y1+…+yn=sのとき)
     =0 (その他)

よって、
P(Y=y|S=s)=1/nCs (y1+…+yn=sのとき)
=0 (その他)
だから、これはθに依存しないんで、Sはθの十分統計量といえる。

例えばn=3で、合計が2になる確率は3θ^2*(1-θ)
で、これを別々に分解しても、(1,1,0),(1,0,1),(0,1,1)それぞれをとる確率はθ^2*(1-θ)。

形が定数倍の差だけだから、合計が2である確率が分かってしまえば、個々の確率もわかってしまう。
これが、合計2だけじゃなくどんな状況でも起こるから、合計が分かってしまえば、それ以上どんな
に細かいことがわかってもθについて新しい情報は得られない、ってことになる。

これがθについて十分だ、充足だ、っていう意味。
125カイ2乗検定:04/01/09 00:42
>>122
おお、なるほど!Σ(xi-p_i*N)^2/p_i*Nというのは、Σの中の一つ一つの成分が
カイ二乗分布に従うのではなくて、すべての場合が足された状態で初めてカイ
2乗分布に近似されるということですね。勘違いしていました。

二項分布の場合はたまたま
Σ(xi-p_i*N)^2/p_i*N
の合計が近似された正規分布からの値である
(xi-Np)^2/Np(1-p)
と同じになるけれど、多項の場合は独立性の問題から、個々にこの値を
だして計算できないというところに期待値で割るという、この公式の
意味がある訳なんでしょうか。うーん、間違えているかもしれませんが、
自分的にはかなり納得です。皆さんどうもありがとうございました。
>>125
うーん、まだちょっと勘違いしてるところもあるかな…。

この検定の意味は、各iの要素の確率(p1,p2,…、p_n)が全体として適正かどうかを検出するもの。

各piだけを検定したいんだったら、出た個数Xiっていうのは2項分布Bin(N,p_i)に従う(p_iの確率で1か0か、
っていうN個の独立な確率変数の和だから。)から、近似的にXiがN(Np_i,Npi*(1-p_i))に従うとして検定した
らいい。

XiがN(Np_i,Npi*(1-p_i))に従う、ってことは(Xi-Np_i)^2/Np_i*(1-p_i)は自由度1のχ^2分布にしたがっている
のと同じこと。N(0,1)に従うものの2乗が自由度1のχ^2分布に従うから。
おっしゃるとおり、これらは独立じゃないからそのまま分母が分散のまま足してもχ^2分布になってくれない。

だけど、分母を期待値にして和をとったもの=χ^2和(Σ(xi-p_i*N)^2/p_i*Nのこと)が自由度n-1のχ^2分布
になってくれる(ややこしい証明がいるとこ)。これを使って、(p1,p2,…、p_n)が全体として適正かどう
かを調べられる、ということ。

>>122は要素が2個しかないから、(p1,p2)が適正かどうか、っていうのは片方どちらかが適正かどうかが分かれば
いいわけで、結局、χ^2和(Σ(xi-p_i*N)^2/p_i*Nのこと)の形が、どちらか1個のp_iについてのχ^2検定の形に
なってしまう、というお話。
127おしえてちゃん:04/01/09 01:47
>>124
ほんとにありがとうございます!
わかりやすかったです!
ためになりました!
128132人目の素数さん:04/01/09 02:01
これおしえてください!

X1.X2.....Xnは母数p(0<x<1)の
ベルヌーイ分布に従うとする
すなわち
P(X1=0)=1-p
P(X1=1)=p
ことのき
Un^2=1/n−1煤ii=1,n)(Xi−Xn)^2
→a.s p(1-p)          ↑バーがついてる
ただし
Xn=1/nXi
↑これもバーがついてる
が成立することをしめせ
(大数の強法則を用いて)


おねがいします!
129カイ2乗検定:04/01/09 02:27
>>126
要は各piを個別に見るときは、正規近似した分散で割ることによって、
χ^2分布から適合度を見ることができるけれど、独立性の問題から、
個々の各piの、分散で割ったχ^2の値を足すことで全体の適合度を見る
ことはできない。そこで期待値で分母を期待値にしたものの総和がχ^2
分布に従うという性質を利用して全体の適合度を見るということですね。
納得いたしました。ありがとうございます。
130129:04/01/09 02:44
すいません、文章変ですね。そこで、のあとの、期待値で、はいりません。
申し訳ないです。
131132人目の素数さん:04/01/09 03:26
128です
すいません、どなたか教えていただけないでしょうか。。。。
よろしくおねがいします
単回帰分析をして、R2、パラメータの値、パラメータのt値を読み取り各国別に結果からどんなことがわかるか考察しろって問題をだされたんだけど。助けて。

個人消費(constant_1987_US$)に対するGDPの変動
y=a+bx y=GDP_at_market_prices_(constant_1987_US$) x=Private_consumption__etc._(constant_1987_US$)

個人消費(constant_1987_US$)に対するGDPの変動
       日本   豪州  サモア  インドネシア
R2     0.99    0.99  0.369    0.965
個人消費 1.762   1.588  0.7331   1.85
t値     100.53  70.27  3.747    26.07

っつか、質問分自体に間違ってるとことかある? 自分じゃわからん。

一応自分の精一杯の考察(になってない?)
→R2は1に近いほど 信頼性がある、t値は絶対値2より上ってことから
 サモアを除く2ヶ国のデータは信頼性が高い?
>>128
Un^2=1/(n-1)*(Xi-Xn(バー))^2 (普偏分散という)の平均は
E(Un^2)=V(Xi)=p(1-p)
このことは普通の統計の教科書なら絶対載ってる。

大数の強法則は、各Xiが独立同分布で、平均μなら、
1/n*(X1+…Xn)→μ (a.s)

ってことだから題意は明らかだよね。

大体想像はつくけど、もうすこしきちんと数式書いた方がいいよ。
普偏分散→不偏分散の間違い
>>133
やっぱりあんまり明らかじゃないな。
もっと詳しい人の書き込みキボン。
>>128
1/n*(Xi-Xn(バー))^2=1/n*((Xi-E(Xi))^2-(Xn(バー)-E(Xi))^2)
=1/n*(Xi-p)^2-(Xn(バー)-p)^2
=1/n*(Xi-p)^2-(1/n*嚢i-p)^2
これはよく使われる式変形。

(Xi-p)^2、Xiはそれぞれ独立同分布確率変数列で、E((Xi-p)^2)=p(1-p)、E(Xi)=pだから、大数の強法則より、
1/n*(Xi-p)^2→p(1-p) a.s. 1/n*嚢i→p a.s.

よって、1/n*(Xi-Xn(バー))^2→p(1-p) a.s.
よって、1/(n-1)*(Xi-Xn(バー))^2→p(1-p) a.s.

n-1で割ってるのは不偏分散を意識したもんでしょう。nをとばせば当然どちらでも分散に概収束する。
>>132
パラメータについての説明もいれなきゃだめだよ。
個人消費の行は多分、係数bのことだよね?

R2、t値から見て日本、豪州は個人消費とGDPに相関があり(t値による検定)かつ、この回帰直線でうまく
関係が説明されている(R2の1に対する近さ)ことがわかる。インドネシアもまずまず。

よって、この回帰直線で各国のGDPの個人消費に対する感応度が比較でき、インドネシア、日本、豪州の
順に感応度が高いことがわかる、というようなことを書けばいい。
138132人目の素数さん:04/01/10 05:31
良スレage
139132人目の素数さん:04/01/10 16:03
確率変数Yが母数λの指数分布
fY(y|λ)=λe^(-λy)*T(0.∞)
に従うとする
ただしλ>0
ことのきYの期待値E[Y]を求めよ

をおしえてください
お願いします
>>139
1/λ。普通に積分しなさい。
141おしえてちゃん:04/01/11 01:58
X1.X2....Xn(n≧2)を正規分布N(μ、σ^2)からの
大きさnのランダム標本とし
X(1)、X(2)、、、X(n)
(X(1)≦X(2)≦、、、≦X(n))を
その順序統計量とする
mn=(n+1)/2 (nが奇数)
  =n/2  (nが偶数)
とおきZn=X(mn)を標本メデアンとする
X1のメデアンはμとなることを示せ
更に√n*(Zn-μ)はどのような分布に収束するか答えよ

って解説回答いただけないでしょうか
142132:04/01/11 14:04
>>137
レスありがとう。大学、一般教養の授業の宿題だったんだけど、授業あんまり
まじめに聞いてなかったんで。137さんの指摘を参考にしてやりました。
ありがとう
>>141
>X1のメデアンはμとなることを示せ
は意味不明だよ。X(2n+1)の平均がμになることなら、X(2n+1)-μの密度関数を書いてやれば偶関数になるから平均ゼロはほぼ明らか。

√n*(Zn-μ)の極限分布は、結論だけ言えばN(μ,(π/2)*σ^2)。

一般に、uをF(u)=1/2なる点とすれば、√n*(Zn-u)の極限分布はN(0,1/(4*f(u)^2))になる。
証明はスターリングの公式とかを使えばできる。(そう難しくはない。)
今は、元の分布がN(μ,σ^2)だから、u=μで、f(μ)=1/(√(2π)*σ)を代入して答え。
144132人目の素数さん:04/01/12 14:49
143サマありがとうです! でもまだちょっとわからないんでさらに 詳しくお願いできませんか!? すいません、お手数かけます
>>144
どこがどう分からないのか書いてくれなきゃ答えようがないよ。
っていうかこの説明で全体的に何がなんだか、ってんなら今のあなたに理解できる問題じゃないよ。
順序統計量ってどんなものか知ってる? そもそも問題文はあってるの?
146132人目の素数さん:04/01/12 21:30
重回帰分析の寄与率って、どういうデータだったら低くなっちゃうの?
147132人目の素数さん:04/01/13 19:09
上で一度聞いたかもしれないのですが

Zが標準分布に従うとき
E[Z^k](k=1.2.3.4)を求めよ

を詳しくもう一度教えてもらえませんか
よろしくお願いいたします
>>147
>>100見れ。
149132人目の素数さん:04/01/13 19:46

ありがとうございます!!!!
150132人目の素数さん:04/01/13 20:01
X1、X2....Xn(n≧2)をコーシー分布
f(x)=1/πσ*1/1+[(x-μ)/σ]^2*I(-∞.∞)
からの大きさnのランダム標本とし
X(1).X(2)...X(n)
(X(1)≦X(2)...≦X(n))
をその順序統計量とする
mn=(n+1)/2・・・nが奇数
  =n/2・・・・・偶数
とおいて
Zn=X(mn)を標本メデアンとする
X1のメデアンはμになることを示せ
更に√n*(Znーμ)はどのような分布に収束するか

をできるだけ詳しく教えてください
よろしくおねがいいたします
お手数おかけしてすいません
>>150
極限分布は、N(0,(πσ)^2/4)。>>143で、f(μ)=1/(πσ)になるから。

問題があってるなら、X1のメジアンってのは、分布関数をF(x)として、F(u)=1/2となる点uのことのようだね。
よって、F(μ)=1/2になることを示せばいいんだけど、これは密度関数の形を見れば明らかでしょ?

きちんと示すなら、∫[-∞,μ]f(x)dx=∫[μ,∞]f(x)dxとなることを示せばよく、
Y=X-μと変数変換すれば簡単に示せる。>>141も同じね。
152132人目の素数さん:04/01/14 00:55
メデアン

初めて聞いた

メデアン

いい響きだ。


ちなみに、carvatureを
カーベイチャーと書いている本があった。
これまた感動。
153132人目の素数さん:04/01/14 03:06
>>146
どういうデータってのは・・・たとえば、あまり相関のないデータ同士とか、そういう感じか?
それなら・・・
>>147以降に期待(藁
154132人目の素数さん:04/01/14 03:18
151さま
ありがとうございました
本当に感謝してます!!!!!
155132人目の素数さん:04/01/14 03:24
教えてください

Φ(x)を標準正規分布の分布関数とする
すなわち
Φ(x)=∫(-∞.x)(1/√2π)*e^(-t^2/2)dt
である(xは実数)
このときG(x)=Φ(ax)は正規分布N(0.1/a^2)の
分布関数になることを示せ(a>0)

よろしくおねがいいたします。
>>155
t=asって変数変換して積分を書き換えたら明らかだろ?ちょっとは自分で考えろや。
157132人目の素数さん:04/01/14 04:00
>>156
ぜんぜんわからないんです(><)
ごめんなさい
普通の積分でよいのでしょうか?
普通の積分っていうか、t=asって変数変換してΦ(ax)をsの積分の形に書き換えたら、
∫(-∞,x)(a/√2π)exp(-(as)^2/2)dsってなって、積分の中身がN(0,1/a^2)の密度関数になるでしょ?
159pun:04/01/14 04:48
下の期末課題5000円でやってください・・・
ttp://econom01.cc.sophia.ac.jp/sda/
[email protected]
お願いします・・・お金は渋谷池袋新宿辺りで手渡しします。
希望があれば郵送もします。おねがいしまつ。
160pun:04/01/14 04:51
お金を払う理由は時間がかかりそうでお礼なしではもうしわけないからですので、
もし金銭のやりとりがいけないとしたら商品券5000円分もしくは
相当の品でお礼させてください。こまってるのでつ・・・
161132人目の素数さん:04/01/14 11:31
> お金は渋谷池袋新宿辺りで手渡しします

わらた
162132人目の素数さん:04/01/14 11:35
急に勉強したくなったんだけど
そもそもココに書いてある記号、用語の意味がワケワカラン

そんな漏れにお勧めの本教えて〜
(品質管理のことを知りたい場合ココで聞くほうがいいんだよね?)
ココってどこだよ。
品質管理って何の話だよ。
164132人目の素数さん:04/01/14 11:52
>>162
単に統計の基礎を知りたいのであれば
「統計学入門」 東京大学出版会

あたり。
165162:04/01/14 11:55
よく工場でやってる品質管理って統計を使うもの
じゃないのかと思ったんだけど・・・(^_^;

だから数学板でも統計スレの人が詳しいかと・・・
166162:04/01/14 13:06
>>164
アマゾンで探してみます、ありがと
167I != 162:04/01/14 16:39
>>164
それ以外で、エクセルなどで頻繁に使う関数などについてかかれている
統計の本はありますか?
エクセルの本ではなくて。

統計の本を2,3冊手元に置いておきたいので。
168132人目の素数さん:04/01/14 18:27
>>167
言いたいことがよくわからんけど
エクセルのヘルプやエクセル関数辞典を読んで
よくわからんものが出てきたとすれば
とりあえず検索。
何を頻繁に使うかは人それぞれだし
その時に応じて、本を買い足したほうがいい。
169132人目の素数さん:04/01/15 08:02
>>167
縄田先生の本はいかが。Excelによる統計入門
実習形式で読み進められます。
http://www.amazon.co.jp/exec/obidos/ASIN/4254121423/qid=1074121037/sr=1-2/ref=sr_1_10_2/249-4845064-3379515
170169:04/01/15 08:09
うっかりミスでした。この話無かったことにしてください。
171132人目の素数さん:04/01/15 12:06
   , - 、              / ̄7 __    _
  (_   ヽ                /   ハ ヽ / ヽ __  r-、  r‐-,
   `ー' ´         ,-‐' ̄  `ヽヽ ヽl   / / | /  / /  /
  _, -'´ ̄``ヽ  _, -‐-、ヽ_r7  ,ハ )ヽ ヽヽ_,7/ ノ/ / /  /
 /   ,‐ヽ  ヽ '、__rっ )   l / / l ヽ__)  / / / //  /
.(__,/  )  |   / /    L/ (__ノ   ,r‐' ノ __`'´ ヽ_ノ
       l  l    `′       ,、   `ー'´ / ヽ /`ヽ
        /  /          /フ | |  r-、   `ー' `ー′
      L__/        r"> //  | |   ヽヽ
            ,.._   / / { {   ||   〉〉 ,-、
           //  { {  い   | |  /ノ / /  ,、
             { {   ヽヽ、 ヽ`'二_二' /  / /  / ノ
         /7 ヽヽ、   `'-ニ,/´_=;;;;=_ ヽ`ニノ  / /
           { {   `ー-`ニニ /r'゙_ ヽ / _`',`ー-‐'´ノ     r'7
           ヽヽ、    _,.ノl. r 。ヽ| | r'。ヽ!'-ニ二__//
      「`!  `'-`ニニ二-ァ | `ー'_ !」 _ー' |ヾー―---‐'´  ,-、
      l !      ,. -'´ri |l  ‘~`ー'~′ l| r‐`ニニ'ー- 、_//
      ヽ、ヽ--―'ニ ‐'´ {ヾ ! ,r;'ニーニヽ、!l/}ヽ、  ``ー‐'´_
      __ ``'' ''´    /,トミ! ir,!-┴-!、ヾ, !'/\ヽ、_   /ノ
      い、     ///ハ||′-―-、`|||' l ヽ `ヽ、二./
       \`ー―'ニ´‐',/ ! ||!/    ヽl|| lヽ \   ,-、
        ,、 ̄ ,. -'_/ !  ||!______l||  l \`ー‐'´ ノ
          `‐`r―‐'ー-、!  .!'、|_|_|_,ノ!|   L. -‐`ニ ´
             !  「`ヽ、l    ヾー―――'ソ   L..-、  |
          |  |:::::::::l      ` ̄ ̄ ̄´    l::::::|  |
             |  |::::::l               l::::l  l
172132人目の素数さん:04/01/16 02:21
 尺度に対するピットマン推定量の導出方法を教えてください。
>>159
ちょっと面白そうだからのぞいてみた。そんなに難しくないと思うけど。
たとえば、マンチェスターユナイテッド(以下A)とアーセナル(以下B)がマンチェスターUのホームで戦った場合、
Aの得点は、平均187/112のポアソン乱数
Bの得点は、平均216/140のポアソン乱数、から発生させて、
Aの得点を表1のHomeAとAwayBの交点、Bの得点を表2のHomeAとAwayBの交点にかきこむ。
もし、Aの得点>Bの得点ならば、表3のHomeAとAwayBの交点にhome
Aの得点<Bの得点ならば、away
Aの得点=Bの得点ならばdraw
リーグ戦成績表には、それに応じて与えられる勝ち点を書き込むだけだと思う。

>また、リーグ戦を多数回シミュレートした結果から、各チームの「勝点(下の成績表最

とあるから、その一個上の問題は、別に何度もリーグ戦を繰り返す必要がなく、一回シミュレート
すればよいだけに思える。

最後の問題は、以上のプログラムを何度も行うようにすればよい。

home とawayで守備力と攻撃力が何にも変化無いって変なモデルだと思う。

上智大学経済学部か
区間推定で,信頼区間の幅を狭めるには
どうしたらいいんでしょうか…?
175174:04/01/16 18:29
「サンプルサイズを増やす」というやつの他に何が
あるんでしょう?
176132人目の素数さん:04/01/16 20:10
Δxを微少量とする。
Δx→0の時、P{x<X≦x+Δx}→P(Φ)
となると思ったのですが、教科書には
→P{X=x}
と書いてました。なぜだか分かりません・・・
誰か理由を教えてください
177132人目の素数さん:04/01/16 22:47
>>176
P{x≦X≦x+Δx}じゃないの?
 >>176
分布関数がX=xで連続のときは、P(Φ)もP{X=x}も同じでしょ。
その1点を取る確率が0だから。
分布関数がその点でジャンプしているときは、Δx→0の時、P{x<X≦x+Δx}→P{x<X≦x+0}
=P{X=x}でいいんじゃない?
179132人目の素数さん:04/01/17 00:23
>>178
なるほど!ありがとうございます!
180132人目の素数さん:04/01/17 02:14
>>178
>分布関数がその点でジャンプしているときは、Δx→0の時、P{x<X≦x+Δx}→P{x<X≦x+0}
>=P{X=x}でいいんじゃない?

まずいように思う。
離散的な分布関数なんか考えてもらえばわかると思うけど
簡単に言っちゃうと、サイコロで・・・やったら最後の等式は、まずいでしょ?
181178:04/01/17 16:34
>>180
ごめんなさい。考えなしに書いてしまいました。何冊か本をあたってみましたが、どれも
P{x+Δx<X≦x}→P{x+0<X≦x} =P{X=x}
と書いてありました。確かに分布は右連続なのでまずいですね。失礼しました。
182132人目の素数さん:04/01/17 16:42
>>181
P{x-Δx<X≦x}→P{x-0<X≦x} =P{X=x}

じゃないか?(符号が逆)
183132人目の素数さん:04/01/17 18:40
読んで解った気になれる簡単な統計の本ってありますか?
知りたいのは検定周りで、ウィルコクソンの順位和検定あたりまで
難しい数式ヌキで解説してくれていると嬉しいのですが。
184132人目の素数さん:04/01/17 18:57
数式なしでどうやって、統計を解った気になれるのかわからんけど・・・。


無理じゃね?
185132人目の素数さん:04/01/18 13:00
信号の周波数解析,FFT解析をした際にパワースペクトルがでてきます.
横軸周波数,縦軸スペクトル密度のグラフがかけるわけですが,このスペクトルピークが有意であるのかないのかを調べる方法は,

ピークの周波数分布を描き,この分布の平均値および標準偏差より分布の1-α(有意水準α)にあたる両側の部分を信頼区間と考えればよいのでしょうか.
>>185
ピークの周波数分布ってどゆこと?具体的にどう決めるの?
187185:04/01/18 15:02
横軸が周波数の区間で縦軸が頻度のヒストグラムです.
ふーん…。俺は統計屋だから時系列解析はあんまり詳しくないけど、そもそも時系列解析って、
各観測データをひとつの時系列データとしてみて、その周波数なりを分析するんだよね?

統計はあくまで独立な多数の観測データに対して適用する、っていうのが基本的なスタンスで、
この仮定の下に体系が確立してるもの。

だから、理論的にそういうピークの周波数分布みたいなものに、統計的推定を使う根拠はないと
思う。

具体的な分布のイメージがつかめないんだけど、必ずしも正規分布のような形にはならないんじゃ
ないのかな?
189185:04/01/18 17:30
>188
なるほど.
たしかに正規分布にはならないです.
しかし,logをとると正規分布になります.

ではピーク値が0が限りなく近くて,その値に意味がない
あるいは有意であるという判定をするためには
どうしたらよいのでしょうか.
190132人目の素数さん:04/01/18 17:50
SPSSのラーニングエディションを格安で売っている店はありますか?
ビックカメラとか探していますが見つかりません。
紀伊国屋で売っていますが12000円。微妙に高いです。 
>>189
どんなデータでも対数正規になるの?

よく知らないけど、統計的にそういう有意判定をするのは難しいと思うよ。
理由は>>188に書いたとおりでそもそも統計の枠組みじゃないから。
そのやり方を論理的に確立すれば1本論文書けるよ、きっと。
後は、ここで聞くより担当教官に聞いたほうがいいね。
192191:04/01/18 18:10
>>189
学生さんじゃなかったら失礼。
>>188
複数回の「一定期間のサンプリング」が独立であると言えれば
それぞれのサンプリングから得られるパワースペクトルを
独立試行によって吐き出されるベクトルとみなして、ウィルクスのΛ。

これで「何かあったんじゃね?」ぐらいは。無理かな?
194193:04/01/18 19:01
よく読んでなかった。上は無し。
195185:04/01/18 19:24
いろいろ教えていただきましてありがとうございます.

分布のことなのですが,時系列データが正規分布だとすると,
スペクトルは正規分布にもとづく独立2変数の二乗和ということで
Χ二乗分布になるということです.

この分布から95%の信頼区間を求めても
統計的に意味がないのでしょうか.
196132人目の素数さん:04/01/18 19:37
母集団の分布が平均50、標準偏差10であるとき、
ここから20個のサンプルを何回も取り出す。

(1)「このサンプルの平均値」の平均値は理論上いくらか

(2)「このサンプルの平均値」の分散は理論上いくらか

どなたかこの問題の解答を教えて下さい、お願いします
197132人目の素数さん:04/01/18 19:44
>>196
そんなあなたに中心極限定理
198132人目の素数さん:04/01/18 19:48
199132人目の素数さん:04/01/18 20:09
>>196
(1) 50
(2) 5
>>195
意味がないっていうか、それは時系列が正規かつ独立っていう仮定をおいて初めてχ^2が出るわけでしょ?
それを基に検定なり推定なりをするのはおかしい。

スペクトルは時系列データの表現を変えたものにすぎないわけだからね。
普通に全然どんな分布かわからないデータをとってきて、これって標準正規分布のはずだから、3以上の数は
無視しよう、なんて言うのと同じことになっちゃう。
201132人目の素数さん:04/01/18 20:26
統計データの検索サイトってありますか?
202132人目の素数さん:04/01/18 20:36
>>199
ありがとうございます!!
できれば計算過程も教えていただけないでしょうか?
203132人目の素数さん:04/01/18 20:42
標本平均はs=(x1+x2+...+xn)/n だから、
E[s]=E[x1+x2+...+xn]/n
=(E[x1]+E[x2]+...+E[xn])/n=nμ/μ=μ (μ:母平均)
V[s]=V[x1+x2+...+xn]/(n^2)
=(V[x1]+V[x2]+...+V[xn])/n^2
=(nσ^2)/(n^2)=σ^2/n (σ^2:母分散)

たぶん殆どの統計の入門の教科書に書いてある
204185:04/01/18 20:44
>200
しつこく申し訳ないのですが,
母集団がどんな分布であろうともnが大きければ中心極限定理により、
その標本平均は、正規分布 に近似できることができるんですよね?

それならば,平均値の分布からそれぞれの値が有意に大きいか
小さいのかはわからないのでしょうか.
205132人目の素数さん:04/01/18 20:55
誰かこの問題解いてください 
 
今、母集団の平均値がわからず、推定したい。分散は過去のデータから
100であることはわかっている。今、10個のサンプルを取り、平均値は
50であった。母集団の平均値を、95%の確立で表す区間を求めよ。

本当に困っています、お願いします
>>204
独立同分布なサンプルの標本平均はね。
実際、スペクトルの周波数分布は対数正規っぽくしかなんないんでしょ?
その分布から出した平均値を推定値としてみたとき、その推定値に対する信頼区間、っていうのなら定義できるよ。
ただ、あくまで時系列データをすべて使用したパラメータの推定値に対する信頼区間であって、出てきた結果を有意
水準〜で無視する、とかいう意味合いはないよ。
>>205
(50-1.96*10/√10,50+1.96*10/√10)
>>204
先に書かれてしまったが…SDとSE。
>>204
つうか、帰無仮説は何なんだろう。
210132人目の素数さん:04/01/19 00:21
大学のレポートで
自分の統計データをあげて、その問題点をあげるっていうものなんですが

自分は
ttp://www.npa.go.jp/hightech/toukei/html/html12.htm
この警察庁の統計データを選んだんですが、問題点が見つかりません。
計算的ではなくて理論なんですが、どなたか問題点を指摘してもらえませんか?
>>210
世にある統計データを拾ってきていちゃもんつけれ!ってレポートなの?
とんでもない教官だなw
212132人目の素数さん:04/01/19 00:29
そうなんですよ。
どこが足りないかって。
>>212
ってことは教官が一応、足りなさそうなのをピックアップしていて、そのひとつが
この警察庁データなのね?
214132人目の素数さん:04/01/19 00:34
いえ、そういうわけではなく自分で好きなテーマをもってきて
それについて文句言うっていうことです。
>>214
そっか。やっぱひどい教官だw
こんな検挙数並べただけのデータよりもっと問題ありそうなのを選んできた方がいいんじゃね?
とはいえ例はあげられないけど…。
216132人目の素数さん:04/01/19 00:41
そう思って色々探してはいるんですけど見つからなくて・・・
>>216
そのハイテク犯罪のデータだけ見れば、例えばパソコンや携帯の普及率なども
調べて、普及率の伸びとハイテク犯罪の伸びについての関係についても触れる
べき、とかそんな感じのことしかいえないね。

普通の統計機関で、そうそう明らかに間違った分析をしてるところはないから、
こういうデータも持ってきて、こういう分析もすべきだ、というようなレポー
トにすりゃいいんじゃない?
218132人目の素数さん:04/01/19 01:11
かなり問題だらけのデータだと思うけども
機械の普及がハイテク犯罪の検挙数を増やしているのか
法律の整備や宣伝が、相談件数の増加に繋がっているのか
ただ最近は警察が頑張って働いただけなのかも知れないし。
まるで犯罪が増えてるように見せているけど、
不正アクセス禁止法が99年の夏に成立で
まだ4年半くらい

なんかこれだけでは、犯罪が増えているように騙そうとしているような感じ
219132人目の素数さん:04/01/19 03:49
>>217,218
ありがとうございます。参考にさせていただきます。
220132人目の素数さん:04/01/19 10:48
どうでもいい統計でも
見せ方によっては…ってな好例だな
221132人目の素数さん:04/01/19 16:22
大学受験以降数学とは縁がナイ者だが(しかもネタとして完全に時機を逸した
感があるが)・・・

首都圏全体で600のサンプル数しかない視聴率調査で、95%の信頼区間で
検出できる視聴率の差ってどのくらいなもんなのか、誰か計算して答えて
ちょーだい!!

感覚的には16%と20%くらいじゃ有意差ないような気がするし、小数点以下
まで発表しても全く意味ないような気がするんだが・・・
一元配置分散分析で用いるF検定は、なぜ上側5%だけでいいのでしょう?
両側5%で行わないのはなぜですか?
223132人目の素数さん:04/01/19 19:28
視聴率は二項分布で、サンプル数が多いため正規近似可能だから、
(統計的には30以上なら近似可能)、
標本標準偏差は√(p(1-p)/n)
標本平均が20%(p=0.2)なら、標本標準偏差は0.01633で、95%信頼区間は
(16.8%、23,2%)
よって、16と20だったら有意差ありだが、まぁ221の言うことは当たってるね。
統計科学のフロンティアシリーズってどうよ
>>222
要は等分散性の検定なんだが、級間平方和/自由度の方が級内平方和/自由度より大きいんで、
級間平方和を分子にとって、片側検定とするわけだ。逆は帰無仮説に入っていない、ってこと。
>>225
ふむふむ、なんとなくですが分かったような気がします。
ありがとうございます。

しかしここの質問に答えられる方ってすごいですな。
おいらも何か専門的な知識を持ってればいいんですが。
227132人目の素数さん:04/01/22 22:18
数量化U類をExcelでやってるんだが、「件数が不足してます」とエラーがでる。
マニュアルには、「サンプル数が全説明変数のカテゴリー総数より少ない場合に、
このエラーメッセージが出ます。対処:サンプルを増やしてください。」とある。
もうアンケート対象がいないんで、サンプルを増やせないんだが、どうすれば良いの?
Excel スレで質問する。
>>227
Execlスレで質問する以前の問題だろ。
いくつのサンプルに対していくつの説明変数をとってんだよ。普通ありえない状況だが…。
230227:04/01/22 23:19
>>229
サンプル数21で説明変数のカテゴリーが6つです
231厨房:04/01/22 23:31
すんません スロ好きの厨房です
サイコロを一つ振ると1/6って理論的には分かるのですが
本物のサイコロでもそういう風になりますか?
だってサイコロって穴が削ってありますよね
本当はごく少しの空気抵抗やバランスにより
1/6ではないのでは?いつも気になってしまいます
教えて下さい

厨房
232132人目の素数さん:04/01/23 00:29
>>231
あなたの言うとおりなりません。
数学で考えるサイコロは理想的なものです。
この世には存在しません。
233132人目の素数さん:04/01/24 00:07
質問スレから誘導されてきました。

超初心者なんですけど・・・
X1,X2,X3・・・XnをN(3,9)からの大きさn=25のランダムサンプルとする。
標本平均Xが真の平均μ=3から絶対値で2以下の範囲に入る確率は

P(X-μ≧δ)=P(√n(X-μ)/δ≧√n)=P(Z≧√n)=P(Z≧5)

としてn、μ、δにそれぞれ25、3、√9、を入れて良いのでしょうか?
それともN(3,9)の正規化の必要はありますか?
234132人目の素数さん:04/01/24 00:36
>>233
その式が正しいかどうかはしらんけど
既に、正規化されているのであれば
μ=0だし、多分、δ(デルタ)じゃなくて
σ(シグマ)だと思われるが、これも1だ。
従って、正規化されている公式には
μとかσとかいうものはない。
>>233
標本平均 X~ (←バーのつもり)は N(μ,σ/√n) に従う。

>標本平均Xが真の平均μ=3から絶対値で2以下の範囲に入る確率は
この意味がはっきりしない。 |X~-μ|≦2 ということ?
236233:04/01/24 00:45
>δ(デルタ)じゃなくてσ(シグマ)
そうでした。すんません。

> |X~-μ|≦2 ということ?
そうです。

つまり、正規化の必要は無いと言うことでしょうか?
237132人目の素数さん:04/01/24 00:49
>>236
注意するとすれば、正規化は関係ないと思っていいだろう。
他の所に、写し間違い等があるようだが。
238233:04/01/24 00:52
有難うございました。
>>233
P(|X~-μ|≦2)=P(|X~-μ|/(σ/√n)≦2/(σ/√n))=P(|X~-μ|/(σ/√n)≦10/3)
=P(|z|≦10/3)
とここまで変形すれば、正規分布表が使える。
2群の年齢平均値に差がない事を言う場合って、
「対応のないt検定をして、有意確率が有意水準以上になる」
っていう検定すればいいんですか?

って今日、こんな質問を受けたんですが、自分としては
Welchしろとか、有意確率が有意水準以上だからといって
差がないという主張をするのは怪しすぎると突っ込みたくて。

おいら、間違ってます?
ふと考えたら、U検定じゃだめなんですかね、上の。
242132人目の素数さん:04/01/24 16:06
完備可分距離空間のことをポーランド空間といいますが、
ポーランドの語源は、何でしょう?
人名とかですか?
>>240
「平均値に差は無い」が帰無仮説だから、差が無いというより、差があるとは言えない、ってことだけどね。

検定方式で言えば、

t検定…2群が等分散かつ、正規近似できる場合。
Welch…上記で等分散性が棄却された場合。

他のノンパラ検定(U検定、コルモゴロフ・スミルノフ)
…上記以外。例えば2群のサンプルが少なかったり、明らかに正規分布とは異なる分布形になっていたり、って場合。

という感じかな。

年齢とか身長のような特徴を表すものだったら、とりあえずコルモゴロフ・スミルノフかなぁ、って気がする。
どういう2群かにもよるんだけどね。
>>243
日本語うまいですな。そうやって突っ込めば良かったんですね。

訊いてきた人も初心者で、おいらもさほど詳しくないので
なんて説明すればいいか迷ってました。
今度訊かれたらそのまま言っておきます。感謝。
245132人目の素数さん:04/01/25 14:42
標本分散と不偏標本分散の違いって何ですか??
246132人目の素数さん:04/01/25 16:24
Xをある製品の耐久年数とし、平均μ、標準偏差σ=5の正規変数であると仮定する。今、μの推定値として ̄Xをとることにするが、μとの最大誤差を0.5として、この最大誤差を越える確率を5%とすれば、いくらの標本を得る必要があるか。 よろしくお願いしますm(_ _)m
>>246
標本数がn の場合、 ̄Xは N(μ,σ/√n) に従う。
P(| ̄X-μ|>0.5)=P(|( ̄X-μ)/(σ/√n)| > 0.5/(σ/√n) )
=P( |z|> (√n)/10 )=0.05
となるような値は 1.96 だから
(√n)/10 = 1.96 とおくと n=384.16
385個以上の標本が必要。
248132人目の素数さん:04/01/25 18:38
>>247 わかりました!!何かよくわからないことやってましたιありがとうございますm(_ _)m
249132人目の素数さん:04/01/25 18:45
携帯電話の電池の継続使用時間が平均800時間の正規分布に従うものとする。これらの電池の少なくとも90%は700時間以上の寿命を持って欲しいとすると、これを満足させるσの最大値はいくらになるか。 よくわかりません…(;_;)
>>249
P(X≧700)=P((X-800)/σ≧ -100/σ )
z=(X-800)/σとおくとzは標準正規分布に従う。
標準正規分布の下位10%点は-1.28である。
これらの電池の少なくとも90%は700時間以上の寿命を
持って欲しいとすると  -100/σ ≦-1.28 となればよい。
よって σ≦100/1.28=625/8
>>245
母集団(母平均μ母分散σ^2)から
n個の標本を取り出した。とする
標本平均=標本の平均=母平均の不偏推定値
標本分散(nで割る方)=標本の分散
普遍標本分散(n−1で割る方)=母分散の不偏推定値
普通、母平均、母分散がわからないから、標本から推定してやるってこと。
標本の分散が母分散の不偏推定値と異なることに注意。
何でn−1で割るのは、自由度の話になるはず。
252132人目の素数さん:04/01/25 22:17
>>251 ありがとうございました!!
253132人目の素数さん:04/01/26 00:56
ありがとうございます!標準分布の単元のテストの問題だったので、そうだと思いこんでずっと解けませんでした(^_^;)これからは問題をよく読んでみようと思いますι
254困ったOLさん:04/01/26 23:02
おわかりになる方がいらっしゃいましたら教えて下さい。

会社でお客様に手続き書類を発送し、返送された書類
のなかにどうしても書類不備がでます。
(不備はお客様側の不備で私の不備ではありません)
昨年は不備率2%(5200件中100件)でしたが、上司より
今年は1.3%にするようにと言われました。
毎年毎年下げろと言われこれ以上下げられないと思い
納得いきませんでした。
30%を20%にというなら努力の方法もあるので
納得出来ますが、不備というのは自然発生的に
ある程度の数字は出てきてしまうものだと思うのです。
ミスの発生する確率のようなもので・・・・・

統計学に関係があると思いこちらにお邪魔しました。
その辺のところご存知の方がいらっしゃいましたら
どうぞ教えていただけないでしょうか。
(場違いな質問でしたら申し訳ございません)
どうぞよろしくお願い致します。
255132人目の素数さん:04/01/27 00:01
お世話になります。

問:石油会社が石油添加物加えることにより石油1リットルあたりの
燃費を上げることが出来ると主張している。これまでの燃費は平均10km、
標準偏差5kmの正規分布にしたがっていると仮定。このとき、どのように帰無仮説と対立仮説を
設定し、どのようなときに石油会社の主張は正しいと認められるか?

宜しくお願いします。

256255:04/01/27 00:08
済みません、ミスりました。こっちが本物です。

問:石油会社が石油添加物加えることにより石油1リットルあたりの
燃費を上げることが出来ると主張している。これまでの燃費は平均10km、
標準偏差5kmの正規分布にしたがっていると仮定。
また、新しい添加物を加えた車の燃費の分布は未知の平均μ、標準偏差10km
の正規分布に従うと仮定する。このとき、どのように帰無仮説と対立仮説を
設定し、どのようなときに石油会社の主張は正しいと認められるか?

宜しくお願いします。
>>254
統計的には、現状のまま何も改善策を打たないとすれば、翌年度は
90%の確率で、不備率が1.6%〜2.2%
95%の確率で、不備率が1.5%〜2.3%
99%の確率で、不備率が1.4%〜2.4%
の間になると思われる、ということが言えます。
このまま何も改善策を打たなければ、自然に1.3%になることを期待するのはほぼ見込みがないということですね。

いわゆる自然発生的な不備率の最小限界がいくらか、といったことはこれだけの統計で出てくるお話じゃありません。
あなたにできることは、改善策として考えうることをできるだけ行うことだけです。

上司にはとりあえず、
「一応現在できうる打つべき改善策は打つが、統計的に90%の確率でも現在の件数では約0.6%の幅の誤差があり、
必ずしも1.3%を達成できるとは保証はできません。」
とでも言っておけばいいんではないですか。
>>256
帰無仮説:μ=10、対立仮説:μ>10とすればいいんじゃない?
後は正規分布の平均の片側検定。普通の統計の教科書には絶対載ってるから自分で調べてください。
帰無仮説が棄却されたら石油会社は正しいといえる。
259困ったOLさん:04/01/27 00:55
>>257 132人目の素数さんへ
お返事ありがとうございます。
毎日毎日必死で改善策等はやれるだけやっていて、それなのに
これ以上どうしろっていうの〜〜(泣)っていう感じでしたので
藁にもすがる思いでこちらに書きこみました。
本当に本当にありがとうございました。
おかげで安心して眠れます。
(朝が早いのでいつも11時には就寝なんです。)
おやすみなさい。ありがとうございました。
260132人目の素数さん:04/01/27 04:53
偽相関の身近な具体例を教えてください
>>260
「ハゲほど給料が高い」ぐらいでどう?
ハゲと年齢に相関、給料と年齢に相関があるから、ハゲは直接給料と因果関係はないけど
見かけ上相関があるように見える。
>>242
誤爆?
ポーランドは国名のポーランド。第二時大戦前、そのへんの空間の研究者にポーラン
ド人が多く、ポーランド学派を形成した。

余談だが、志賀浩二「無限からの光芒」を読むとその頃の雰囲気が分かって面白い。
263もも:04/01/27 12:54
あの・・・単回帰直線の解き方を教えてくださいっ(Д<)
264260:04/01/27 19:53
>>261さん
ありがとうございます。
参考書読んでもわかりにくかったので質問させていただいた文系学生でした。
265255:04/01/27 22:19
教科書で調べましたが、
この問題nも有意度も不明なので手が付けられません。
√n(X~-μ0)/σ
を使うんですか?
どうにかお願い出来ないでしょうか?
266255:04/01/28 15:42
自己解決しました。
偽相関について。
男が買うオムツの売上、と、ビールの売上、には相関があった。
一見、関係なさそうー>偽相関
男がオムツだけを買うのが恥ずかしいから、ビールもついでに買う、
という、心理学的根拠が示されるー>偽相関でない?
偽相関かどうかの基準はどうなんだろうか?
268132人目の素数さん:04/01/28 19:46
ある正規変数から10個の標本を取り出して不偏標本分散を求めたところ、3.76であった。この母集団の分散σ^2を2とする時、標本分散が3.76以上になる確率はいくらか。 さっぱりわかりません…お願いします!
>>268
不偏標本分散が3.76だったら標本分散は3.384だけど…。

真の分散が2の場合、10個の標本をとってきたときの標本分散がある値以上に
なる確率はχ^2分布から求められるよ。問題の前半部分とは関係なく。
270132人目の素数さん:04/01/28 22:59
>>269 では、P(U≧16.92)より、答えは5%ですか?
271☆キキ+キ゚Д゚ ◆qpmo.OOqAo :04/01/28 23:01

数学は性質が重要であり、それそのものは重要ではない。
学問の数学なんぞ、なんの価値も無いのだ。

数学の性質を理解した僕が作った哲学HPは

http://www.geocities.co.jp/HeartLand/8862/

バカが見てもわからねーぞ(´゚c_,゚` )プッ
>>270
問題文のうしろの「標本分散」が「不偏標本分散」ならそういうこと。
多分、その意味なんだろけど。
273132人目の素数さん:04/01/29 05:05
>>272 多分先生のミスだと思います。ありがとうございました!!
274皆さんやってみて:04/01/29 18:13
不眠症のための睡眠薬Aの効果を調べるために、
20人の不眠症患者を無作為に選び、
睡眠薬Aを投与した。その結果、睡眠時間の増加は以下のようになった

0,6  -0,3  2,4 1,3  -0,5 1,5  0,9  -0,6  0,9  4,3
2,7  -0,1  1,9 3,2 1,6 1,3 1,8 1,8   3,3 1,8

(1)睡眠時間の平均増加時間uに対するさまざまな信頼度の (両側、片側)信頼区間を作り、
  睡眠薬の効果について考察しなさい

(2)睡眠時間が平均的に1時間以上増加したら、
  睡眠薬の効果があったと判断すると、
  上の実験結果より睡眠薬の効果があったと判断してよいか、どうなのか考察しなさい

(3)睡眠時間の増加の標準偏差は、標本の大きさによらず、
  いつもほぼ一定の値であることが知られている。
  この事を利用して、
  睡眠時間の平均増加時間の両側信頼期間の区間幅を1時間未満にするには、
  何人の患者に対して実験すべきか考えなさい。

(4)統計的データ解析法について、A4以内でまとめなさい。

この問題ができた方はE−mail下さい
しかもマルチだし>>274
276皆さんやってみて:04/01/29 18:37
マルチしてしまってすいません 
皆さんできますか
>>276
分かるけど、基本的にマルティには答えるなと言われているので
諦めてください。
>>276
別に難しい問題じゃないし、できる人は当然いっぱいいると思うが、やってみて、なんて言い方だとやってくれる
人は多分いないよ。自分はできるけどおまえらできますか、みたいな感じだから。
(4)は丁寧に頼まれてもやってくれる人はいないよ、きっとw
279やってみてください:04/01/29 19:21
不眠症のための睡眠薬Aの効果を調べるために、
20人の不眠症患者を無作為に選び、
睡眠薬Aを投与した。その結果、睡眠時間の増加は以下のようになった
0,6  -0,3  2,4 1,3  -0,5 1,5  0,9  -0,6  0,9  4,3
2,7  -0,1  1,9 3,2 1,6 1,3 1,8 1,8   3,3 1,8

(1)睡眠時間の平均増加時間uに対するさまざまな信頼度の (両側、片側)信頼区間を作り、
  睡眠薬の効果について考察しなさい

(2)睡眠時間が平均的に1時間以上増加したら、
  睡眠薬の効果があったと判断すると、
  上の実験結果より睡眠薬の効果があったと判断してよいか、どうなのか考察しなさい

(3)睡眠時間の増加の標準偏差は、標本の大きさによらず、
  いつもほぼ一定の値であることが知られている。
  この事を利用して、
  睡眠時間の平均増加時間の両側信頼期間の区間幅を1時間未満にするには、
  何人の患者に対して実験すべきか考えなさい。

(4)統計的データ解析法について、A4以内でまとめなさい。

コピペやめぃ。
281おながいします:04/01/29 23:28
(Xa,Xb,Xc)の自己相関行列が

A B C 5 1 0
D E F =1 3 2
G H I  0 2 4

で与えられるとき、線形予測係数α1、α2を求めよ。

全く意味が分かりません、、、
282132人目の素数さん:04/01/30 12:41
朝食を食べている学生の割合を調べるのにアンケートをとった
1000人がアンケートに答えその内の600が食べていると答えた
食べている人の割合の推定量の分散の推定値を求めよ
--------------------------------------------------------
↑上の問題で「推定量の分散」の意味がわからず全く解けません
解き方と解答を教えてもらえないでしょうか?
意味がわからないものの解法と解答を教えてもらうことに意味はあるのだろうか?
284132人目の素数さん:04/01/31 00:14
ほんとに基本的なことで恐縮ですが、以下の問題について教えてください。

生物雑種第2代の分離比が、ある実験の結果42:157であった。この結果を用いて
この結果がメンデルの分離の法則による分離比(1:3)を満足しているかどうか
検定せよ。

この問題に対して私はメンデルの法則に”満足している”ことを知りたいのだ
から、帰無仮説は”満足していない”と考えました。
この考え方はおかしいのでしょうか?おかしいとしたら、どのように考えれば
よいのかアドバイスをお願いいたします。
>>284
「満足していない」という仮説を立てるのは自由だが、その仮説からいったい
どういう計算ができるのか?と自問してみたまへ。
287☆キキ+キ゚Д゚ ◆qpmo.OOqAo :04/01/31 02:00

なんと! HPで☆キキ+キ゚Д゚♪の声が聴ける!

ホームに☆キキ+キ゚Д゚♪の哲学論が流れている!

http://www.geocities.co.jp/HeartLand/8862/

↑HPはこれね。

みんなで☆キキ+キ゚Д゚♪の声を聴こう!




>>281
(Xa,Xb,Xc)から、何かを線形予測したいんだろけど、自己相関行列だけからじゃわからんよ。
その問題の前後になんか条件とか説明は無いの?

>>282
本当は問題にどういう推定量を使うか書いていないからわからないんだけど、一般的な解釈で解答すれば次の通り。

割合の推定量ってのはたぶん、食べている人の人数をX、全体人数をNとすればX/Nのことだろ。
んで、食べている人の割合の真の値がpなら、このXは、2項分布Bin(N,p)に従う。
この分散はNp(1-p)だから、X/Nの分散は、p(1-p)/Nになる。

今、このp(1-p)/Nの中のpは真の確率だけど、これをpの推定値600/1000で置き換えたものを、
X/Nの分散の推定値としてみることができる。

だから、0.6*(1-0.6)/1000=0.00024が多分出題者の求めている答えだと思う。
>>284
考え方としてはいい方向だよ。間違っているときに積極的に捨てたい仮説が帰無仮説だから。

だけど、検定の方式というのは、帰無仮説を仮定したときに、実際起こった結果が起こる確率
を計算できなければ判定ができない。

よって、>>286氏の言うとおり、仮説が色々な値をとる様な場合は、この確率の計算ができない
から、必然的に値がはっきりしてる方を帰無仮説にとることになる。

だから、「3:1である」と「3:1でない」だったら、値が1つに決まっていて確率計算が
できる前者を帰無仮説にとるわけだね。
290132人目の素数さん:04/02/01 20:39
誘導でこっちにきました。統計で質問です。
サンプル数15
Aの割合60パーセント、Bの割合80パーセント
AとBに有意差があるか検定したいのですがどうすればいいですか?
291132人目の素数さん:04/02/01 21:52
『モンティ・ホールのジレンマ』はどういうこととどういうことがジレンマになってるんですか?
>>290
ちょっと状況は違うけど、2群の母比率の差に関する検定を準用すればいいんではないかな。

>>291
正解っぽい解答が2つ以上存在すること(1/2と1/3)。すぐに1/3と分かる人にとってはジレンマでも
なんでもないんだけどね。

複数の正しいと思われる互いに矛盾する解答が存在する場合が「ジレンマ」、論理的に解がありそう
だけど解が見つからないような場合が「パラドックス」。
同じような意味で使われる場合も多いけど。
二項分布のPの求め方を教えてください
>>293
推定値を求めたいなら、出た割合をpの推定値とするのが普通。
295助けて頂けませんか?:04/02/03 16:26
274・279の者ではないのですが、

統計の問題なんですが解けないので、助けて頂けませんか?
できれば解説等も書いてあれば幸いです。

問 不眠症のための睡眠薬Aの効果を調べるために、
20人の不眠症患者を無作為に選び、睡眠薬Aを投与した。
その結果、睡眠薬の増加は以下のようになった。

(1)睡眠時間の平均増加時間Uに対する
様々な信頼度の(両側、片側)信頼区間を作り、
睡眠薬の効果について考察しなさい。

(2)睡眠時間が平均的に1時間以上増加したら、
睡眠薬の効果があったと判断することにすると、
下の実験結果より睡眠薬の効果があったと判断してよいか、
どうかを考察しなさい。
(3)睡眠時間の増加の標準偏差値は、
標本の大きさによらず、
いつもほぼ一定の値であることは知られている。
このことを利用して、
睡眠時間の平均増加時間の両側信頼区間の区間幅を1時間未満にするには、
何人の患者に対して実験すべきか考えなさい。
_______________________________
|0.6|−0.3|2.4|1.3|−0.5|1.5|0.9|−0.6|0.9|4.3|
ーーーーーーーーーーーーーーーーーーーーーーーーーーーー
|2.7|−0.1|1.9|3.2| 1.6|1.3|1.8| 1.8|3.3|1.8|
ーーーーーーーーーーーーーーーーーーーーーーーーーーーー

見にくいかもしれませんが、御願い致します
>>295
まず不思議なのは
このスレに来て
何故、274・279に同じ問題の
コピペがあるということが分かったのか?
297助けて頂けませんか?:04/02/03 16:52
他の板に同じのが載っているという事でしょうか?
それとも答えるに値しない程の低レベルの問題と言う事とかでしょうか?
見当違いの答えをしているのでしたら、申し訳ありません。
殆ど統計を勉強していなかった為、全くと言って良い程理解出来ないので、
解き方のヒントだけでも頂けたら有難いです。
>>297
で、教科書は読んだのかな?
丸投げにしか見えないのだけど。
>>297
あなたはこの問題をどこで手に入れ、何故この問題を解く必要があるのか?
というあたりを答えてもらいましょうか。

どうみても あなたは>>279と同じ人だと思いますが
全く同じ問題で、かつ、名前欄に妙なメッセージを入れているし
300教えてください:04/02/03 17:40
私は上の睡眠薬のレポートができないと統計学の単位がもらえないのです。
だから誰か助けてください。
この問題は授業のレポートです。
私は貧乏なのでみんなのように教科書をかったりできないので大変困っています。
図書館・・・
>>300
これは医学部のレポートだろ?
ホントにお金無いの?(w
303教えてください:04/02/03 17:50
もしよければ誰か親切な方教えてくれないでしょうか。図書館の本はすでに借りられていました
来年また頑張れば?
教科書を買う金なんて
2〜3日分、食費削るか
半日くらい肉体労働のバイトすればすぐ
たまるじゃん。
ここまで荒し続けて来ていまさら何言ってるの?ってカンジ。
306助けて頂けませんか?:04/02/03 18:09
295・297です
297の人は恐らく同じ学校か、
同じ教師の教わってるのではないでしょうか?
自分はテキストは持っていますが、
読んでいるうちにだんだん分からなくなってきてしまうんです・・・
検定の考え方までなら少しは理解出来ますが、標準正規分布図を描き、
選択域・棄却域の場所等からが理解不能になってしまうんです。

以降はどの様に考えれば良いのでしょうか?
御手数でしょうか、宜しく御願い致します。
307助けて頂けませんか?:04/02/03 18:13
間違えました!!
300の人が同じ学校か、同じ教師という事です!!
308132人目の素数さん:04/02/03 18:13
>>306
だったら、君のテキストを貸してあげれば?(w
>>307
簡単にいっちゃうと
自作自演で自分が何番かこんがらがって来たということかな?
>>295
(1)
正規分布を仮定。
データの標本平均x~、(不偏)標本分散s^2をもとめて、
(x~-t(ε/2)*s/√(n-1), x~+t(ε/2)*s/√(n-1))
ここで、t(ε)は自由度19のt分布のε点。εは、1%や5%をとる。

(2)
標本平均が1より大きいから、帰無仮説μ=1、対立仮説μ>1で検定。
有意水準εなら、x~-1>t(ε)*s/√(n-1)で、仮説が棄却される。
仮説が棄却されたら効果ありと言っていい。

(3)
(1)で作った信頼区間から幅は、2*t(ε/2)*s/√(n-1)が分かる。
これが1未満になる、っていう不等式をnについて解くだけ。

これで何が何だか分からないようだったら素直に単位落としなさい。
>>310
間違えた。(1)のs^2はただの標本分散(20で割る)の方。
312助けて頂けませんか?:04/02/03 18:42
295です
>>310・311さん御指導有難う御座いました。
ダメもとで解いてみます。

>>皆様
既出の同じ質問をして、
自作自演に取られる様に感じさせてしまい失礼致しました。
不快な気分にさせてしまい、
大変申し訳御座いませんでした。
最後に、295・297・306・307は自分が書いたものですが、
それ以外は自分のではない事だけを記しておきます。
馬鹿ばっかの学部だな。
314132人目の素数さん:04/02/04 05:31
母分布がN(μ、2^2)であるとき、これからサイズ100の標本を抽出したところ
、標本平均
      _      100
      X=1/100狽wi
             i=1
は8.5であった。信頼度95%で母平均μの信頼区間はいくらのか
求めよ!!
全く分かりません!!誰か解いてください!!お願いします!!
315132人目の素数さん:04/02/04 05:42
                  ,..-──- 、
                /. : : : : : : : : : \
           冒  /.: : : : : : : : : : : : : : ヽ
            l l ,!::: : : :,-…-…-ミ: : : : :',
          ./〜ヽ{:: : : : :i '⌒'  '⌒' i: : : : :}     ________
           |__| {:: : : : | ェェ  ェェ |: : : : :}   /
.           .||ポサ.|| { : : : :|   ,.、  |:: : : :;! <  うわゎぁぁぁぁぁっ
         /|.l ン||_.ヾ: :: :i r‐-ニ-┐| : : :ノ   \
         |  ̄ -!、 ゞイ! ヽ 二゙ノ イゞ‐′      ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
         |    −!   \` ー一'´丿 \
         ノ    ,二!\   \___/   /`丶、
        /\  /    \   /~ト、   /    l \
       / 、 `ソ!      \/l::::|ハ/     l-7 _ヽ
      /\  ,へi    ⊂ニ''ー-ゝ_`ヽ、    |_厂 _゙:、
      ∧   ̄ ,ト|    >‐- ̄`    \.  | .r'´  ヽ、
     ,ヘ \_,. ' | |    丁二_     7\、|イ _/ ̄ \
     i   \   ハ       |::::|`''ー-、,_/  /\_  _/⌒ヽ
_________________________________________________
このスレを見た人は、10年以内にかならず氏にます。
でも、逃れる方法はあります、
※10日以内に20箇所のスレにこれをはるのです。
すみません、僕、氏にたくないんだす
316132人目の素数さん:04/02/04 13:04
どなか次の問題よろしくお願いします。

ある商店街における従来の平均駐車時間は42.5分であるという。
最近、平均駐車時間が長くなっているとして駐車場を拡張する計画が出された。
拡張にはそれなりの費用がかかる。
果たして本当に駐車時間が長くなったかを調べるため、
ランダムに36枚の入出力記録用紙を調べたところ、平均は46分であった。
今までの経験から標準偏差は7.6分であることが分かっている。
拡張計画を推進するかどうか、統計的な見地から判断しないさい。
317310 311さんへ:04/02/04 15:46
本当にご指導ありがとうございます。
もしよければ解説付きで全回答していただけないでしょうか。
キタ━━━━━━(゚∀゚)━━━━━━━!!!!!
319310 311さんへ:04/02/04 16:51
おねがいします
320310 311さんへ:04/02/04 17:10
もう一度お助けください
>>317

>310に書かれている文章が読めないのか?

>これで何が何だか分からないようだったら素直に単位落としなさい。
322310 311 321さんへ:04/02/04 17:37
自力で解くことができました。
御指導有難う御座いました。
不快な気分にさせてしまい、
大変申し訳御座いませんでした。
最後に、317・319・320は自分のではない事だけを記しておきます。
323132人目の素数さん:04/02/04 17:43
アホばっかりだな
324132人目の素数さん:04/02/04 18:16
すいませんお願いします。
区間[-1/2,1/2]を台に持つ一様分布をXとしたときに
Xj〜f(x)をすべて独立として、
その和の平均z2=(x1+x2)/2 ,z3=(x1+x2+x3)/3
のp.d.f.を求めろという問題なのですが。
>>324
問題がおかしいだろ。
そもそも日本語になってない。
>>314
分散既知の正規母集団の平均の信頼区間(x~-u(ε)σ/√n,x~+u(ε)σ/√n)に代入するだけ。

>>316
帰無仮説 μ=42.5、対立仮説 μ>42.5とおいて正規母集団の平均の分散既知の場合の片側検定。
x~>42.5+u(ε)σ/√nで仮説を棄却。
仮説が棄却されれば長くなったと言え、拡張計画を推進するべき、となる。

>>324
普通に変数変換なり、P((X+Y)/2<z)を求めて微分するなりして求めりゃいいが、かなりめんどくさい
場合分けが必要。
Z2=(X1+X2)/2は、f(z)=2(1-2|z|) (-1/2<=z<=1/2)かな。
Z3はかなりめんどくさい。がんばれ。
327132人目の素数さん:04/02/05 17:57
数学は全くの初心者の実家が手打ちのそば屋で働く者です。
うちでは蕎麦粉8割、小麦粉1.5割、中力粉0.5割の割合で粉を混ぜます。
このできたものが完全に混ざり合っているかを証明する方法ってありますか?

なんとなく毎日蕎麦を作っていて、ふと気になったもので。
統計とは関係ないのでしょうか?
>>327
小麦粉と中力粉がどう違うのか説明せよ。いずれにせよ
数学はこの問題には無力。熱力学のエントロピーの
概念が近いが、それでも意味のある結論は出ないだろう。

割り粉に食紅で色をつけることでもできれば、それを混ぜて実験
できるが、粉に色をつける方法を思いつかない。水かけたらアウト
だしね。顕微鏡で見る手もあるが(小麦粉の粒子が大きいはず)
混ぜ方の良否はわからないだろう。

うん、あれ何度かきまぜたら混ぜ終わったといえるのか、よく
わかんないんだよね。昔の本職は材料を桶にいれて木の棒で
何度も何度もかきまぜたそうだ。
>>324
問題の表記に変なところがあるが、問題自体は自明(というか、
よくあるやつ)なので、結果だけ出しておく。2変数の和の
pdfは三角分布(3角形)になる。底辺は [-1/2, 1/2] で面積
は1だから、高さはわかるよな。3変数の和はそれを少し崩した、
放物線を3個組み合わせた形になる。だんだん正規分布の形に
近づく。計算するには、分布をフーリエ変換してn乗して、
逆フーリエ変換するのだ。
>>328
レスありがとうございます。
やっぱり統計学とは関係なかったんですね。
蕎麦ではないんだけど、昔聞いた話でなにかを混ぜた時に四等分して、
一つを更に四等分した物をサンプルにすると混ざり具合がわかると
聞いたことがあったんです。
こういうのは学術的になんて言うのか知りたかったというのもありまして。

小麦粉と中力粉の違いってのはウチでの単に呼び方で小麦粉=強力粉
ってことです。スマソ。
ちなみにそれらの違いは粒子の大きさだけです。
331328:04/02/06 00:24
>>330
中力粉と強力粉の違いなら、そりゃ粒子の大きさじゃないぞ。
グルテン(たんぱく成分)の含有率の差だ。これ以上はスレ違い
にて省略。

4等分うんぬんは、一回の攪拌操作でどれだけの混合がなされて
いるかを定量化する試みだろう。木鉢に粉が 1kg 入っているとし
て、一回の攪拌ではそれを 100個に分割する、言い換えれば 10gの
小部分に分割する操作と仮定する。操作を n回くりかえして、結果
が粉の粒子の体積くらいまで分割されれば完全に混合されたと
いえるだろう。もし粉の 1粒を 1μgとすれば、
log(10^9)/log(10^2) = 9/2 = 4.5 で、4〜5回の攪拌でまざって
しまう。けっこう早いものだね。
332132人目の素数さん:04/02/06 14:54
すみません、質問いいですか?
わからない問題スレで誘導されました。
f(x)=exp[-(x-x_i)^2/2σ^2 + k*x]
というガウス型の関数の規格化をしたいんですが、手ほどきお願いします。
333132人目の素数さん:04/02/06 16:07
>>332
まず、指数の部分を平方完成する。
-{(x-x_i)^2/(2σ^2)} + k*x
= -(1/(2σ^2)) { (x-x_i)^2 -(2σ^2)kx}
= -(1/(2σ^2)) { x^2 -2(x_i +kσ^2)x +(x_i)^2}
= -(1/(2σ^2)) { (x -(x_i +kσ^2))^2 -(2x_i kσ^2 + (kσ^2)^2) }
= (1/2){ 2 x_i k +(k^2)(σ^2)} -(1/(2σ^2)) (x -(x_i +kσ^2))^2
これの前半はxに関係無い項

f(x)=exp[-(x-x_i)^2/2σ^2 + k*x]
= exp((1/2){ 2 x_i k +(k^2)(σ^2)} ) exp(-(1/(2σ^2)) (x -(x_i +kσ^2))^2)

y = x -(x_i +kσ^2)/((√2)σ)と置けば
f(x) = exp((1/2){ 2 x_i k +(k^2)(σ^2)} ) exp(-y^2)

なので、普通のガウス積分を使って正規化できる。
334332:04/02/06 16:14
>>333
ご丁寧な解説有難う御座います!
これで確率、期待値が計算できますぅ!
335316:04/02/06 21:37
>>326
遅くなりましたがどうもありがとうございます。
よろしければ次の問題もよろしくお願いします。


アメリカのある州の警察学校の女子生徒が、体育科目の男女合格率に
差があるとして雇用機会均等条例違反で訴えた。
女性は9人中6人が合格し、男性は37人中34人が合格した。
条例には、雇用昇進に関する各種のテストにおいて男性の合格率が
著しく高くならないように男女の合格率の許容される比を0.8と定めている。
果たしてこの科目に性差別があるといえるか。
また、合格率の許容比が1のときはどうか。


336132人目の素数さん:04/02/07 14:14
非線形混合モデルのレベル3ランダム効果の分散を、ラプラスでの近似に成功
したヤシはいるのだろうか?
337336:04/02/08 07:16
反応なしか...ちょっと質問の出し方が唐突過ぎたか。
それではもうちょっと詳しく。

3レベル非線形混合モデル(Nonlinear Mixed Model)でロジットをリンク関数として
使っている。レベル1でのひとつの係数をランダム係数とし、レベル2で
その係数を(固定効果+ランダム効果)とし、ランダム効果の分散を推定
する。さらにレベル2の固定効果をレベル3でまたまた(固定効果+ランダム効果)
とし、ランダム効果の分散を推定する、というモデルなのですが...

一般的にはPQL (Penalized Quasi-Likelihood) で推定するのが早いけど、
バイアスが生じる。そこでラプラス方程式を応用して近似すると、
かなり推定値が良くなる。レベル2の分散の推定ではそれが応用された例が
HLMというソフトだ。

で、レベル3にラプラス近似を成功した人はいるのか?というのが質問だ。
もちろん質問するくらいなのでHLMでもレべル3の分散にはまだ応用して
いない。

もちろん正統な最尤法でえっちらとやれば、よい推定値が出るのだが何しろ遅い。
PQL+ラプラスで数分のものが最尤法では2、3日かかる。

何かこれに関して知っている人はいませんかぁ?
338132人目の素数さん:04/02/08 12:03
下のような計画(例)で薬剤の有用性を判定したいのですが。

ある疾患を患っている患者を40名集め、その患者に対して薬剤Xを投与する。
投与前および投与1週間後に下記のスコア表に基づき、重篤度を判定する。
(1.微弱 2.軽度 3.中程度 4.やや重篤 5.かなり重篤)
薬剤Xの投与が疾患に対して有効であるかどうかを検定せよ。

データ例
投与前 投与1週間後
 3     2     
 4     2
 4     3
 5     3
 4     1
 4     5
 3     1
……    ……


調べたところ、対応のあるt検定(1標本t検定)のノンパラメトリックバージョンの
検定をすればいいと分かりましたが、マン・ホイットニー検定は対応の無い検定(2標本型)にしか対応していないので、
ウィルコクソンの符号付順位和検定を使うのが妥当でしょうか?
339132人目の素数さん:04/02/08 15:41
age
質問よいでしょうか。
部分空間へ射影したときの平均二条誤差を最小にする主成分分析で、
サンプルになるベクトルの要素が正の値をとる場合、
最大の固有値に対応する固有ベクトルの方向(又はその逆)に、
「必ず」平均値があると思うんですが、
あってますかね?
>>338
妥当だと思います。
ただし、その計画では、薬剤が有効なのか、時間経過や心理的効果によるものなのかが、見分けがつきません。
大げさな例をあげると、風邪の人に薬剤を投与して1週間たてば、薬剤を投与していなくても、症状は改善する、ということです。
疾患が慢性的なものであるという知見があれば、時間経過の影響は考えなくてよいでしょう。
時間経過や心理的効果を除きたければ、
A群 薬剤 B群 プラセボ マン・ホイットニーの U 検定
勉強中の身のため、ご参考まで。
342132人目の素数さん:04/02/11 13:01
>>341

>>338でつ。回答していただきありがとうございまつ。
慢性的な疾患(例えば、高脂血症や皮膚疾患や心疾患など)ならば
この方法で問題なさそうですね。
343340:04/02/12 10:58
質問取り下げます。
何か根本的にわかっていないような気がします。
344132人目の素数さん:04/02/12 14:35
χ二乗値が570になることってありますか?
電卓で計算しなきゃいけないレポートがあって自分で計算したら
570という数字が出てきてしまいますた…
345132人目の素数さん:04/02/12 22:39
age
>>344
期待値A:1, 実現値A:18, 期待値B:1, 実現値B:18, 自由度2-1=1
χ^2=(18-1)^2/1+(18-1)^2/1= (17^2)*2=578
347132人目の素数さん :04/02/13 20:08
グラフを作ったとき各プロットの有意差の有無をアルファベット
を用いて表せと言われたのですが良くわかりません。
a,b,c...と書いてあれば各プロットに有意差があることがわかるのですが、
ab,bcdなどと書く意味やつけ方がわかりません。
どうか御教授下さい。
検索や文献をさがしても見つかりませんでした。
348132人目の素数さん:04/02/14 00:53
重回帰分析について質問よろしいでしょうか。

今、ある機械である製品を製造するとします。
その時の機械の条件や環境の条件を独立変数として、いくつかXを取り出します。
製造された製品の物性を目的変数Yとして、回帰式を計算するとします。
たとえば、変動する条件(独立変数)を4つ取り出したとして、回帰式で
表すと、
Y=a+b*X1+c*X2+d*X3+e*X4+ε
と表せます。この時の4つの独立変数X1〜X4のうち、目的変数Yに最も
影響を及ぼしている独立変数を評価する方法はあるのでしょうか?
それぞれの独立変数の単位は異なるので、回帰係数で比較する事はできない
と思うのですが…、どうすればいいのでしょうか?
「Yに最も影響している条件(変数)は○○です」というような評価は可能でしょうか。

駄文申し訳ありません、、、どなたか教えてください
349132人目の素数さん:04/02/15 01:07
あげ
>>348
単位の影響を取り除きたければ、データを標準化(基準化)。
標準化偏回帰係数は,ある独立変数が 1 標準偏差変動したときに,標準化された従属変数が何単位変動するかを表す。

まず、影響と寄与はちがいます。。影響はA→B、寄与はA→←B。
標準化偏回帰係数によって、予測にどの程度各変数が寄与しているか?を見ることができる。
ただし、多重共線性に注意。
あと、予測(重回帰モデル)が妥当かどうか検証。

青木先生のページを参照
ttp://aoki2.si.gunma-u.ac.jp/lecture/Regression/mreg/index.html
351348:04/02/16 20:45
>350
影響を見る場合は偏回帰係数を標準化する必要はないのですか?
352350:04/02/17 03:19
>351
標準化する必要があります。
細かいところを気にしなければ、標準化偏回帰係数を見ればよいです。
ただし、多重共線性に注意しましょう。結果がものすごく変わることがあります。

私がゴチャゴチャ言ってるのは、
重回帰分析は寄与がわかっても、因果(影響)はわからない!ということ。
回帰を学ぶ上で、寄与と因果は、しっかり区別しなくてはいけません。
影響を見るのは、因果的推測と言って、最新の研究。ま、基本は重回帰だけど。
統計学は全くの素人なのですが、疑問に思うことがあります。

http://www1.odn.ne.jp/youth-study/
このサイトで、高校生の生活と意識に関する調査というものについてです。

問7「あなたのクラスには、男子生徒と女子生徒の割合はどのくらいですか?」
という設問で、日本のデータを見ると43.9%が「ほぼ全員女子」で、
女子校のようです(男子のみは11.9%)。

そのため、
問10「あなたのクラスでは、次のことについて、男子と女子はどっちが多いですか?」
という問以下詳細15問の回答のうち、女子のデータは全て「女子が多い」となるのは、
当然のような気がします。

同じように問7のデータから、男子校(74.5%)、女子校(71.4%)から
サンプリングしたと思われる韓国のデータでは、問10の中の15問は
全て無回答の比率が50〜70%になっているのは、異性がいないので
比較できないと判断したためと思えます。

この調査の「概要」を読むと、
問10の<クラスの中の男子生徒と女子生徒の行動>についての項目で、
>日本の女子生徒は「先生によく反抗する人」「校則をよく守らない人」に対して、
>「女子が多い」と肯定するのが特徴である。
とされていますが、どうも釈然としません。サンプルのかたよりからすると、
統計上、間違った解釈ではないのでしょうか。
354132人目の素数さん:04/02/17 20:54
>352
なるほど。
どの説明変数が目的変数と関わりをもっているかを見るためには、
標準化偏回帰係数で比較して標準化偏回帰係数が最も大きい説明変数が
最も目的変数と関わりを持っているということですか。

あるサイトで”要因の絞り込み”という方法を見たのですが、
この方法で”目的変数と最も関わりを持っている説明変数”を
求める事はできますか?(標準化偏回帰係数ではなく、P値を見ているようですが)

ちなみにここです
ttp://202.245.103.49/kenshu/Sozai/Excel/statistic/analysis25.htm
355350:04/02/18 06:34
>354
変数選択の話ですね。
予測するのには、できるだけ変数が少なく相関が高い方が良いモデルとなります。
そこで、各偏回帰係数が0かどうかを検定します。
P値は、ある偏回帰係数が0である確率を表しています。
各偏回帰係数のP値を計算してみて、大きいものから削っていき、
最もよいモデルのところで止めます。

要するに、0に近い偏回帰係数を削っていくだけです。
多分、同じ結果になると思います。(0に近いところは順番が少し変わるかも。
変数選択して、最良のモデルを作ってから、標準化偏回帰係数で解釈。
コレが1番良いかと。
356132人目の素数さん:04/02/18 21:38
2336 名無しさんにズームイン! sage諏訪 New! 04/02/18 21:27 ID:BynTAKDd
うわーーーーーーーー書けるっ!!!!書けますうぅぅぅぅぅぅぅ!!!!!!!!


2337 名無しさんにズームイン! New! 04/02/18 21:27 ID:n8ilzDQ6



2338 1001 New! Over 1000 Thread
このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。


2339 1001 New! Over 1000 Thread
このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。


2340 名無し募集中。。。 New! 04/02/18 21:27 ID:Ha+lJUyb
>>2000
おめ



おまいら!大変ですよ!この現象を統計学理論で説明して下さい!
W杯アジア地区第1次予選「日本×オマーン」 PART14
http://live8.2ch.net/test/read.cgi/liventv/1077105141/
357132人目の素数さん:04/02/19 18:55
発生確率1/6で、試行回数10回の、標準偏差の式を教えてくだされ。
358132人目の素数さん:04/02/19 19:12
>>357
何の標準偏差が知りたいの?
359132人目の素数さん:04/02/19 19:18
>>358
当たりがでる確率が1/6のくじを、10回くじ引きした場合の、
実際に起きた場合ではなく、理論的な標準偏差値の算出方法です。
質問のしかたが、悪いかもしれませんが・・・解るでしょうか?
360132人目の素数さん:04/02/20 00:06
統計超初心者なので簡単な質問かも知れませんが許して下さい。
実は明日レポート提出なので・・・

薬品Aを1000人に使ったとき、100人が副作用が出ました。
薬品Bでは1500人中、1000人が副作用がでました。
こういう場合に、統計学的に有意に薬品Aの方がよい、というにはどんな検定すればいいんでしょうか。
実際の数字はもっと確率が近いんです。
統計のソフトはエクセル統計を使ってます。
よろしくお願いします。
よーし、統計初心者の漏れが惑わす回答をしちゃうぞ。

有意に「良い」ということは出来ないが、
母比率の差の検定とかでしょうか。

間違ってたらすまそ。一回くらい答えられる人になりたかったのよ。
>353
集めた日本、アメリカ、、、のサンプルからの、
集めた日本、アメリカ、、、のサンプルの解釈としては間違ってはいないが、
そのサンプルが偏っているので、
その解釈を日本全体、アメリカ全体、、、の解釈としているところに
問題があるんではないでしょうか?

先日、TVで、
「高学歴である裁判官は、同じ高学歴の被告をひいきしている。
その証拠に、死刑になった被告のうち高学歴の者は少ししかいない。
そういう統計が出てるんです。」
とか、なんとか、言っていた人がいたが、
確かに、死刑になった被告のうち高学歴の者は少ししかいないのは正しい解釈だろう。
だが、その解釈=裁判官がひいきしている、という解釈はどうか?と。
それを調べたいならば、
高学歴の死刑になった被告/高学歴の死刑を求刑された被告
低学歴の死刑になった被告/低学歴の死刑を求刑された被告
を比較するべきだろう、と。
解釈が都合のいいように飛躍してるんですよね。
こうやって、統計の評判が落ちていくんだろうな、と思う今日この頃。
363132人目の素数さん:04/02/21 00:25
実務上、重回帰分析で要因分析なんて相関関係があるから不可能ですよね?と言うか無意味ですよね?
364132人目の素数さん:04/02/21 02:46
>>360
「t検定」でぐぐれ。
>361
おしい。。。では、補足を。
2群の母比率の差の検定は、片側検定を定義できるので、
有意に「良い」と言えます。
366132人目の素数さん:04/02/21 11:27
363なんですが実際はどうなのでしょう?
コンサルタントが明らかに無意味な重回帰分析をしているようにしか思えないのです。
367132人目の素数さん:04/02/21 11:41

例えば民力データの

  〜18歳 人口
18〜23歳 人口
23〜28歳 人口
29〜    人口

4つの独立変数と

従属変数:売上高

を使って年齢別の要因分析をするなんてどう考えても変ですよね?
>>365
そ、そっか_| ̄|○
(´-`).。oO(いつかちゃんと答えられる人になれますように・・・)

>>360をt検定でやろうとするとどうなるんですかね?
t検定って平均値の差を検定するものだと思いこんでました。
統計学入門 基礎統計学
東京大学教養学部統計学教室 (編集)

これと同程度か少しカンタンなことについて書かれた洋書があれば教えてください。
http://www.amazon.co.jp/exec/obidos/ASIN/4130420658/
370132人目の素数さん:04/02/22 13:32
367ですが私の質問はDQN過ぎますか?
>367
363で
>実務上、重回帰分析で要因分析なんて相関関係があるから不可能ですよね?と言うか無意味ですよね?
相関関係があるから不可能??意味がよくわからない
相関関係がわかるだけで、要因かどうかはわからないってことでしょうか?
367で
>例えば民力データの
>  〜18歳 人口
>18〜23歳 人口
>23〜28歳 人口
>29〜    人口
>4つの独立変数と
>従属変数:売上高
>を使って年齢別の要因分析をするなんてどう考えても変ですよね?
どう考えても?実務的な意見が欲しかったのでは?理論的な意見でもいいの?
どのように考えて、どこが変なのか?を示すべきかと。

質問の意図がはっきりしないことと、
実務家じゃないので、レス控えてました。
372132人目の素数さん:04/02/25 17:11
本当にあほな質問で泣きたくなるのですが、
標本と母集団の違いってはっきり一言で言うとなんでしょうか。
サンプルが20個あっても30個あっても標本なのでしょうか。
どなたかお答えください。
A,B二つの工場から消費地へ製品を輸送する場合,輸送費はAから
消費地まで1トン当り6万円,Bからは1トン当り10万円かかるという。
工場の毎月の生産量はA工場は50トン,B工場は40トンである。
2工場から2工場から消費地へ合わせて65トン送りたい。輸送費を最小にするには
各工場から何トンずつ送ればよいか。

答えは分かるけど解き方がワカラン_| ̄|○
どなたか御教授願います・・・。
よーしまた統計初心者の漏れが答えちゃうぞー!
今度こそはちゃんと答えられるようになってやる!

>>372
ある集団があったときに、サンプルとして取り出したものが「標本」で、
そのサンプルを取り出せる可能性をもつ物全てが「母集団」かしら。
一言で言うと、「母集団から取ったサンプルが標本」。

自分で読んでて何言ってるかわからんなぁ(^^;
20個30個あったとしても、それが集団の全てで無い限りは標本です。

>>373
線形計画法で解けるはずなので解いてみます。
>>373
あれ?線形計画法以前の問題?
その条件だとA工場に最大量わりふったほうが安い?
何か別条件無いのかしら。
>>375
線形計画法の問題なんですけど,これ以外他の条件無いんですよ。
おっしゃる通りAに最大量割り振った方が安いと思うんですけど,
線形計画法用いての課程が分からなくて・・・。
やっぱ漏れが初心者過ぎて何か考え違いしてるのかなぁ・・・
こんなんじゃだめかしら?

 A工場から x (トン)、B工場から y (トン)送る
 輸送費を k
とします。すると、
 x + y = 65 ・・・(1)
 6x + 10y = k ・・・(2)
 x =< 50 , y =<40 ・・・(3)
が成り立ちます。
(1)をグラフで書くと y = -x + 65 上で [25,40]から[50,15]までになります。・・・(4)
ここで(2)式は y = -3/5 x + 1/10 k ・・・(5)より、
(4)と(5)が重なる範囲内で、kが最も小さい時を選べば良いのです。
従って、(50,15)の時にkが最小となり、
「輸送費はA工場から50トン、B工場から10トン送ったときに最小となる」
が導かれます。
>>376
あ、やっぱりこれでいいんですか。
ってことでこれを参考にして下さいヽ(´ー`)ノようやく答えられた

座標を表す括弧が[ ]と( )でありますけどまぁ気にしないで下さい。
379132人目の素数さん:04/02/25 20:07
>>377-378
解説ありがとうございました!
似たような別問題があるのでそっちをこの方法でやってみます!

いえいえ、またわからなかったらどうぞヽ(´ー`)ノ

って>>377、最後の最後で間違えてるな_| ̄|○ B工場から15トンね
>374
おしぃ。母集団と標本について補足を。
母集団から無作為に(ランダムに)抽出したものが標本です。
あと、わかりやすいように英語。
(parent) population 母集団
sample 標本
random sampling 無作為抽出
382372:04/02/26 07:43
374さん、381さん、丁寧な解説ありがとうございました。

と言うことは、母集団か標本かを見分けるには、数を見るのではなく
内容を見るのですね。抽出したと書いてなければ、母集団として
判断してもいいのでしょうか。車の例などは、10個であれば標本だと
わかるのですが(世界には10個以上車があるから・・・ですよね?)
たとえば、バスケットボールの点数などはどうなんでしょうか。
10回バスケットボールの記録を測れば、その10回は母集団に
なると考えていいのですか。よろしくお願いします。
383381:04/02/27 06:25
>381
すいません、間違えました。
標本=母集団から抽出したもの
標本は母集団から無作為に抽出されなければならない、でした。
>382
まず、
母集団=知識・情報を得たいと考えている対象の全体

バスケットボールの点数の知識・情報を得たい。
バスケットボールの点数の全体は、0〜∞。
母集団は、バスケットボールの点数0〜∞。
標本は、10個。
標本から母集団を推定。

有限母集団、無限母集団の話と、
母集団と標本の関係の話が絡んでます。
上は無限母集団の場合です。次に、有限母集団の方を考えてみましょう。

1シーズンのバスケットの点数の知識・情報を得たい。
1シーズンのバスケットの点数の全体は、そのまま。
母集団は1シーズンのバスケットの点数全体
標本をいくつかとる。
標本から母集団を推定。

結論、標本からじゃなくて、目的から母集団を決めましょう。
一般的なバスケットボールの点数を調べたければ、その10回は標本。
その10回のバスケットボールの点数を調べたければ、その10回は母集団。
384372:04/02/27 18:02
381さん、詳しい解説をありがとうございます。
これですっきりしました。くだらない質問にお付き合いくださって
本当にありがとうございます。ここに来てみて良かったです。
385自由度n-1:04/02/28 11:00
初歩的な質問、且つ以前もこの手の話はでてきていたと思いますが、
自由度n-1の定義について、教えていただきたいと思います。
「n-1個の偏差を与えると残り1個は自動的に決まる」ようなことが
参考書に書かれてありますが、どうもピンと来ません。
具体的にはどういうことなのか、わかる方がおりましたら、
ご説明いただきたく思います。
宜しくお願いします。
よーし今度こそ。

例えばn個のバラバラな数字(X1〜Xn)があったとすると、
それらから平均値mが決定されますね。

さて、逆に、平均値mを固定したまま(X1〜X(n-1))の数字を
自由に動かす、つまりn-1個の偏差を与えたとしても、
平均値mは固定されたままですから、最後の一個は逆算から自動的に決まります。

なぜならn個の数字の合計値は必ずm×nになっているからです。
合計値がm×nで、しかもn-1個の数が全て分かっていれば最後の一個は引き算で出せますよね。

やっぱおいら日本語下手だな(´・ω・`)統計以前の問題だ
387自由度n-1:04/02/28 18:59
>>386さん、ありがとうございます。
>平均値mは固定されたままですから、最後の一個は逆算から自動的に決まります。
だいたいイメージはつかめました。
それでは、なぜ平方和などをn-1で割る必要があるのでしょうか。
nではなぜだめなのでしょうか。
宜しくお願い致します。


>>387
どういたしまして。つたない日本語ですいません。

さて、今度は不偏分散についての質問ですね。
これに関しては、以前学校でレポートの課題として出されて、
おいらもだいぶ頑張って(ネットからパクリながら)解説を書きました。

ttp://trao2go.hp.infoseek.co.jp/toukei1.pdf
[4 分散と不偏分散]のところと[6 余談(理由)]が役に立つかと。
恥ずかしいので今日の夕方くらいまでに消してしまう予定です。
あと、統計の先輩方、間違ってたらご指摘よろしくお願いいたします。
389132人目の素数さん:04/02/29 08:37
>388
ほとんど完璧ですな.では,ちょいちょい修正を.
おかしいところは,
1.母平均μの説明が入っていない.
2.母分散σ^2は,ひとつの決まった値なので小文字だが,
標本分散と不偏標本分散は,確率変数なので,大文字.
3.母分散は値なので不偏母分散というものはない.不偏=不偏推定量.
多分,
母平均,母分散は値.標本平均,標本分散,不偏標本分散は確率変数.
がごちゃごちゃになっていると思います.
母平均=E[標本平均],母分散=E[不偏標本分散]です.

母分散が未知だから,標本から母分散を求めたい.
平均が母分散になる,できるだけ分散の小さい推定量を見つけたい
証明したいのは,
E[不偏標本分散]=E[n/n-1 標本分散]=母分散
  前の=は不偏標本分散と標本分散の定義式を見ればすぐわかる.
390132人目の素数さん:04/02/29 08:39
(続)
手直しすると,(注意.X~は標本平均のつもりです.
余談の最初に,
「母平均μ,母分散σ^2の母集団から,無作為にX1,X2,...,Xnを抽出すると,
X1,X2,...,Xnは,平均μ,分散σ^2の独立な確率変数となる.
よって,E[Xi]=μ,V[Xi]=E[(Xi-μ)^2]=σ^2 (i=1,2,...,n)」
を入れて,

E[S^2]=.............=1/n Σ(E[(Xi-μ)^2]) -E[(X~-μ)^2]
=1/n ΣV[Xi] -V[X~]
ここで
V[X]=σ^2
V[X~]=....=σ^2/n
よって
E[S^2]=...=(n-1)/n σ^2
よって,
母分散=n/(n-1) E[標本分散]
また,
E[不偏標本分散]=E[n/n-1標本分散]=母分散

ということは,不偏標本分散の平均は母分散になる.
よって,不偏標本分散は母分散の不偏推定量
391自由度n-1:04/02/29 09:37
>>388,389さん、あるがとうございます。
大分頭の中が整理されてきました。
つまり、言葉で表すと、
偏差平方和をnで割ると、かたよりをもってしまうため、
標本分散が母分散の不偏推定値であるためには、n-1で
割る必要があるということでしょうか。
ただの分散と不偏分散が頭の中でごっちゃになっていたようです。


392自由度n-1:04/02/29 09:46
>>391訂正
分散=標本分散でしたね。
そうしますと、不偏標本分散が母分散の不偏推定量であるためには
n-1で割る必要がある、となるのですね。
失礼いたしました。
393132人目の素数さん:04/02/29 18:40
>>352
遅レスだけど、

>ただし、多重共線性に注意しましょう。結果がものすごく変わることがあります。

注意しましょうと言うよりは、実務上、説明変数が3個以上あるとマルチ湖は避けられない。
標準化偏回帰係数を見ても意味がないのがほとんど。
394132人目の素数さん:04/02/29 19:13
重回帰分析で要因分析は無理ってことか・・・・・
>352
相関の高い説明変数を削って、変数選択しててからでも、意味ないのでしょうか?
各説明変数の相関が低ければ、標準化偏回帰係数の意味があると思うのですが。
でも、削った説明変数の解釈に困るか。。。
共分散構造解析とかするんでしょうか?
396395:04/02/29 23:52
>352じゃなくて>393です。
>>389
ご指摘ありがとうございます。

>母平均,母分散は値.標本平均,標本分散,不偏標本分散は確率変数.
>がごちゃごちゃになっていると思います.

まさにその通りでした・・・
いやはや、統計初心者を脱却するにはまだまだ時間がかかりそうです。

>>391=392
そういうことだと思います。

ではPDFは消してしまいますね。
相関の高い説明変数をいくら削っても、残った変数の相関係数はゼロじゃないでしょ?
それが2,3個だったらまだいいけど、それ以上になったら標準化偏回帰係数を見ても無駄。

事前に主成分分析をかましたりするんだけど複雑になりすぎる。
なるほど。
主成分分析をかませば、相関0の説明変数を作れて、
それから、重回帰にかけて、
第1主成分、第2主成分、…の偏回帰係数を比較、
最も寄与の大きい説明変数はどれか?と言われると、困りますね。

だいたい、X1とX2が相関があれば、
X1の寄与が大きくなればX2の寄与も大きくなるから、
X1とX2の寄与が大きい、つまり、
説明変数の合成変数で出てくるのは、当然か。。。
>348
今さらながらに思うと、
標準化した目的変数と各説明変数を単回帰にかけて相関係数を比較し、
最も相関の高い説明変数は、コレです。
と、言っても良かったのかも知れない。。。
2番目3番目と言われると困るが。。。どうなんでしょう?
401132人目の素数さん:04/03/02 20:59
ただの興味本位なんだけど、学生?実務家?
402399と400:04/03/02 22:07
学生です。
403132人目の素数さん:04/03/03 23:54
無作為標本についてお聞きしたいことがあります。

ある母集団のある薬の服用について調べたいときに、
その母集団の人々のリストを全て持っているとします。
当然ながら、どの人が服用していて、
どの人が服用してないかはわかりません。
その母集団のリストから無作為抽出にて標本を定めて、
その標本の方々に対して面接にて調査を行ったとします。
その際に、服用していないという方は、調査をやめにして、
服用しているという方のみに調査をして、調査結果をまとめたという、
この結果っていうのは、無作為標本に基づいた結果と言えるのでしょうか?

服用していない方には調査をやめにした、というところがひっかかって、
でも、その薬の飲む頻度とか服用期間とかを知りたい場合は、
服用していない人々に聞いても仕方がないので、っていう考え方もあるし、
果たしてこれって無作為標本に基づくのだろうかっていう疑問が出てきたのです。

説明をつけて教えて下さると幸いです。
よろしくお願い致します。
自信持って答えられるほどじゃないので、参考程度に。
まず、
母集団=知識・情報を得たいと考えている対象の全体
です。
もちろん、母集団が、”そのリスト上の人々”で、
途中で調査をやめるというのは、無作為標本ではありません。
しかし、母集団=”薬を服用しているそのリスト上の人々”と設定すると、
母集団からの無作為標本になると思います。
405132人目の素数さん:04/03/05 14:00
多次元尺度法でお手本になるようなプログラムソース
どこかにないかなと探してます。
C/C++だと一番読みやすいんですけど、知ってる方
いましたら、よろしくご教示ください。よろすく
406132人目の素数さん:04/03/09 01:44
g
128
408132人目の素数さん:04/03/09 21:09
大変抽象的な質問で申し訳ありません。以下の質問に答えて頂ければ
幸いです。

ある検査機の不良品感知センサーが正常に作動しているかどうかを
確認するための実験を行いたいと考えております。実験の内容としては、
既知の不良品を良品に混ぜて、それを検査機に流し、既知の結果が得られる
かどうか、というものです。センサーが正常(異常)である、と言えるためには、
どのような実験系を組めばよろしいかと思いますでしょうか?

当方、統計の知識に乏しく、質問も的外れの気もしますが、
よろしくお願い致します。



409132人目の素数さん:04/03/10 13:23
区間推定の式に関する質問です。x系列とy系列があって(x,y)のサンプル
とって、M次の多項式回帰したとすますね。つまり回帰式が
y=a0+a1*x+a2*x^2+.....+aM*x^M
でこの式から、あるxに対するyを推定するとします。
これ区間推定で y+-δ のように求めたいのですが、
δ=t_α/2*Se ですよね。
で、それはいいのですが、Se(予測誤差の分散ていうの?)
どうやってもとめるのですかね。
Se=(Σ(y_hati_yi)^2/(N-2)*(1+1/n+(x-x_mean)^2/Σ(xi-x_mean))^2))^0.5
ってのあったんですが、これって回帰式がy=a+bxとかの時だけ
の気がするのですが、、、、何言ってるか分かる賢い人いたら
多項式の場合のSeの式教えてください。
410132人目の素数さん:04/03/10 13:57
↑ y_hati_yi ---> y_hat(回帰式からのy)- yi(実際の値)
>>408
それって全数検査なの、それとも抜き取り?
412132人目の素数さん:04/03/10 15:19
412
413408:04/03/10 21:03
>>411さん、
全数検査で考えております。
要は的中率を求めるもので、センサーの精度を見たい訳です。
宜しくお願い致します。

すいません、数学嫌いなもんで、ちょっと検討がつかないので質問します。
サンプル集団が二つあるとして、その分散の違いを見たいのです。
単純に不偏標準偏差をもとめて比較する以外に方法はありますか?
サンプルのデータのエラーを考慮して比較するぐらいしか思いつきません(涙)

415132人目の素数さん:04/03/22 15:58
浮上
416オラウータン:04/03/22 15:58
ある集団の平均とその部分である集団の平均が違うとき、それが偶然では
なく違うってのは、どう計算したら良いのでしょうか?
両方とも正規分布に従うと仮定し、両方の平均が
同じである場合に、実際にそれだけのずれが出来る
確率を求めて、余りにも小さかったら(1%以下とか)
恐らく何か理由があって平均が違うのだろう、と
言うことになる。帰無仮説棄却。

あとは灯台出版会の本で勉強すれ。
>>414
何がしたいのかそれだけではサッパリわからんが、
等分散性の検定をすればいいんじゃない?
そういう意味じゃないのか?
419132人目の素数さん:04/03/23 01:17
>>408
2週間前だからもう調査したのかもしれないけど、
測定器の精度を調べるのにはMSAって方法が一般的となっている。
ISO9000準拠。

(R&R/TV)*100 (%)
420132人目の素数さん:04/03/24 01:31
サイコロの目の出方がちゃんとしてるかどうか調べるには
どうやって調べればいいのでしょうか?
たとえば
1 1 1 2 2 2 3 3 3 4 4 4 5 5 5 6 6 6
って感じで目が出たとすると、
各目の出る確率は1/6で正しいのですが、
目の出方が普通じゃないですよね? 順番に出てる。もっとランダムに出るべきなのに。
こういうのをおかしいって判定することはできるのでしょうか?
>>420
「母比率の検定」でぐぐる
>>421
母比率の検定では>>420のデータは異常なし?
母比率の検定では無理な気がするが…

普通にプロットして考えるといいのでは?
c管理図の要領。
「周期的に同じ傾向が現れる」というのは、
管理図では異常の可能性ありとみなす。

他には、
14連続交互増減、平均値以下(以上)が4連続以上出現、
連続6点増加(減少)、±1σ領域に点が集中(サイコロなら3,4)
このあたりは実際にどれほど起こらないか、
自分で確率を計算すればわかると思う。
424421:04/03/24 02:57
ごめん>>420最初の2行と最後の1行だけしか読んでなかった
425132人目の素数さん:04/03/25 19:55
すいません、さんざん既出とは思いますが、統計学を学ぶにあたってバイブルや良書はありますでしょうか?
携帯なので過去ログは勘弁して下さい
私はまったくの統計学初学者です
できれば返答お願いしますm(__)m
426132人目の素数さん:04/03/26 00:51
統計学入門
東京大学教養学部統計学教室編
東京大学出版会
>>426
ありがとうございます!
早速明日探してきますm(__)m
428132人目の素数さん:04/03/27 01:56
統計学を学ぶ先輩方に質問なのですが、
大学でやるような問題ならだいたい解ける、というレベルに達するまで一日何時間勉強して何ヵ月(または何年)かかりましたか?
もちろん個人差があると思いますのでだいたいで結構です
小学生みたいな質問ですが、これからの勉強の指標にしたいのでお願いします
「大学でやるような問題がだいたい解ける」という書き方が本当に小学生みた・・ゲホンゲホン
とりあえず高卒程度の知識があるのなら、

1.一般教養課程で統計学の単位をとる→1〜2日
2.専門課程で統計学の単位をとる→数日
3.数学科以外(経済、工学、農学等)で統計学の知識を利用した論文を書く→数日〜数週間
4.数学科で統計学をテーマとした論文を書く→数ヶ月〜数年

ぐらい?誰か適当にフォローして。
因みに1と2は「本質的な理解をしてなくても単位が取れればいい」という場合の日数ねw
430132人目の素数さん:04/03/28 01:28
基地外な宿題に答えてください。
20回サンプルされました。平均は10.432、標準偏差は3.237ですた。
(あ)98%信頼区間を求めよ ←こんなのはまあいい
(い)信頼区間を+-0.001にするには何回サンプル取ればいいか?
は?そんなん莫大なサンプル数になると思うんですが、、、
これはt分布表使うやり方でいいんですよねえ。
サンプル数変わっても平均と標準偏差は一定と仮定でいいんでせうか?
莫大な答えになって、こんなんでいいのかと思わせる問題はやめて
いただきたいのだが、、、
計算してないから莫大って言うのがどれくらいか分からんが、
時間空間コストの現実性は対象依存だろ。
432132人目の素数さん:04/03/28 17:14
大数の法則か。
433132人目の素数さん:04/03/30 16:01
すいません、質問します。

一様最小分散不偏推定量と最小分散不偏推定量についての
違いというのはあるのでしょうか?

本によってはどちらかしか載っていなかったので、
ちょっと気になりました。くだらない質問ですがお願いします。
434132人目の素数さん:04/03/30 18:08
>>425
どういう人かわかりませんので、>>426の東大出版会の
本でもいいかと思いますが、それが難しいようでしたら、
「はじめての統計学」鳥居泰彦著もよろしいかと思います。
社会人の人や、普段数学を全くやっていない学生に統計学を
したいと聞かれたときには、こっちのほうを勧めています。

自分も母標準偏差と標本標準偏差でのn-1の疑問について
正確に理解せねばならなくなりました。

ttp://trao2go.hp.infoseek.co.jp/toukei1.pdf
消えてしまったみたいですが・・・・何処かに良い説明がないものか
>>435
あー、再アップしときました。
前回指摘された部分は直してません。

ご存じかと思いますが、もともとは分散用に書いたので、
適宜読み替えて下さい。
アップありがとうございます
早速、拝見させていただきます
438132人目の素数さん:04/04/03 15:25
医学的な評価(かなり重篤・重篤・やや問題あり・問題なし等)の解析を
する場合

かなり重篤:4
重篤:3
やや問題あり:2
問題なし:1
のスコアを重篤度に割り当てて

処理前と処置後を比較する場合(1群比較)⇒ウィルコクソンの符号付順位検定
実薬とプラセボを比較する場合(2群比較)⇒マン・ホイットニー検定(ウィルコクソンの順位和検定)
でOKですか?
また、スコアの割り当て方はこのように単純な割り当て方で大丈夫でしょうか?
誘導されたのでこちらへ

例として言えば
1/100=100/10000
↑数学上は=なんでしょうが実際問題同じじゃないと思うのです

たとえば、なにか揉め事があったとして
100人の中の1人が自分の味方をしてくれるのと
10000人の中の100人が自分の味方をしてくれるのでは全然違うと思いませんか?

10発のうち1個玉が入ってるロシアンルーレットと
100発のうち10個玉が入ってるロシアンルーレットどっちを選びますか?
440132人目の素数さん:04/04/04 17:19
>>439
分散を計算せんと。
441132人目の素数さん:04/04/04 18:15
>>439
数学上はではなく
そこでの = は、平均値が等しいという意味。

何が等しいと言っているのかを指定しないと
意味がない。

例えば、単位の違うもの、
長さ = 面積
みたいなことはしてはいけないでしょ。
数学上でも、こういうのはしてはいけない。

割合とか、確率とかが等しいか否かというのは
平均値だけでは決まらないので
違うものだと感じるのも仕方ない。
442132人目の素数さん:04/04/09 23:06
SDEに関する推定の問題って扱ってる人知ってますか?
ファイナンスで使いたいんですが・・・
あと,ジャンプのあるやつとか,推定できるんですか?
443132人目の素数さん:04/04/11 04:53
最小二乗法(多項式近似)に関する質問。
ちょっと数学的センスが必要かも。

あるデータを多項式で近似しようとして、丸ごとだと、あんま近似よくない
から、区間をいくつかに分けてそこで多項式近似するとします。
区間の境界の点どうしますかね?区間ごとの多項式曲線無理やりつなげるの
はさすがによくない気がしますが。。。
正解は一つではなくてようはアイデアの問題でしょうが、
なかなかいいアイデアが浮かばない。。
444132人目の素数さん:04/04/13 03:56
>443
ひとつのアイデアとしては、
X1<境界点X2<X3で、予測がx<X2でf(x)、X2<X3でg(x)のとき、
X1<x<X3の予測を
f(x)*p+g(x)*(1-p) ただし、p=(X3-x)/(X3-X1)
と重み付けしてやるとか。
滑らかにしたかったら、場合分けの範囲を被らせてやるとか。
でも、滑らかにしすぎると、場合分けした意味がなくなる予感。
445132人目の素数さん:04/04/13 04:41
>442
専門じゃないので、かじっただけですが、
多分、SDE=Stochastic Differencial Equation(確率微分方程式)
のことだとして、とりあえず、
ファイナンス,確率微分方程式、(ジャンプ)
で、ぐぐってみると、どれだけの人がやってるかわかるかと。
伊藤さん、ブラックショールズさんとか余裕という人なら、すいません。
446132人目の素数さん:04/04/13 19:38
>443
区分の境界点で、推定値が連続した値をとるようにした関数で、
スプライン関数というのがあるそうな。
ノンパラメトリック回帰の分野になると思われます。
カーネル関数を用いて局所的にやる方法もあるらしい。
447132人目の素数さん:04/04/13 21:29
凸包の中から一様にサンプリングするアルゴリズムを
誰か考えてください。
お願いします。
448132人目の素数さん:04/04/14 02:31
>438
昔は、1群比較でやっていましたが、今は、
処置前と処置後を比較する場合(1群比較)は、
治療以外の要因による見かけの治癒、軽快
例、心理学的作用(患者側、医者側ともに)、自然治癒軽快など、
による要因の作用を取り除けないので、
やはり、対照群を置く、2群比較でデザインするようです。
要するに、1群比較だと、治療以外の要因じゃないんですか?と突っ込まれても
反論できない。>意味ないじゃん

スコアの割り当ては、それだけじゃ、なんとも。
まぁ、普通はそれでいいと思いますが。
449132人目の素数さん:04/04/14 02:45
>447
何がやりたいのかイマイチわからないんですが、
凸包の中の点に番号ふって、同じだけクジつくって、ひいて、その番号の点をサンプリング、とか
まぁ、PCで乱数発生させて、やるんだろうけど。
450初学者です。:04/04/14 21:13
多変量解析を1から勉強し始めたいと考えています。
ひとまず、深い内容は置いておき、「多変量解析で
何ができるのか」からまず知りたいと思っております。

どんな本から勉強すればよいのでしょうか。
お詳しい方おしえていただけないでしょうか。
お願いします。

ちなみに統計学は初歩程度の知識しかありません。
451132人目の素数さん:04/04/17 11:41
ベイズの定理が載ってる確率に関する良い書籍って無いかなぁ?
452132人目の素数さん:04/04/17 11:52
>>451
基本的な定理なので、大抵の本には載っています。

統計の本で
「統計学入門」東京大学出版会
あたりから読むといいかと思います。

確率論の本は、素人には難しいのであまりオススメしません。
一般の人がイメージするような確率は大抵は統計学です。
数学でいうところの確率論は、大学で学ぶ基本的な数学を知らないと理解できません。
453132人目の素数さん:04/04/17 11:58
なるほど、確率論と統計学は違うと…なるほどなるほど
どなたか教えて下さい。
ベイズの定理を使った解と、ミニマックス法を使った解が
一致するという定理があったと思いますが、名前を忘れて
しまいました。
hall-steinの定理とか、なんとか、そういった雰囲気の名前
だったと思うのですが、はっきりと思い出せないのです。
よろしくお願いします。
455132人目の素数さん:04/04/17 12:25
ここで質問するのは場違いかもしれませんが、
http://www.fsa.go.jp/inter/bis/bj_20010117_1e.pdf
のP101の426の算出式をEXCELの統計関数を利用して
算出しても、ドキュメントの通りになりません。
EXCEL算出式(PD=0.2)
976.5*NORMSDIST(1.043*NORMSINV(0.2)+0.766)*(1+0.47*((1-J204)/J204^0.44))=784.3
ドキュメント=479
統計関数の使用法が違っているのでしょうか。
ご存知の方いらっしゃいましたら、教えてください。
456132人目の素数さん:04/04/17 12:53
>>455
マルチポスト
以後スルー
>>450
ちょっと古いけど,
・柳井晴夫・岩坪秀一『複雑さに挑む科学−多変量解析入門』(講談社ブルーバックス)
が,事例も豊富で分かりやすいです.
ただし,この本をしっかりと理解するには,行列・ベクトルの知識が必要です.

もし,上の本が難しければ,やはり古い本ですが,
・古谷野亘『数学が苦手な人のための多変量解析ガイド』川島書店
などはどうでしょうか?

なお,この多変量解析については,心理学の分野で応用が
進んでいますので,心理板の心理統計スレで質問されると
有益な助言が得られるかもしれません.
心理統計のテキストでは,私はまだ未読ですが,
・南風原朝和『心理統計学の基礎』(有斐閣アルマ)
はよい評判を聞いています.
458132人目の素数さん:04/04/20 17:28
統計学はおなかがいっぱいになりまつか?
>458
応用次第では?
460132人目の素数さん:04/04/21 22:03
学校の統計学の授業に全くついていけないんですけど、なんかいい本ないですか?
基礎の基礎からわかりやすく書いてる本がいいんですけど。
461132人目の素数さん:04/04/21 22:08
>>460
>>426のじゃだめか?
>>460
昭晃堂
統計学
は演習本だが説明も丁寧でわかりやすい。
初学者に向いている。
理系でということになると、共立出版・数理統計学の基礎(野田一雄著)クラスだろうか。

もう全く手も足も出ないということであれば、とりあえず日本実業出版社 統計・確率のしくみ(郡山彬)
でなれることを勧める。
463132人目の素数さん:04/04/22 04:13
統計は、勉強すればするほど、だまされている気になってくるのは、
気のせいだろうか?
>>460
・文系なのか,理系なのか?今何年生なのか?
・文系であれば,大学受験で数学を勉強したか?
・「学校の統計学の授業」というのは,一般教養の科目なのか,
 あるいは専門課程の科目なのか?
・今使っているテキストは何か?
といったあたりを書いてくれないと,答えようがない.
465132人目の素数さん:04/04/22 17:15
xi=(X-Xm),yi=(Y-Ym),σ^2=pは既知である
Σxi^2=q,Σyi^2=r,Σxiyi=v
である。
Yi=α+βXi+uiのときの最小二乗推定量はa,b
1)β>0を検定せよ
2)β=1のときの第二種の過誤をもとめよ。

この2がわかりません。
かなり初歩的な問題ですみません。
P(U)=P(Hoを採択|H0が間違っている)
ということまではわかるのですが
具体的に求めることはできるのでしょうか?
466465:04/04/22 17:17
サンプル量は30でした。
有意水準は0.05です
467132人目の素数さん:04/04/22 20:34
誘導されてきました。
統計処理が分からんす。

右手の握力を図ります。
その時、片手だけ握るのと両手一緒に握る場合の結果を処理したいと
思ってます。どこをどう処理すればよろしいでしょうか。
男子16人、女子16人を測ってます。

測定の仕方で有意差が出るかどうかからまず調べたいのでつが…
468132人目の素数さん:04/04/22 20:56
>>467
>測定の仕方で有意差が出るかどうかからまず調べたいのでつが…

測定の仕方ってのは何?
有意差ってのは、何と何の差?
469132人目の素数さん:04/04/22 21:21
測定の仕方
  1右だけ握った場合の右の握力
  2両方同時に握った場合の右の握力

  (つまりは右の握力)

有意差
 上記1と2の測定結果


です。はっきりいって私は統計のど素人です。
統計のサイト見てますが、よくわかりません。
迷惑でなかったら、入門に適したサイトとかも
紹介していただけると嬉しいです。
470132人目の素数さん:04/04/22 22:41
近頃、確率の現実への対応問題を考えています。
統計によって導き出された仮説を現実問題へ適用する場合
 ・理想的コインの裏表について、何故同様に確からしいと言えるのか。
 ・ランダムサンプリングによって、何故母集団と近似できるのか。

などがありますが、これらはどうして一定の値(確率)に収束するのでしょうか?
科学哲学というか、確率の成立根拠を問うような質問になって申し訳ないです。
教えて下さい。
グラフや表を作る時に、「全体のデータ個数」という意味で「N=」と書くじゃないですか。
この「N=」って何の略なんですか?ナンバー?

472132人目の素数さん:04/04/23 07:49
>469
有意差の候補として、
平均値の差
分散の差
平均値の比
分散の比
とか、色々あります。
ま、多分、この場合は、平均値の差の検定だとして、
対応のある2群の平均値の差の検定。
青木先生の統計学自習ノートが便利かと。
ttp://aoki2.si.gunma-u.ac.jp/lecture/
473132人目の素数さん:04/04/23 08:54
>470
まず、統計と確率はちがいます。統計は確率を利用させてもらっているだけです。
コインの問題。
表裏各々1/2の確率で出るコインを理想的コインと定義。
現実には、コインは理想コインではないから、
帰無仮説:表裏各々確率1/2
対立仮説:表裏各々確率1/2でない
有意水準5%で検定する。
検定量が棄却域に入れば、「表裏各々確率1/2ではない」
入らなければ、「表裏各々確率1/2ではないとは言えない」

要するに、本当に、表裏各々確率1/2ならば、
100回中95回は「表裏各々確率1/2ではないとは言えない」になるということ。
もし、検定量が棄却域に入らなければ、統計的には、
「表裏各々確率1/2ではないとは言えない」と解釈します。

以下は、自分の勝手な感覚ですが、
実際に有意ならば、統計的に有意になるだろう
要するに、統計的に有意だからと言って、実際に有意とは断言できないが、
他に統計的手法よりいい手法がないから、仕方なしに使っている
という感じでしょうか。そんな感じの論文を見かけたことがあります。

あと、言葉の定義が曖昧です。文系の方でしょうか。
根源的なことを問うなら、なおさら、定義を見直した方がいいと思います。
>465
2)でβ=1のとき、って言ってるから、
P(II)=P(Hoを採択|β=1)
を求めてやる
帰無仮説β=0のときの検定量の分布と、
対立仮説β=1のときの検定量の分布は、ちょうど1ずれてて、
β=1のときの検定量の分布で棄却域に入らない確率を求めればよいはず
475132人目の素数さん:04/04/23 19:12
>>473
回答ありがとうございます。
適当に質問してしまったようでご迷惑おかけします。

統計的な手法では、無視してもたいした問題のない
誤差があることを認めているわけですね。
そして、その仮説検定によって得られた信頼度に基づいての推測は
あくまで「有意」、または「近似」であるということですね。

さっき私の聞いたのは、根源的なことというより
言葉の使い方を聞くようなものになりますが、
例えば、理想的コインを延々と投げ続けて裏表を数える場合に
裏、表の相対度数がある一定の値(理論値)に収束を見せるような現象は
「ある”規則”に従っている」と言えるものなのでしょうか?
ある事象が特定の確率分布に従うことは、一種の”秩序”と
見なせるのかどうかということです。

言葉足らずでしたらすみません・・。
476469:04/04/23 19:25
>472さま
ありがとうございます。
さっそく平均値や分散の意味を調べ、
検定の意味を調べたいと思います。
紹介もしていただきありがたく思います。
>475
大数の法則が適当かと。ベルヌーイさんの偉業です。
下のサイトでシミュレーションと証明があります。
関西学院高等部の丹羽先生のページ
ttp://www.kwansei.ac.jp/hs/z90010/sugakuc/toukei/toukeihy.htm
478132人目の素数さん:04/04/24 07:40
なんつーかさー漏れから見るとさー
統計学ってどうもサイエンスじゃなくてさーエンジニアリング
って感じがするわけよ だってさー100%じゃないじゃん?
例えば5%の確率でそうならないことも予想さるわけでさー
命をかけられないわけよ怖くて
もっとこー漏れが風邪ひいてても鬱な気分になってても
もの凄く幸せな気分でいるときもおかまいなしに信用できる
結果じゃないと落ち着かないしそれを使ってさらなる複雑でかつ信用に足る論理展開ができないわけよ
この現象はこういう分布に従うとかってさー現象論につぐ現象論でしょ?
なんでその分布に従うか厳密に証明できてないけどどうもなんべんやってもこういう分布だとかでしょ?
物理学のように現象論から帰納っつーの?
最初はどうもこうなる事しかわからなかったが
細分化して突き詰めていって原子だとか
電子だとか量子だとか元々の原因を明らかにするんじゃなくて演繹ばっかでしょ?
そこに漏れはサイエンスをいまいち感じないわけよ
もう誰か統計学はエンジニアリングだって認めてくれれば
漏れも真面目に勉強しようかと思ってるんだよ
そうすれば2回も単位落とすことも無くなると思うんだよ
その通り
統計学は理学部数学科には入れてもらえない
確率は入ってるけど
まじめに勉強しなはれ
480132人目の素数さん:04/04/24 10:01
>>478
>なんでその分布に従うか厳密に証明できてないけどどうもなんべんやってもこういう分布だとかでしょ?

サイエンス全般に渡ってそう。
物理も例外ではなくそう。
サイエンスに厳密に証明できてることなど何も無い。
物理は世界中でなんべんやってもこういう実験結果だから
正しいというところが足場になってるわけで
そこが保てないと机上の空論になってしまう。
統計学はサイエンスの足場の重要な一部を成し、その意味では数学的である。
481132人目の素数さん:04/04/24 18:41
>>477
分布に従うことを秩序や規則であると呼べるのでしょうか?
また逆に、統計における誤差の存在こそが秩序では?と思えるわけです・・。

>>480
そうですよね。どんな実証的科学でも
繰り返し実験で統計をとって有意水準にあるのなら
それは正しいと認めるわけですよね。
482478:04/04/25 01:18
統計学が大事だということはわかった
ナイチンゲールだかヘレンケラーだかが統計学を用いて
多くの人命を救ったというのもきいた
あとは統計学が科学か工学かだ
科学だというのなら漏れはまた単位を落とす
工学だというのなら漏れは割り切って勉強できるから単位はAだ
483132人目の素数さん:04/04/25 03:21
>>478
 あなたは全くいいことをおっしゃる。
 日本統計学会の評議員の先生方でも、よくあなたのような
 ことをおっしゃいますよ。
 統計学は実学ですから、数学科とはちょっと違った
 ものかもしれません。
 もちろん、統計学の基礎は数学や確率論ですけど・・・。

>>481
 統計学では、「正しい」などとは言わないと思うなあ。
 有意かどうかは、検定による結果だけど、有意水準の
 決め方に論理性がない(5%とか1%とか)から、
 そんなに厳密なものではないし、
 正規分布に見える事象でも、データを多く集めると
 正規性のテストにとおらないからデータ数を少なくして
 テストして論文にしたりする。
 結局、実際の統計処理ってあいまいなところもあるんだよね。
 ただし、理論としての中心極限定理は美しいと思うよ。
484132人目の素数さん:04/04/25 03:23
>>475
 コイン投げを続けた結果は、経験的確率といいます。
 理論的確率とは区別します。
天気予報の降水確率の理論をお教え下さい。
486132人目の素数さん:04/04/25 17:05
>>485
 天気図や、気圧配置を基にして行うのは、空間統計学の
 手法を使ったりするし、過去のデータからだったら、
 確率過程をつかったりするが、気象庁の使っている方法は、
 いろんなデータを見て、最終的には人が判断しているらしいね。
 細かいことは専門家でないからわからんけど・・・。

漏れが知りたいのは気象のパラメータを最終的に10段階に統合する手法です。
どのような統計処理を施しているのかということ。
>>487
ならば板違い。この辺で聞くべきだと思う。

天文・気象板 初心者質問すれ。PART XI
ttp://science2.2ch.net/test/read.cgi/sky/1077609048/
ガウスの誤差関数の導出について詳しく書いてあるお勧めの参考書
ありませんか?
検定(片側は除く)でサンプル数をかなり大きくしていくと必ず有意にできる。
理由は、検出力がUPして、どんな小さな差でも検出してしまうから。
だから、最近の論文は、イフェクトサイズが小さいと通らないらしい
491132人目の素数さん:04/04/28 08:33
混乱してきたので教えてください。
え〜〜っとサンプルとってその値が、1.1,1.2,1.3,1.05,1.07
だったとしますね。(実際、値はどうでもいい)
で、1.09である信頼レベルってどれくらい?
という問題です。よろしくおねがいします。
初学者ということで>>434で紹介していただいた「はじめての統計学」鳥居泰彦著を熟読しました。
次のステップに進みたいのですが、「統計学入門」東京大学出版会でよろしいでしょうか?
よろしい
>491
母分散がわからないので、不偏分散で代用して基準化。
すると、Student t分布に従う。
標本サイズ = 5
平均値 = 1.144 (1.144)
不偏分散 = 0.01093 (0.01093)
標準偏差 = 0.104547 (0.104546640309481)
1.09を基準化すると(1.09-1.144)/0.104547=-0.52
あとはt分布表を見ればp値が出てくる。正確にはソフトで計算。
1.09〜1.198は、だいたい40%くらいの信頼区間
ただし、区間推定では、p値の値自体はあまり意味がない

先に、有意水準を決めて、p値がそれより大きいか小さいか判断する。
つまり、先に、信頼区間を作ってから、標本がその区間に入っているかどうかを判断する。
信頼区間内外のどこらへんにあるかはあまり意味がない。
訂正。標本じゃなくて、標本点。
書き忘れたけど、母平均の信頼区間の話ね。
496132人目の素数さん:04/05/02 13:09
こちらにということですので、よろしくお願いします。
(1)確率変数X,Yはそれぞれ0,1,2の値をとる確率変数で、
以下の同時確率分布関数を持つものとする。
fX,Y(x,y)=1/(5(3−|x+y−2|))
このとき、E(X),V(X)およびC0V(X,Y)を求めよ。

(2)確率変数XとYは独立でともに区間[0,1]上の一様分布をもつ。
このとき、確率変数ZをZ=X^2+Yと定義するとき、
確率変数の組X,Zの存在範囲と同時密度関数
fX,Z(x,z)を求めよ。またZの密度関数fz(z)を求めよ。
よろしくお願いします。
>496
(1)とりあえず、(X,Y)=(0,0),(0,1),....,(2,2)の確率をそれぞれ計算してみ?
(2)ヤコビアン使う公式、教科書で探してみ?
498132人目の素数さん:04/05/05 00:26
質問です。
全くの文系人間で、この質問がスレ違いであるか否かにも自信がありません。
気が向いたら教えていただけると嬉しいです。

データが正規分布をとらない場合、正規変換を行う必要があるということなので
データを対数変換し、それでヒストグラムを作成してみました。
しかし元データのヒストグラムよりは正規分布の形に近づいてはいるのですが
凸凹していて、山のような形(分かりにくくてすみません)にはなりません。

しかも元データによるヒストグラムは「正の非対称が強い」状態であったのに
対数変換後のデータによるヒストグラムは、値が0の階級が多く「負の非対称」気味です。

最終的に正規分布をとるようにしたいのですが
どのような作業を行えばいいのでしょうか?
499132人目の素数さん:04/05/05 00:36
500132人目の素数さん:04/05/06 07:51
数学、統計の素人です。教えてください。
URLと本文の一部を以下にコピーしました。
最後の行に拡張係数と言う表があります。過誤採択リスク1%のとき1.9というやつです。
過誤採択リスクから拡張係数を計算で導くにはどんな計算式になるんでしょうか?
計算式がそうなる理由も要約的でかまいませんので教えてください

http://home.att.ne.jp/sea/tkn/operations/Operations-Stats.htm#変数サンプリング
(5)標本サイズの調整
仮定0%の誤表示率に基づく公式により標本サイズを決定しているので、誤表示発見の事実に基づいて標本サイズをは増加しなければなりません。
予期される誤表示がゼロではないときの修正されたサンプル数の公式は次の通りです。
AM = 予想誤表示
EF = 以下の表による拡張係数
  過誤採択のリスク
1% 5% 10% 15% 20%
拡張係数 1.9 1.6 1.5 1.4 1.3
501中川泰秀:04/05/06 08:04
牧浦健二先生は、関西学院大学時代に何年かけても、
この科目(統計学)だけは単位が取れなかったらしい。
502132人目の素数さん:04/05/06 23:36
質問です。

B ~B
A 123456 223456
~A 23 45

のような要因Aを持っているグループと持っていないグループのサイズが違う
分割表をX二乗検定やフィッシャーの正確な検定をしても不具合はないでしょうか?
503 :04/05/06 23:39
いま、2つの互いに独立な正規母集団N(μ1、(σ1)^2)、N’(μ2、(σ2)^2)から大きさがそれぞれN1、N2の互いに独立なサンプルをとる。
(a)仮説H0:μ1=μ2を仮説H1:μ1≠μ2に対し有意水準αで検定する手続きを述べよ
(b)N1+N2=Nのとき、この検定の検出力(H1が真のときH1と判定する確率)が最大となるようなN1,N2を求めよ。ただし、N1、N2は連続値をとるものとしてよい。

検出力の式の出し方がわかりません。お願いします。
504132人目の素数さん:04/05/08 20:20
経験分布関数とはなんでしょうか?ベイズと関係があったりするのでしょうか・・・・
>502
同総数で同程度に割り振ってある場合と比べると、検出力が下がる
ので、調べるときは、同程度に割り振ってある方が効率的
でも、総数が少ないよりはいい。効率は悪いが数で勝負みたいな
>503
多分、σ1、σ2が既知だとして、話をすると、
平均差の推定量δ^=X~-Y~
帰無仮説の下で、δ^〜N(0,σ1^2/N1+σ2^2/N2)
よって、棄却域は{|δ^|>δ(α)}
対立仮説の下で、δ^〜N(μ1-μ2,σ1^2/N1+σ2^2/N2)
検出力はPr{|δ^|>δ(α)}
ということは、|μ1-μ2|がσ1^2/N1+σ2^2/N2に対して大きい方が検出力が高い
てことは、σ1^2/N1+σ2^2/N2を最小にすればよい。あとは、相加相乗平均
>504
経験分布関数は、標本から作った分布関数
普通の分布関数は、理論から作った分布関数

コインを1000 回振って表は1裏は2を記録するという実験を行った結果
Xi 度数 相対度数 経験分布関数F(Xi)
1 457 457/1000 457/1000
2 543 543/1000 (457+543)/1000
Xi 確率 分布関数F(Xi)
1 1/2 1/2
2 1/2 1/2+1/2
丁寧なレスありがとうございました。
509132人目の素数さん:04/05/13 00:59
主成分分析の欠点について論述せよという課題で困っています。
どなたかうまく説明できないでしょうか?

初めて統計を学び始めたばかりでよくわかりませんでした。
よろしくお願いします。
ランダムウォークの次の一歩って予測可能?
511132人目の素数さん:04/05/13 03:25
>>510

あなたが言ってる予測可能の定義とは?
「ランダム」ウォークですよ。
>509
今、思いつくのは、
1、主成分分析の結果が既知の知見と整合性があるとは限らない
例えば、テストの点を解析して、主成分が、理系要素、文型要素、、、、
となってくれない場合、解釈に困る
2、主成分軸の回転は、解析者によって異なる
3、実態を把握するために必要な変数が抜け落ちている可能性

まぁ、3は主成分分析に限ったことではないが。
513509:04/05/14 02:50
>>512
レスどうもありがとうございます。
3についてよくわからないことがあります。
追加で質問してもよろしいでしょうか?

3の実態を把握するために必要な変数が抜け落ちてしまう可能性があるというのは
どういう原因から起こりうることなのでしょうか?
3は、主成分分析するときに必要な変数が抜け落ちる、のではなくて、
最初から考慮に入れていなかったということ。
原因は、解析者の観察不足。

例えば、成績を分析するのに、
国語、算数、理科、社会で解析したが、
実は、体育も必要だったみたいな。
515主成分分析の欠点:04/05/15 14:02
線形性や、正規分布の仮定は?
516132人目の素数さん:04/05/15 17:00
統計モデルを造るときにセグメント毎につくるときがありますよね?
どうしてセグメント毎につくるのでよしょうか?
517132人目の素数さん:04/05/15 22:50
既出の質問かもしれませんが、お願いします。

統計学を習ってて疑問に思ったのですが、例えば母集団が10万人だとすると、
いったいどのくらいの人数について調べれば、その集団の性質が分かるのでしょうか?
どのくらい調べたら信用できるかってことを知りたいです。
518132人目の素数さん:04/05/15 23:40
519132人目の素数さん:04/05/15 23:51
>>518
ありがとうございます。
今度書店で見てみます。
>516
ひとつのモデルで作りたいけど、作れないから
仕方なく、セグメント毎に作る
ひとつのモデルで表すことがでできるなら、ひとつのモデルで表したい。
ひとつのモデルで作るか、セグメント毎で作るかは、解析者の判断次第。
SPSSでウィルコクソンの符号付順位検定をすると、
代表値の上昇・低下に関らず、統計量の値が常に−になってしまうのですが、
これはあまり気にしなくてもいいんですか?

有意差が出たときに代表値が上昇したか悪化したかどうかを見るためには、
順位の出力(正の順位和、負の順位和のどちらが多いか)を見ればいいのですか?、
522132人目の素数さん:04/05/16 21:35
質問です。
P個の正規母集団から互いに独立なn個ずつの観測値を得る。
母集団の分散は全て等しいが、P個の母集団の期待値u1...upは
1つのみが他より大きく、他は等しい。
この最大の期待値を持つ正規母集団からの標本平均の確率密度関数をf(x)、
分布関数をF(x)とし、他の正規母集団からの標本平均の確率密度関数をg(x),
分布関数をG(x)とする。

「第1母集団の標本平均m1が最大であった時、第1母集団の期待値u1が最大の期待値
 である確率をf(x),F(x),g(x),G(x)を用いて表してください。」
という問題で次のように解きました。

@m1が最大になる確率=(1/p)f(m1)G(m1)^(p-1)+((p-1)/p)g(m1)F(m1)G(m1)^(p-2)

Am1が最大になり、かつu1が最大の期待値になる確率=(1/p)f(m1)G(m1)^(p-1)

求める確率はA/@
これで合っているでしょうか?自信がありません。

ちくと質問なんですが、
回帰分析で最小二乗推定量の下での残差二乗和は
任意の推定量の下での残差二乗和よりも大きくないのは何故と聞かれて、
「そういう風に推定量をとったから」と答えたら、
数式で示せる?と聞かれまして、どうやってしめしたらいいんでしょうか?
524132人目の素数さん:04/05/17 05:08
ペンシルベニアが米海軍で最後まで残存していた唯一の戦艦であり、
英海軍のキングジョージ五世などといっしょに水爆実験の標的艦と
なったのはよく知られている。
しかし、戦後すぐ、自国の広大な農業地帯を自らの焦土作戦により
失った米国の、深刻な食糧難をしのぐ手段として捕鯨母船に使われた
ことはあまり知られていない。
もっとも大きすぎて使いにくかったらしく、短期間の使用で捕鯨母船
のノウハウが得られたのちに、造船所で建造途中で放棄されていた
クリーブランド級やアトランタ級の艦艇が捕鯨母船として完成してから
はほとんど運用されなくなった。
もともとエスキモーなどをのぞいて鯨肉を食べる習慣のなかった米国
では、これを機にふたたび大規模な捕鯨が行われるようになり、
19世紀に北太平洋の鯨を絶滅寸前においやったのに続いて南太平洋や
南氷洋の鯨にも危機的な状況をもたらした。このため、現在では東西米国
に対する商業捕鯨の割り当ては停止されている。
わが国では庶民の味である鯨肉であるが、米国ではエスキモーにのみ
認められた生存捕鯨で得られた鯨肉が、高級食材として高価で取引されて
いるという。
>523
教科書の求め方、そのまま。
526よだ:04/05/17 18:17
入門統計学 共立出版 P63 問9
解答みても,全然分かりません

問 Xの分布を一様分布U[0,1]とするとき,Y=1/Xの分布関数G(x)と密度関数g(x) を求めよ.

解 G(x)=0(x≦1), G(x)=1-1/x(x≧1), g(x) = 1/(x^2)(x≧1), g(x) = 0(その他)
527132人目の素数さん:04/05/17 21:00
http://www.amazon.co.jp/exec/obidos/ASIN/4061539582/qid%3D1084529666/249-5974308-4513900
確率・統計入門―数理ファイナンスへの適用
528132人目の素数さん:04/05/18 01:49
偏差の絶対値の和の平均の意味とは何でしょう?

こんな課題を出されてもまるで分かりません。

分散
530132人目の素数さん:04/05/18 18:52
教えてください。統計に触れるのがはじめてで・・・

調査年 商店数(千店)
1972       259
1974  292
1976  340
1979   369
1982   429
1985  413
1988  436
1991  462
1994  429
1997   392
1999  426
2002   380

この表で1972年を100としたらその後の商店数がどうのびてるか
を出したいとき、どうやって統計を出したらいいんですか?
531132人目の素数さん:04/05/18 23:26
パネルデータ分析とはなんでしょう?
Webで調べてもわかりやすい説明が見つかりません。

回帰分析の発展系みたいなイメージを持ったのですが・・・・
>526
G(Y)=Pr(Y<y)=P(1/X < y)=Pr(X > 1/y)=1-Pr(X < 1/y)=1-F(1/y)=1- 1/y
定義域と不等号の=は自分でヨロ
>522
f(x)は確率密度関数だから,連続な関数で、
P(x=m1)=0≠f(m1)
だから、
m1が既知ならば、
P(m1最大,u1最大)=P(m1最大|u1最大)P(u1最大)=G(m1)^(p-1)*(1/p)
「第1母集団の標本平均が最大であったとき、
第1母集団の期待値u1が最大である確率」を求めるならば、
P(m1最大,u1最大)=P(m1最大|u1最大)P(u1最大)=int{f(x)G(x)^(p-1)}dx*(1/p)
だと思うんだが。。。おれも、自信ないっす。
これってベイズだよね?苦手だ。
>>530
259を基準にすることを意味するから、259で割ればよい。
その後で100をかけることになる。つまり、
1972年以降の商店数に、100/259をかければいい。


535132人目の素数さん:04/05/19 01:53
ありがとうございます!できました!
>521
その通り。
SPSSもってないけど。
正の順位和、負の順位和の小さいほうを統計量として取るから
正規近似すると統計量は負になって、下側を棄却。
大きいほうを統計量として取って正規近似して上側を棄却するのと同じ。
>528の答え、俺もわからん。
独立な確率変数(X11,X12,...,X1n),(X21,X22,...,X2n),...,(Xm1,Xm2,...,Xmn)があって、
偏差の和Σ|X1i-X1.~|
それの平均1/m ΣΣ|Xji-Xj.~|
これで合ってる?
偏差の絶対値の平均なら、絶対偏差という名前があるが。
538X2でしょうか?:04/05/19 12:40
東京港区と江戸川区で、国産車と輸入車の占める割合のデータがあるとします。
仮説は「港区には江戸川区より輸入車が多い」であるとして、
検定方法はどうすれば良いでしょうか?
観測値から期待値がわかるので、カイ二乗を使おうかと思いますが、
この場合だと仮説は「観測値と期待値には有意の差がある(かどうか)」であって、
港区と江戸川区の実際の比率を比べているわけではないですよね・・・。
どなたか教えてください!!
>538
χ2乗分布による適合度検定と,独立性のχ2乗検定を混同してない?

540132人目の素数さん:04/05/19 21:48
社会学方面の実務で検定なんて絶対にしねぇ。
541132人目の素数さん:04/05/19 21:49
おまえら無駄なことしてるぞ。
製薬会社にでもいくつもりか?
             |
〜〜〜〜〜〜〜〜|〜〜〜〜〜〜〜〜〜〜
             |     >( c´._ゝ`)
             |
             J   >( c´,_ゝ`)
                    >( c´,_ゝ`)
>>540
「社会学方面の実務」って何を指してる?
俺は社会学部出身のしがないサラリーマンだけど、
統計検定はしょっちゅう使ってるよ。

ちなみに、製薬会社ではない。
544132人目の素数さん:04/05/19 22:19
>>543
は?自己満足のオナニーだろ?他人に検定の結果を公表しているか?
馬鹿学生が妄想してるよ・・・・

そういえば社会学部ってどこも(ry
545よだ:04/05/20 01:41
>>532
何となく,わかりました.
どうもありがとうございます.
製薬に行く気満々ですが。
統計が使われてる分野って大きく分けてどれくらいある?
計量生物学,計量経済学,計量社会学,計量心理学
あと、どこ?補足よろ。
それから、社会学の中って、どんな風に分かれてるの?



548132人目の素数さん:04/05/20 19:38
以下のような宿題が出たのですが、どのように
答えればよいでしょうか?(数字は全て変えてあります)
*****************************************
Aくん…英語:50, 数学:62, 国語:61
Bくん…英語:80, 数学:70, 国語:55
※平均点は全て50点とし、標準偏差は8とする。
2人の特徴について考察を述べよ。
*****************************************

標準化して、偏差値を出して、それに関しする
意見を述べてみたのですが、「特徴について」という部分を
どうやって答えていいのか分かりません。
何かアドバイスがあったら教えてください。
549546:04/05/20 19:46
統計データの種類じゃなくて、
学問としてどう分かれてるのか知りたいのだが。
心理学って社会学に含まれてるよね?ちがったっけ?
>>549
氏ねよ
551543:04/05/20 22:02
>>544
残念ながら、クライアントに提出する報告書に使ってるよ。
カテゴリカル・データが中心だがね。

χ二乗検定や二項検定は数こなさなきゃなんないんでExcelで関数組んでやってる。
あとはt検定、分散分析、因子分析、重回帰、クラスタ分析(k-meansが多い)、
コレポン、決定木ぐらいかな。

今はSEMの勉強中。
半分趣味でRもいじってる。

……っと、ここまで書けば業種も分かるでしょ?

ほんと、学生時代にもっと勉強しておけば良かったと思ってるよ。
>>551
笑えるよ。

ずいぶん少ないサンプル扱ってるんだな。(w
夢と希望にあふれた1,2年目とみた。

しかもExcel(w
SASの使える会社に転職することからはじめような。

ついでにRは実践向きじゃねぇぞ。
言語使用は綺麗だが。

検定・・・・ぷ

質問側も回答側もいい姿勢でいい雰囲気のスレだと思ってたのに、
一人の粘着のおかげではいお終い。
554132人目の素数さん:04/05/20 23:35
宿題はじぶんでやれ
555132人目の素数さん:04/05/20 23:46
くだらない質問坊よりずっと為になる気がする。
556543:04/05/21 00:28
>>552
サンプルサイズは数十から数百、多くても数千だね。

この業界(?)には入ってからは4年目だよ。

道具のために仕事をしてるんじゃなくて仕事のために道具を使っているので、
SASを使える会社に転職したいとは思わんなぁ。

Rが実践的じゃないってのはどこらへんを指してるの?
定型処理には使えそうかな、っと思って勉強してるんだけど。
聞かせて欲しいな。

あと、Wekaも面白いね。Rみたいに日本語で詳しく紹介してくれるサイトが
現れたりすると嬉しいのにな。
557132人目の素数さん:04/05/22 01:37
excelで出来る仕事なんてたかが知れてる。
558132人目の素数さん:04/05/22 12:27
重回帰変数の偏回帰係数を並べて何の意味があるのかと。
相関係数がゼロの変数群じゃないだろと。
そんなレポートに意味があるのかと。
559132人目の素数さん:04/05/22 13:08
>>558
重相関係数が0に近かったのですか???
>>557
その通り。
Excelで出来る仕事なんてたかが知れてる。

逆に、「たかが知れてる」程度の仕事ならExcelで十分。
SAS入れてるのに、平均値しか使わないって会社もあったりするけど。
561132人目の素数さん:04/05/22 17:43
>>560
まぁ数百万オブザベーションの平均を求めるのはExcelにはできんべ。
562132人目の素数さん:04/05/22 22:37
すいません。野球板のものです。
下記の例でアウトカウント別の安打数(打率)に有意差があるか検定していただけないでしょうか?
統計学に無知ですみませんです。

   打数 安打
無死 30  6
一死 34  18
二死 47  10
563セフィラ ◆SephirRldQ :04/05/23 00:29
将棋板から来たものです。
質問させて下さい。

7人制の団体戦を行います。
7人同時に戦い4勝以上したチームが勝ちです。
チームの登録は14人でき、その中から7人を選びます。
選手には力の差があります。

通常なら強い7人を出すのが有効だと思います。
ただ、相手のチームのメンバーがある程度予想できる場合、
いわゆる「当て馬作戦」(強い人に弱い人を当てる)が
有効になるのはどんなときでしょうか。

それは確率的にある程度の目安が計算できるものでしょうか。
>>562
漏れも初学者なんでアレですが、
χ二乗検定(独立性の検定)だと p=0.0031、
Cramer の連関係数は 0.3218、っとゆーことで
「危険率5%で有意差あり(独立性が無いとはいえない)」って感じでいいのかな?
ツッコミよろすこ>識者
ここって質問板か?
明らかに宿題っぽいのは無視でいいよね?
566564:04/05/23 22:53
>>562
ついでにライアンの方法で多重比較してみると、
 無死 vs 一死 alpha'=0.017 P=0.004 で有意差あり
 一死 vs 二死 alpha'=0.033 P=0.003 で有意差あり
 無死 vs 二死 n.s. で有意差なし
って感じでよい? >識者

>>565
自分の勉強のつもりで答えてみました。
すんまそん。

567132人目の素数さん:04/05/23 23:36
平均μ1, μ2, μ3, μ4, μ5 の5つの部品をランダムに継ぎ合わせて組み付ける工程がある。
この工程の仕上がり寸法の規格は,2.020±0.030mmである。各部品寸法の精度(標準偏差)σは同程度で製作できる。
仕上がり寸法が正規分布するものとして,規格を満足しないものが0.3%程度あってもよいとするならば,
各部品精度(σi)をどの程度にすればよいか検討しなさい。




考えてもわかりませんでした。どなたか回答を教えていただけないでしょうか

>>567
そのまんま、シックスシグマって奴じゃダメなの?
プラスマイナス3σ。
>563
まず、単純にモデル化してみるとして、
aチームbチーム3人ずつとして、実力は
a1<b1<a2<b2<a3<b3とする。
bチームの出場順は、
確率1/3で b1,b2,b3
確率2/3で b3,b1,b2
とする
aチームの出場順がa1,a2,a3ならば、
確率1/3で全敗->負け越し
確率2/3で2勝1敗->勝ち越し
よって、出場順a1,a2,a3のとき勝ち越す確率は2/3
他の出場順も同様に計算していけば、評価できる。
相性や、a1対b1の勝率を設定しても応用できる。

まぁ、とりあえず、相手の出場順がしぼれる方が有利。
実際は、相手もコチラの出方を見るから複雑に。
ゲーム理論の話になるのではないかな?詳しくは知らね。
570セフィラ ◆SephirRldQ :04/05/25 00:54
>>569
レスありがとうございます。
参考になりました。
なかなか難しいですね。
571132人目の素数さん:04/05/25 14:58
相関係数、t検定、有意水準、共分散構造分析について、初心者でも分かるようにご教授願います。
本読んで自分で調べろ。あほが
>>571
相関係数→係数がどれぐらい相関するのかということ
t検定→studentのt、の検定のこと
有意水準→有意の水準かどうかということ
共分散構造分析→共に分散しているのかどうかを分析すること
574132人目の素数さん:04/05/27 08:14
質問なんですが、表計算ソフトは無料で手に入りますか?
>>574 openoffice + 日本ユーザ会 でぐぐれ 
使い心地はExcelとほとんど変わらん
576132人目の素数さん:04/05/29 00:02
要因分析に回帰分析を用いるより
非説明変数と説明変数のクロス集計をした方が正確な分析が出来るのでしょうか?
すいません。スレ違いかもしれませんが、統計ってどういうところで勉強する
もんなんですか?大学の理学部?

それから、統計を勉強した人はどういう仕事で飯を食っていけるのですか?
リサーチ会社とか?

なんかこう、最近、サラリーマンではなく、黙々と働く職人っぽい仕事に就き
たいなと思ってまして。
578132人目の素数さん:04/05/29 09:08
おれは、文系だけど大学の一般教養にあったよ。いまは、現代統計実務講座でやってる。

リサーチ会社やマーケティング会社、視聴率調査会社みたいなところもあるが、
企業のマーケ部門や、バイオ、薬品、政府などでも、なんでも使うね。
職人ねえ。統計ソフトを作っている会社とかどう?コンピュータ会社のエンジニア
になっちゃうけど。
579132人目の素数さん:04/05/29 09:32
統計士の資格がとれるやつね。たまに新聞広告載ってる。
民間の資格だから有名じゃないけど、やったことが表現できるから
いいね。> 現代統計実務講座

580577:04/05/29 11:42
>>578
>>579
ありがとうございます。

なんでも使う、というのはそのとおりだと思いますが、普通の会社に入った場合、
何やらされるか分からないわけで、そうするとやはり、リサーチ・マーケに特化した
ところに行くのがよいのでしょうね。

既卒なんで転職するには大学or大学院に入りなおさねばかな。学生時代は法学
部だったので、統計には触れもしませんでした。
581132人目の素数さん:04/05/29 12:11
>既卒なんで転職するには大学or大学院に入りなおさねばかな。
そんなこと、ないって。確かに大学院には、統計の科目あるとこあるけど、
そんなことしなくても、統計業務には携われるよ。
たとえば、こういう切り口でちょっと受けてみるとか、
ttp://www.stat.go.jp/info/saiyo/index.htm
あるいは、
ttp://www.sas.com/offices/asiapacific/japan/training/certify/track.html
こういう認定やってみるとか、
上にかいてある、
ttp://www.jitsumu.or.jp/gendai/
こういう通信教育でマスターするとか。
具体的な今の業務が分からんので、うまく言えないが、
その業務と統計との連動が必要な部門とか、なんかあるんじゃないか?
ちょっと、おれも考えてやるから、今の業務いってみろ。
なんか、思いつくかも知れないから。
582132人目の素数さん:04/05/29 12:17
意志あれば道あり。
583132人目の素数さん:04/05/29 12:24
間違えた。一番上は、公務員試験いるな。なんか、統計局でそんなの要らない
なんか募集してた気がしたが。ちょっと探してみてくれ。わすれた。
バイトだったかなぁ。
夢を壊して悪いけど「現代統計実務講座」なんかを売り物にして転職を考えても
笑い者になるだけだよ。皆どんなものか知ってるから。

実務経験がないのなら計量経済学等の計量@@@を専攻したとかじゃないと難しい。
多分イメージしているような統計職につくのは無理。

下手したらエクセルを使った四則演算しかしない事になるよ。

585132人目の素数さん:04/05/29 19:52
まあ、何かを出来る資格ってわけでもないからね。
いろはを知っているから再度基本的なことを教育しなおしてやる必要はないな、
ってことが分かるぐらいかな。
基本的なこと教えるのは案外めんどくさいからね。教える方も、「標準偏差?、
重回帰分析? そんなのどっかで勉強してきてくれよ」って感じだろうし。
586132人目の素数さん:04/05/29 20:01
統計はあらゆるものの基本。何で勉強してもよし。
それを売りにして就職するのは、難しいかも。素養だから。
でも、がんばれ。
587132人目の素数さん:04/05/29 22:34
今、582が良いこと言った。
588577:04/05/29 23:09
いろいろとありがとうございます。気のせいかもしれませんが、文系スレより雰囲気が
あたたかいですね。

>今の業務いってみろ。
ええと、なんとも微妙なのですが、無職です。卒業して地元の役所に勤めたのですが、
一年で辞めて、また今東京で公務員試験を受けているところです。

総務省の統計局ですか、国1数学職なのですね。センター数学120点だった私が通る
かどうか。

イメージとしては、社会学、経営学、あるいは公共政策の大学院を経由してイ○テージ
みたいな会社に行けたらうれしいななどと思っているのですが。
589義務教育しか数学してない:04/05/30 01:57
ランダムウォークってどんな事か馬鹿でも分かるように教えて下さい。あと1にゅーとんは何の単位でしょうか?
>>589
> ランダムウォークってどんな事か馬鹿でも分かるように教えて下さい。
泥酔のおっさんが猥談する確率のことです

> あと1にゅーとんは何の単位でしょうか?
故竹内氏のメガネの数の単位です
591132人目の素数さん:04/05/30 07:11
無職じゃ、ちょっとおれも思いつかねえなあ。でも公務員めざしているなら、
ちょうどいいじゃん。総務省じゃなくても、他の省庁でも、実は自治体でも
統計調査業務はあるぞ。募集はみてないが(と、いうか意識的に募集を調べ
たことがない)。
592589:04/05/30 12:37
回答有り難いですがそれじゃ抽象的すぎて理解できません。
出来れば具体的に教えて貰えませんか?
ランダムウォークと1にゅーとん。
593132人目の素数さん:04/05/30 13:13
>592
新橋で一杯ひっかけて終電に乗り遅れたおっさん達は
銀座方面に向かうもの、東京方面に向かうもの・・多数いる。
でも最終的に新橋に戻ってきたとさ。
594592:04/05/30 18:07
ランダムウォークなんとなく分かりました。有難う。
でも酔っ払いにこだわる理由は分かりませんが。
595132人目の素数さん:04/05/30 18:56
Q1.赤玉、黒玉、緑玉がそれぞれ1個ずつ入った箱から2個の玉を取り出す。
ただし、最初に取り出した玉を、元には戻さないで次の球を取り出すものとする。
この実験に対する標本空間を作れ。

Q2.黒玉が2個、白玉が1個入った箱から、同時に2個の玉を取り出す実験で、
(A)6個の標本点を用いる標本空間、(B)3個の標本点を用いる標本空間をつくれ。

数学自体がダメな初心者です。

答えはわかるんですが、その前の式がわかりません。
なるべく自分で求めたいので、初心者向きの統計学解説サイトがあったら教えてください。
無いのなら、誰か教えて・・・('A`)
こういうの無視でいいだろ。
>>596

っていうか、式無いじゃん・・・
すいませんでした。
もう質問しません('A`)
>>595
こういうの書くときは、自分でどこまで考えたか書かないと。
それがないと、1から10まで全部教えろと言ってるようにしか思えん。
>答えはわかるんです。

って巻末に答えが載ってるだけだと思われw
600132人目の素数さん:04/05/30 22:08
確率のところなんですが、、以下の問題がわかりません。
(Ω、F、P)を確率空間として、
F1,F2,F3⊂FをそれぞれFの部分完全加法族とする。
FiとFj(i≠j)は独立だが
F1,F2,F3は独立でない場合は具体的に言うと
どのようなな場合でしょうか?

定義で「F1とF2をFの二つの部分完全加法族とする。このとき
任意のC1∈F1、C2∈F2について
P(C1∩C2)=P(C1)・P(C2)
が成立するとき、F1とF2が独立である」というものと
「F1,F2,......,Fnを完全加法族Fの部分完全加法族の有限族とする。
このとき任意のC1∈F1,C2∈F2,....,Cn∈Fnについて
P(C1∩C2....∩Cn)=P(C1)P(C2)…P(Cn)
が成立するとき、Fi(1≦i≦n)はお互いに独立である」という
二つのものがあります。
完全加法族の列は2つずつは独立であるけど、
全体としてはお互いに独立でないものがあるというのは定義
から解ります。
他スレで「C1∩C2....∩Cn = φではないか?」とも言われたんですが
理由が解りません。
この答えで合っているのでしょうか?またどういうとき方をすれば
良いのでしょうか?確率、統計に詳しい方、ご教授願えますでしょうか?
601132人目の素数さん:04/05/30 22:20
>>594
ランダムウォークの日本語訳を調べてみよう!
6021にゅーとんは?:04/05/30 23:07
調べるって?適当に歩くって意味じゃなくて?
あ〜銭湯でのぼせました(*^@^*)頭も。
603132人目の素数さん:04/05/30 23:20
ランダムウオーク=酔歩
ランダムウオーク=乱歩
605577:04/05/30 23:39
>>591
遅レスですが、いろいろとありがとうございました。

とりあえず、行政官になることに全力を尽くします。
606132人目の素数さん:04/05/31 03:33
>600
X,Y,Z
0 0 0
0 1 1
1 0 1
1 1 0
各々1/2の確率で起こるとする
XとY、YとZ、ZとXは独立
XとYとZは独立でない
これでどうかな?
607132人目の素数さん:04/05/31 03:37
1/2じゃなくて1/4
6081にゅーとんは?:04/05/31 09:57
親切にThanks。ランダムウォーク分かりました。
ブラウン運動について定義は在りますか?
統計学とか数学とかダメダメで非常に困ってるんです。
609132人目の素数さん:04/05/31 11:16
>>600
Ω={1,2,3,4} P({・})=1/4  F1={1,2} F2={1,3} F3={1,4} とする。
P(F1∩F2)=P(F2∩F3)=P(F3∩F1)=P({1})=1/4 →独立
P(F1∩F2∩F3)=P({1})=1/4≠1/8=P(F1)*P(F2)*P(F3) →独立でない

で どうだ?
610中川泰秀:04/05/31 12:17
数学コースの統計学と
経営学科の統計学とでは
どこが違うのですか ?
611132人目の素数さん:04/05/31 12:43
>>600
>>完全加法族の列は2つずつは独立であるけど、
全体としてはお互いに独立でないものがあるというのは定義
から解ります。

はぁ?完全加法族ってσ加法族のことだろ?
どこをどう読めばそんなことがかいてあるんだ?
百歩譲って完全加法族のうえで定義された確率測度の条件である
「完全加法性」の話をしてるにしても
完全加法性の定義は独立性を「仮定」してるだけで
「独立である」なんてどこにも書いてないでしょうがww

>>他スレで「C1∩C2....∩Cn = φではないか?」とも言われたんですが
理由が解りません。

はぁ?
独立の定義はP(認[i])=捻(F[i])だぞ?
積集合が空集合なんてどこにも書いてないじゃないか!

つまり答えはこうだ!
「事象列が独立でない場合に609のようなことが起こる」
という至極当然のことしか言うことができん!
ん?事象列が独立って何かって?
「事象列から任意に複数個の集合を選んできたときにそれらが互いに独立」
つまり事象がn個あれば2^n通りの組み合わせすべてに対して
上のことが成り立つことが必要なわけだ。
ちなみにnが可算個なら冪集合が連続体濃度になるから少し吟味が
必要だがお兄さんは有限っぽいから、これでよし!



612606:04/05/31 14:27
609,611がおかしいと思うのは俺だけ?

>P(F1∩F2)=P(F2∩F3)=P(F3∩F1)=P({1})=1/4
任意のC1∈F1、C2∈F2について
P(C1∩C2)=P(C1)・P(C2)
が成り立つ必要がある

あと、独立の定義は600の通りでいいと思うが。
>「完全加法性」の話をしてるにしても
>完全加法性の定義は独立性を「仮定」してるだけで
>「独立である」なんてどこにも書いてないでしょうがww
600は、完全加法族が2つずつ独立だなんて言ってなくて、
任意の2つが独立だと仮定した完全加法族の列が
全体としてお互いに独立でない場合があると
言いたいのだと思うが。
613611:04/05/31 15:09
>>612 まず大訂正
誤P(認[i])=捻(F[i])⇒正P(∩F[i])=ΠP(F[i])
これは弁解の余地なく大間違い。つい加法定理書いちまった。
90分の講義中突っ込まれてないか
ずっと気になってた。とっとと講義抜け出したかった。すまそww

>600は、完全加法族が2つずつ独立だなんて言ってなくて、
>任意の2つが独立だと仮定した完全加法族の列が
>全体としてお互いに独立でない場合があると
>言いたいのだと思うが。
⇒そういうことならかまわんが。解答そのものは>>611の通りでいいだろ。



614(・ω・)y−゜゜゜:04/05/31 15:26
>>610
どうだろ?
きちんとした証明あたえるかどうかじゃないの?
615132人目の素数さん:04/05/31 20:35
そうねえ。基本的には同じだけど数理統計の方が実務統計より、証明度合いが
高い気がするね。実際使うことがあるかどうか不明な定理も多くないか。
616606:04/05/31 23:47
その通り。
おかしいと思ったのは、独立の定義と600の解釈。
600を馬鹿にしてるように感じたから、つい。

あと、609を修正すると、
Ω={(a0,b0,c0),(a0,b1,c1),(a1,b0,c1),(a1,b1,c0)},P{・}=1/4
F1={a0,a1},F2={b0,b1},F3={c0,c1}
とすると、
F1とF2について
P(a0∩φ)=P(a0)P(φ)=0
P(a0∩b0)=P(a0)P(b0)=1/4
P(a0∩b1)=P(a0)P(b1)=1/4
P(a0∩{b0,b1})=P(a0)P({b0,b1})=1/2
....略
F1とF2は独立
同様に、F2とF3、F3とF1は独立
だけど、
P(a0∩b0∩c0)=1/4≠P(a0)P(b0)P(c0)=1/8
つまり、全体として独立でない

これでどう?
数理統計は統計を使って何かすることより、
新しい手法やモデルを作ることを目的にしてる気がする。
だから、証明が大事。
新しい手法やモデルの妥当性を証明しなきゃいかん。
618611:04/06/01 09:37
>>616
ああFnは事象じゃなくてその族って書いてあった。
なにを見てるんだ、おれはダメダメだなww
そりゃ、任意の事象に対する独立性の吟味はひつようだわなww
また先走ってしまったようだ。すまそww
>>613のFは事象で書いてあるから 勘弁。
>>600ちょっと言い過ぎた、すまそww
619中川泰秀:04/06/01 09:46
614以下・
いろいろと教えてくださり、ありがとうございました。
620132人目の素数さん:04/06/01 10:33
>606、609、611
お答え有難う御座います。

>606
丁寧に書いてくださって有難うございます!
ただ文系ゆえ基本的なところが理解できていなかったようです。
入門書の最初に戻って初歩の初歩から学びなおします。

>611
いえいえ、全く解ってないのは本当ですから。お気に留めて頂いていた
ようで、有難う御座いました。
621600:04/06/01 10:33
↑は600でした。すいません。
622600:04/06/01 10:34
↑は600でした。すいません。
623132人目の素数さん:04/06/01 11:57
ここは確率解析の話を書いちゃだめなんかな?
さぁ?確率だから駄目だというレスは見たことないけど。
駄目なら駄目だと思う人が誘導してくれるんでないかい。
625132人目の素数さん:04/06/02 01:23
激しくスレ違い、お許しください。
血液型と人格は相関がないことをうまく説明する方法はないですかね・・・・。
「あなたは○型だから○○な性格ね」なんて決め付けられるとすごい嫌悪感を
感じます。
>>625
端的に言って、「相関がない」ってのを直接的に示すのはなかなか難しいもんです。
でも血液型と性格の関係を示すデータはだいたい何かしらの統計的なトリックを含んでいます。
下のURL、特に「データを読む:実践」というところなどを読んではいかがでしょう。
http://www1.doshisha.ac.jp/~yshibana/etc/blood/archive/readdata.htm

個人的には血液型で性格を判断するのは立派な差別だよなー、と思っております。
627625:04/06/02 02:33
>>626 さん、ありがとうございます。
628132人目の素数さん:04/06/03 00:09
どう考えても、重回帰分析の回帰係数及び偏回帰係数をみて相関関係を見るより、
629132人目の素数さん:04/06/03 00:14
1:nの非説明変数と説明変数の相関関係を考えた時、
どう考えても、重回帰分析の回帰係数及び偏回帰係数を見て判断するより
1対1の相関係数をn組求めて、見比べることにより判断した方が
正しいと思うのですが間違っていますか?
目的に依る
統計とは話が逸れますが。
血液型で性格に傾向があると思ってる派です。
人間一人一人違うということをまず認めて、
男と女で性格に傾向があるんだから、
個人的には、血液型で傾向があってもおかしくないと思う。
証拠がないから、間違いだと決め付けるのは、どうかと。
昔、地球は水平だと決め付けてた感じで。

ただ、その人を、血液型だけで判断する奴はおかしいと思う。
平均値だけで判断してるのと同じ。
本人を見た方が、正しく性格を判断できるのに。
性格が当てはまってなかったら、俺だったら、俺は外れ値だと言ってやります。


632132人目の素数さん:04/06/03 21:39
>>目的に依る

とい、うことですが、偏回帰変数の方が1:1の相関係数より
優れている状況などありましたら教えて下さい。

考えましたが、前者が後者に勝ってる理由がわからないのです。

アドバイスよろしくお願いします。
633魔女 ◆BJwitch8fo :04/06/04 00:50
>>632
重回帰の偏回帰係数が「他の変数の値を一定としたとき、ある変数の変化がもたらす効果」
を表すのに対し、単回帰の回帰係数は、他の変数は全て誤差項に含まれるものとして扱います。
数学的に言えば、多変数の偏微分係数と一変数の微分係数の違いになります。

例えば、パソコンの価格を分析するモデルで、価格を決める要素として、
CPUのクロック数・メモリ・ディスプレイの大きさ、の3つを考えます。
クロックに注目して分析するならば、重回帰の偏回帰係数が
「メモリ・ディスプレイのスペックが同じパソコンは、クロックが(1単位)変わるとどれだけ値段が変わるか」
を表すのに対し、単回帰の回帰係数は、クロックだけでパソコンの値段を分析することになります。
メモリやディスプレイのスペックが高いために値段が高くなっているパソコンでも、
クロックが劣っていれば、「クロックが下がる→値段が上がる」という判断すらなされ得ます。
それゆえ、重回帰の偏回帰係数のほうが、モデル説明にふさわしいと言えます。

630さんじゃないけど答えてみますた。
634630:04/06/04 06:02
偏回帰係数でも、それは有り得る(多重共線性)のですが、
重回帰は、説明変数が独立であるという強い仮定の下に成り立っています。
多重共線性は、この仮定を満たしていないのが原因です。
重回帰は、この強い仮定の下で、全体的に相関を調べます。

多変量解析は多変量で考える必要があるから、多変量解析なのです。
個々の相関を見るだけなら、単回帰でいいが、
全体として見たいから多重回帰を使う。
そのために、強い過程という犠牲を払って、解析している。

例えば、
Y,X1,X2があったとして
(Y,X1)の相関係数が2,(Y,X2)の相関係数が1だったとする。
ここで、もし、X1と同じデータX3があったとしたら、
(Y,X3)の相関係数も2
ぱっと見ると2,1と2,1,2じゃ、印象がずいぶん変わりませんか?
全体としてどう評価しますか?
そのために、説明変数が独立だという仮定をおいて、
重回帰分析をするのです。
この場合、X1もしくはX3を捨てなければなりません。
>>630

> 偏回帰係数でも、それは有り得る(多重共線性)のですが、
モデルが正しく特定されている限り,多重共線性の下でもOLSの推定量は
不偏性を失わないはずですが.
完全な線形従属性があれば,そもそも偏回帰係数を推定できない.

> 重回帰は、説明変数が独立であるという強い仮定の下に成り立っています。
OLSはそのような仮定をおかなくてもBLUEになります.
「独立である」の意味が「線形従属でない」の意味であれば(3段目の書き込み
からはそのように解釈できますが,通常は独立=共分散ゼロ,ですよね),
それは全然強い仮定ではないです.
636630:04/06/04 08:35
そうですね。
重回帰の標準化偏回帰係数で評価したければ、説明変数が線形独立でなければならない、ですね。
推定量の不偏性には、そんな仮定はいりませんね。
「独立」と「線形独立(線形従属でない)」間違ってますね。
強い仮定というのは、仮定が存在するということを強調したかったのです。

すみません。
637630:04/06/04 11:37
またもや、修正。
やっぱり、「独立」は、共分散ゼロの意味だ。説明変数を相関ゼロにしたいんだから。
だから、観察研究だと、標準化偏回帰係数で比較できない。
相関ゼロにできないから、共分散構造解析にいくと。

重回帰を推定量として使う場合と、標準化偏回帰係数を見る場合が
ごちゃごちゃになってた。
レス遅れて申し訳ありません。
とても解りやすい説明をありがとうございました。
納得できました。
639132人目の素数さん:04/06/08 23:24
教えてください。

調査年 商店数(千店) 従業者数(千人)
1972  1,496     5,141 
1974  1,548    5,303
1976  1,614    5,580
1979  1,674    5,960
1982  1,721    6,369
1985  1,629    6,329
1988  1,620   6,851
1991  1,606   7,000
1994  1,500   7,384
1997  1,420    8,029
2002  1,300    8,006

この表で1972年を100として一店あたりの従業者数を
出したいとき、どのようにして統計を出したらいいん
ですか?
640543:04/06/08 23:52
>>639
なんか前に見たような……

>>530と同じ人?
641132人目の素数さん:04/06/09 00:02
そうです。統計まったくわからなくて。
>>639
統計と言うより、下手すりゃ算数じゃないか?
せいぜい中学レベルだ。
どっちにしても、>>534を見て分からないようなら、
基礎からやり直した方がいいと思う。
643132人目の素数さん:04/06/09 10:37
Xがガンマ分布Ga(r,1)に従うとします。
このとき,log(1+ax)の期待値がrが十分大きい範囲では
log(1+ar)に近づくとある論文に書いてあります。
これはなぜなんでしょうか?よろしくお願いします。
644132人目の素数さん:04/06/10 13:15
私立大学の過去のデータによると入学試験の合格者のうち入学を辞退する者が4%である。
1000人の定員を99%の確率で充足するためには、合格者を何名にするべきか。

という問題が出たのですが、この文章を見ると辞退する人数がわかっているので、定員を充足するのは確率も糞もないと思うのですが・・。
どうなんでしょうか?
確率・統計の所で出てきた問題ですので、そんなに単純ではないはずなんですが。

正規分布やら信頼区間を使うかもって友人が言っていたのですが、どう当てはめればいいかサッパリな状況です。
宜しければ誰か教えて頂けますか?
645132人目の素数さん:04/06/11 00:08
よくある多期比較に関する対応のあるt検定(いわゆる輪切り検定)の問題の悩みなのですが?

独立した3群以上の有意差を比較するときにt検定を繰り返してはいけない
ということは理解しているのですが、
(有意水準5%でt検定をn回繰り返すと、少なくとも1組のペアに有意差が出る
確率が1-(0.95)^nとなり、本来5%設定した有意水準を上げてしまい、
本来有意差のないペアの有意差を検出してしまう。)
なので、独立したn群の有意差検定には、分散分析をして有意差ありならば多重比較
を行い、どの群間に有意差があるかを調べなければならない。
ここまではOKなんですが、

「3週間にわたり、降圧剤を投与し、投与開始前VS1週間後、投与開始前VS2週間後、投与開始前VS3週間後
の比較をそれぞれ"独立(個別)"に行い、【投与開始日と比較して血圧に有意差があるのはどの時点か?】を独立に検定をする」
のは大丈夫なのでしょうか?
(この場合、比較対象が開始前で固定してあり、【1週間後VS2週間後】、【1週間後VS3週間後】、【2週間後VS3週間後】
の比較は行わないので)

このようなケースの多期比較(比較時点は開始前に固定)でも多重性の問題に引っ掛かるのでしょうか?
臨床統計に詳しい方がいたら教えて下さい。
646645:04/06/11 01:00
大事なことを書き忘れていました。

4行目から6行目は余事象に基づいた有意水準(あくまで""系全体""としての有意水準)
を引き上げてしまうのがNGの理由であるので、
開始前のみを比較対照として個別に検定を行い、"開始前"と有意差があるのは
"どの時期か"?を調べるのを目的とした検定ならこの検定方法でも大丈夫でしょうか?

結論の例:対応のあるt検定を行なったところ、開始前VS1週間後は有意差なしだが
開始前VS2週間後 開始前VS3週間後は有意差有り といった感じに結論する


>644
自信ないけど。
辞退する人の期待値がn*0.04だから
辞退するかどうかがp=0.04の二項分布に従うってことじゃないかな?
あとは正規近似して。。。
>>648
なるほど、大分前進しました。
勉強が足りなかったみたいですね・・。
有難うございました。

しかし、ほとんどの二項分布の例題や問題が、
試行回数(ここでいうと合格者を何名にするかでしょうか?)を定めているのでそれがなかなか考えずらいものがありますね。

650132人目の素数さん:04/06/15 21:56
デシジョンツリーとは単相関の組み合わせですよね?
2値予測でデシジョンツリーの方がロジスティック回帰より
優れた結果を出すということは、結局多変量解析が大きな意味を為さないということに
ならないのでしょうか?

どの決定木?
652132人目の素数さん:04/06/18 03:24
(X_n)を2乗平均の意味でXに収束する平均0の実数値Gauss型確率変数列とする。
XがGauss型確率変数となることを示せ。

これってどういう方針で示すのでしょうか?
653132人目の素数さん:04/06/21 23:36
http://love3.2ch.net/test/read.cgi/motenai/1087683017/l50

テレビで放送された東大生にB型が多いって話で
統計の素人同士が煽りあってます
助けて賢い人
654132人目の素数さん:04/06/21 23:42
>>653
数学の素人の論争に首を突っ込むとろくなことがありません。
どんなに正しいことを教えてあげても、彼らは納得しようとしません。
どうしようもありません。
俗に角の三等分屋と呼ばれる人種にはかかわらない方が吉。
655132人目の素数さん:04/06/21 23:54
一応何か書いてよ
656132人目の素数さん:04/06/21 23:58
>>654  は素人を騙そうとしてる当人なわけ
まぁ、2ちゃんにはよくいる人種ってことかな
657132人目の素数さん:04/06/22 00:00
神はまだいないってことか
658132人目の素数さん:04/06/22 00:05
そもそも検定のけの字も知らなそうな奴らに何を教えろと?
あんなくだらない論争に加わるよりも、とりあえず、このスレを最初から
読んでから、質問してくれ。
659132人目の素数さん:04/06/22 00:07
4000人分の調査で100人分の例ってのは統計学的には、
信憑性あるんでしょうかって事なんですけどね

まぁ、素人の論争なわけでして
660132人目の素数さん:04/06/22 00:11
>>659
どういう分布の時で、信頼係数はいくつに設定するの?
661132人目の素数さん:04/06/22 00:20
視聴率って信用できるの?
662ふれ:04/06/22 00:32
エクセルで分散分析をしたいのですがどうすればいいのか分かりません!
教えて下さい。
663132人目の素数さん :04/06/23 01:15
仮説検定や異なる母集団の比較の場合、
標本調査でなく、母集団全部を調査できる場合(全数調査)は
検定も何も必要ないということになるのでしょうか。
>>662
ツール → 分析ツール から 分散分析が選べる。
665132人目の素数さん:04/06/23 23:53
エルゴード的であることを証明する方法がわかりません。
どなたかお分かりになりますでしょうか?
宜しくお願いしますm(_ _)m

http://upjo.com/up/data/ergoic.GIF
666132人目の素数さん:04/06/24 00:00
>>665
エルゴード的
の定義は?
667132人目の素数さん:04/06/24 00:16
>666 (s0)
行列pは、あるs0が存在して任意のi,jについてpij >0と
なるときエルゴード的である・・・みたいな感じです。

エルゴイックならばs0段階で任意の初期状態x(i)から
任意のx(j)に正の確率でいけることを意味するそうです。
すいません。上の (s0)  pij>0は

(s0)
pij >0

です。
669132人目の素数さん:04/06/24 00:29
>>667
s0とか、pijとかって何?
670132人目の素数さん:04/06/24 00:46
よし、今日は寝よう。
>663
そういうこと。

母平均の差の検定の場合で言えば、
帰無仮説:母平均μ1-μ2=0、対立仮説μ1-μ2>0
母集団全部を調査してあるなら、
母平均の定義μ1=1/n ΣX1i, μ2=1/n ΣX2i
要するに、推定量で検定しなくても、
母平均そのものがわかってるってこと

ただ、無限母集団だと不可能だし。
統計学ってのは、母集団全部を調べるのは無理だから、標本を抜き取って
なんとかするときの学問だと、俺は思っている。
672132人目の素数さん:04/06/24 12:54
>>669
Pijでマルコフ過程だろ?
673Nanashi_et_al.:04/06/24 20:09
663です。
>>671
ありがとうございます!
数式の意味はわからないのですが
お答えをきいて安心しました。

>統計学ってのは、母集団全部を調べるのは無理だから、標本を抜き取って
>なんとかするときの学問だと、俺は思っている。

そうですよね。
全数調査と標本調査は、考え方が違うんですよね。
674132人目の素数さん:04/06/24 23:06
質問させてください。。

階級 階級値 度数 累積度数 がそれぞれ書いてある度数分布表があるのですが、これからどうやって標準偏差を求めればよいのでしょうか・・
675132人目の素数さん:04/06/25 00:26
知らん
>>674
ある階級 i の度数が N_i のとき,階級 i に含まれるケースがすべて
階級 i の中央値 X_i を取るとして計算するとよい.

たとえば,あるテストの得点の分布が
80〜100 3人
60〜80 6人
40〜60 4人
のとき,13人の得点の分布が
{50,50,50,50,70,70,70,70,70,70,90,90,90}
になっているものとして計算する.
677132人目の素数さん:04/06/25 11:00
>>676
すいませんありがとうございます。。
この度数分布をエクセルをつかって計算したいのです。
もう少し詳しくお願いできませんでしょうか。。
678676:04/06/25 15:46
>>677
www.google.co.jp/search?sourceid=navclient&hl=ja&ie=UTF-8&oe=UTF-8&q=Excel+%E6%A8%99%E6%BA%96%E5%81%8F%E5%B7%AE
679132人目の素数さん:04/06/25 18:55
>>678
ありがとうがとうございます。。でも実は階級 階級値 度数 累積度数 のどの部分をどうして標準偏差を求めればよいのかがわからないのです。。
重症ですね。。
680132人目の素数さん :04/06/25 19:52
統計の初心者です。
検定の考え方について質問します。
検定した結果はサンプルのデータによって変わってくると思いますが、
ある実験で有意差が出なかったが、再度同じ条件で実験すると
有意差が出た場合、どういう結論になるのですか?

例えばこんな感じ。
薬剤が体重へ及ぼす影響を調べるのに、10匹のマウスをランダムに
選び薬剤使用前と後を比較した。体重の平均値をt検定すると有意差はなかった。
そこで、再度マウスを10匹ランダムに選びなおし、同じ実験すると今度は有意差
が出た。結論はどっちなのか?

もし有意差があり、と結論して良いのなら、自分の予想どうりの結果が
得られるまで何度でも実験しても良いことになっておかしいような気がする。
>680
いい疑問。
有意差が出るまでやり直してたら、無作為とは言えない。
つまり、やり直しがマズイ。
まぁ、発表される方は、データを隠されたらわからないけどね。
やってる人はいるでしょう。。。

臨床試験とかだと、どんな試験をするかをプロトコールに明記して、
国に提出して、その通りにやらなければならない。
682676:04/06/26 00:32
>>679
階級 階級値 度数 累積度数
0-10  5    1   1
11-19
683676:04/06/26 00:34
すまん.書き込み中に送信してしまった.

ということで,手元にあるデータは下のようなものでよろしいか?
階級 階級値 度数 累積度数
0-10  5    1   1
11-19 15   3   4
684676:04/06/26 00:41
標準偏差(をはじめとする統計量)を計算するには,
ある階級に含まれるケースは,すべてその階級の階級値を取る
と見なせばよい.
上では中間値と書いたけど,階級値は通常中間値を取るから,同じことだ.

で,上の例だと,4つのケースの値は{5,15,15,15}になる.
このようにして,手元の度数分布表から全てのケースの値を書き出して,
それをエクセルに1列に入力する.
そうすれば,エクセルの関数で標準偏差を計算してくれる.
エクセルの関数は検索して調べて頂戴.
685132人目の素数さん:04/06/26 18:32
どなたか「空間的自己相関」について簡潔に説明あるいは、
それについてのいいサイトがあれば教えて頂けないでしょうか?
(英語でもいいです)
ぐぐってみたけど、良くわかりませんでした。

たとえば空間内の距離が大きくなるにつれて、
空間内の因子の説明変数の相関が大きくなったり小さくなたりということ
だと思うのですが、「自己」という言葉の持つ意味が良くわからないのです。
686132人目の素数さん:04/06/26 19:20
>>676さん

本当に本っ当にありがとうございました。なんとかできました。感謝です。
>685
その言葉を聞いたことなかったんだけれども、
ぐぐってみて、下を見つけて、分かった気になれた。

ttp://okabe.t.u-tokyo.ac.jp/okabelab/sada/docs/pdf_class/u06_2.pdf
688685:04/06/26 21:38
>>687
神様ありがとうございます!
私も十分わかった気になれました
689132人目の素数さん:04/06/26 23:01
反復測定(分散分析・多重比較)について詳しく書いてある本が欲しい…。
探しても詳しく書いてある本が見つからない_| ̄|○。
>>689
多重比較の解説書といえば、まずこれだと思うが…
「統計的多重比較法の基礎」
http://www.amazon.co.jp/exec/obidos/ASIN/4914903466/
チェック済みだったらスマゾ
691132人目の素数さん:04/06/27 20:13
文系で統計の初心者です。
授業で習ったんですが、先生の説明が良く分からないのでお聞きしたいのですが・・・。

単回帰モデルでYi=α+βXiってのを習いました。これの意味は分かります。
でも、多変数回帰になって、Yi=β1X1i+β2X2i+・・・+βnXniってのが良く
分かりません。Xの添え字が二つになってるんで・・・。
Yi=β1X1+β2X2+・・・+βnXnとは違うものなんですか?
Xの添え字が2つになっている理由と、表している内容についてどなたか
教えていただけませんか?
お願いします。
>>691
Y1=β1X1+β2X2+・・・+βnXn
・・・
Yi=β1X1+β2X2+・・・+βnXn
・・・
Yn=β1X1+β2X2+・・・+βnXn
これだと、Y1〜Yn 全部同じ式だよ。
単回帰モデルのデータ
Y1 X1
Y2 X2
Y3 X3
 :

Yi=α+βXi

多変数回帰モデルのデータ
Y1 X11 X21 X31
Y2 X12 X22 X32
Y3 X13 X23 X33
 :

Yi=β1X1i+β2X2i+β3X3i
694693:04/06/27 21:42
あ、書いてる間に、かぶってしまった。
695132人目の素数さん:04/06/27 21:55
>>692
>>693
ってことは、多変数回帰モデルのデータを
Y1 X1 Z1 W1
Y2 X2 Z2 W2


Yn Xn Zn Wn
と考えたら、この場合は
Yi=β1Xi+β2Zi+β3Wi
になるってことですか??
696693:04/06/27 22:38
そういうこと。
単回帰だと    目的変数Y説明変数X
多変数回帰だと 目的変数Y説明変数X,Z,W
複数の説明変数で目的変数を予測しようというのが多変数回帰
697132人目の素数さん:04/06/27 22:43
>>696
ありがとうございます。
やっと分かりました。
どーでもいいが、最近は重回帰分析を多変数回帰って言うのかな?
699693:04/06/28 02:10
俺も初めて聞いたが、変えると話ややこしそうだったから、そのままにしといた。
700132人目の素数さん:04/06/28 20:57
>>698,699
他はどうかしりませんが、今の授業では多変数回帰って言ってます。
教科書も多変数回帰ってことになってます。
でも、去年は重回帰分析って習いましたが・・・。
まぁ、multiple regression の訳語だから多変数回帰でもいいのかもな。
あんまり聞かないけど。
702132人目の素数さん:04/06/28 23:39
>>690
マヂレスありがとうございます。
この本のタイトルは訊いたことありまつ。
(多重比較は仕事で最近使うことになり、
それまでは多重比較について無頓着ですた)

最近は多重比較に関しての様々な実例や問題点(欠測値が発生した時の対処方法)
を探すため、必死に本を調べる毎日です。
噂によると、薬効データの統計解析や前臨床統計解析の本に
反復測定の記述が充実しているという情報も…。

703132人目の素数さん:04/07/01 14:32
19 名前:名無しさん@引く手あまた 投稿日:04/06/29 20:44 JDij3Lsz
百発百中と言っている弓の名手が
2回続けてはずした。
さてこいつは嘘を言ったことになるか、統計学を使って答えなさい。

誰かこれわかる?全然わかんねーよどういうことさ??
704132人目の素数さん:04/07/01 15:02
>>703
どういう状況で2回続けてはずしたのか?
単発で2回だけ打たせて全てはずしたのか?
それとも「百発百中」を確かめるために100回打たせたところ
2回連続ではずしたことが1回以上あったのか?
判断するには条件不足だと思われ。
705132人目の素数さん:04/07/01 16:32
そんなに難しく考えないで良いのでは?
仮に99%の確率で命中すると仮定する。
その時、2回連続ではずす確率は0.0001。

有意です。

じゃ駄目かw
706132人目の素数さん:04/07/01 17:03
>>703-705
「百発百中」とは、百回打てば平均99.5回以上命中することを指すと考えられる。
よって命中率は99.75%近くであると考えられ、
二回連続ではずす確率は0.00000625まで下がる。
707132人目の素数さん:04/07/01 18:02
705 : 80点
706 : 60点
708統計入門:04/07/01 21:57
709統計入門:04/07/01 22:01
初歩的な質問で大変申し訳ないのですが、ご教授頂ければ幸いです。

アンケートや経営事象に対して統計分析をしたいと考えている者なんですが、
統計ソフト(SPSS,Rなど)や統計入門書類のものを読んで、分析の方法は
多少は何となく分かってきたのですが、そのような表層的なものから発展して
もう少し突っ込んで理論から勉強したいと思っています。
# 少し難しめの統計学書に出てくる数式がさっぱりなので。。。

高校までの数学の知識を前提に、統計学書のある程度理論が理解できるよう
になるまで、具体的に何が必要ですか?
# 大学教育は受けていないですが、高校時代の数学の参考書を引っ張り
# 出して、何とか高校までの数学まではマスターしました。お恥ずかしながら。
大学1年で履修する微分積分と線形代数で足りますか?
微分方程式やフーリエ解析まで勉強する必要はあるでしょうか?

因みに、今特に興味を持っている分野は、項目応答理論、遺伝的アルゴリズム、
時系列分析です。
微分積分と線形台数はやっといて、
あとは出てきたときに勉強すればいいと思う。
最近、高校時代の参考書みたいな教科書が出てるから
1回生で習う微分積分と線形台数と確率統計は
すぐマスターできると思うよ。
台数->代数
誤変換、かっこわる。。。。。。。。
712132人目の素数さん:04/07/02 18:28
確率変数XとYが独立で、正規分布(μ、σ^2)に従うとき、
T=(X+Y)/2、U=(X−Y)/2の分布を求める、という問題が分かりません。
解説をお願いします。
713UltraMagic ◆NzF7MCEOec :04/07/02 21:11
There are three kinds of lies: lies, damned lies, and statistics.
ねた?
「正規分布の加法性」でぐぐれ
715132人目の素数さん:04/07/03 00:22
>>710
その言葉を信じて頑張ります。
どうしても分からなかったら、また投稿します。
そのときは宜しくです!
716132人目の素数さん:04/07/03 09:28
統計パッケージ(自分のはR、他のも同じっぽい)で
定数項を含むモデルの回帰と、定数項を含まないモデルの回帰の
R^2値の計算方法が異なる?
定数項を含むモデルは、目的変数の標本平均からの距離
定数項を含まないモデルは、0からの距離
を基準にしている、と思うのですが、どうでしょうか?
中身の計算式が見れないTーT
717132人目の素数さん:04/07/04 00:02
>>716

たとえば、SPSSだと定数項を含む場合は相関行列をもとにして各種計算が行わ
れるが、含まない場合は標準化交差積をもとにして各種計算が行われる。


718716:04/07/04 13:34
求めるものとしては
定数項ありのモデルの重回帰
Se=Σ(Yi-hat(Yi))^2, St=Σ(Yi-bar(Y))^2, Sr=St-Se
R^2=Sr/St
定数項なしのモデルの重回帰
Yを標準化{bar(Y)=0}しておいて
Se=Σ(Yi-hat(Yi)^2, St=ΣYi^2, Sr=St-Se
R^2=Sr/St
ということでしょうか?
あと、定数項ありのモデルと定数項なしのモデルを
R^2で比較できないですよね?
まぁ、当てはまりは定数項ありの方がいいし、
比較の必要性を感じないけど。
平均がmで分散が不明な正規分布に従う数を5つずつのグループに分けて、
その5つの数の最大値-最小値(つまり、5つの数の範囲)の平均と偏差を調べると
それぞれR、sでした。元の正規分布の分散はいくらですか?

お願いします。
>>719
課題の解答は自分で考えよう!

中心極限定理
中心極限定理でできる?
722132人目の素数さん:04/07/06 22:35
平均時速ってどうやって求めるのでしょうか?
723132人目の素数さん:04/07/06 23:29
SPSSという統計ソフトに関する質問はこちらでよろしいでしょうか?
世論調査データをもとに政治学の統計解析をしたいんですが、統計の図表の見方や用語がよくわかりません。
回帰係数やkendallのタウbとかcという言葉が変数間の相関を示しているのはわかったのですが、
数値がどの程度の大きさだと相関が強いのかがわかりません。
スレ違いだったら流してください。よろしくお願いします。
724132人目の素数さん:04/07/07 01:02
>722
統計の問題ですか?
単純な運動の問題なら測定する二時点の差の空間ベクトルを時間差で割って求めます。
差を計算する順序に気を付けましょう。
725132人目の素数さん:04/07/07 12:10
分散の散らばりでどのようなことがわかりますか?
例えば店舗の売上の散らばりを調べたら何がわかりますか?
726132人目の素数さん:04/07/07 17:15
統計学で前から疑問に思っていたんですが
なぜ正規分布になる結果は正規分布になるのでしょう
統計学では無くそれを応用する側の問題かも知れませんが
727132人目の素数さん:04/07/07 18:20
>>726
何が言いたいのかわからない・・
統計量に関する漸近正規性とかの話しか?
それとも仮定の殆どが正規性であるということか?
728132人目の素数さん:04/07/07 19:44
統計学初心者で、こんな問題も解けないのか!!と叩かれるのは分かっていますが
どうしても分からないので質問させてください!!
問題 女性1200人を対象に1日のカルシウム摂取量を調査したところ、
平均値512mg、標準偏差95mgという結果を得た。
調査したデータは正規分布に従うものとして次の問に答えよ。
(1)調査した1200人の中で、1日のカルシウム摂取量が400mg以上600mg以下である者は何人ぐらいいるか。
(2)    〃     、      〃    が700mg以上の者は何人ぐらいいるか。

お願いします!!
729132人目の素数さん:04/07/07 20:13
>>728
正規分布において、平均値からどれくらい離れたらどのくらいの出現確率になるか、をしらべてみなよ。
730543:04/07/07 22:24
>>723
それはSPSSの使い方以前の問題だよ。
何でもいいから統計学の本を一冊買って熟読すべし。
731132人目の素数さん:04/07/08 00:02
多変量解析の問題点を二つほどあげると
なにを解析するかを考えずに解析しても、とりあえず結果だけは出てしまう。
733132人目の素数さん:04/07/08 21:04

質問させてもらいます。

対象行列Aの2次形式の性質、応用方法が全く理解できません。
自分でも情けないです。
理解のきっかけでも頂ければと思い、質問させてもらいました。

よろしくお願いします。
734132人目の素数さん:04/07/08 21:22
>>733
対象ではなく対称でしょう
>>733
幾つかの数をセットで考える場合、ベクトルの形で合理的に取り扱いできる場合が
たくさん在ります。
そのベクトルの座標のある二次式が重要な意味を持つ場合が在ります。
此れを二次形式と言います。距離の二乗、エネルギー、共分散等色々在ります。
二次形式の係数全部を纏めて考えたのが対称行列(の代表)です。
二変数であれば平方の完成と云うことをすればグラフの頂点や方程式の解の公式が
作れましたが、これに相当する手続きが行列としての対角化です。
この辺りの簡単な応用例を探して弄ってみるのが、理解の最短コースです。
736132人目の素数さん:04/07/10 01:14
こちらのスレに誘導されたので質問させてください。
3人が[0、1]上の値を独立にかつ、ランダムにコールしそれをX1,X2,X3とし
X=max(X1,X2,X3) Y=min(X1,X2,X3) とする。

このとき同時確率分布は f(x,y)=6(x-y) (0≦y<x≦1の時)
                0   (それ以外の時) 
となるらしいのですがどのように求めているのですか?
できれば詳しく計算過程も教えてください。お願いします。
>>736 学期末の課題? 単なるコケオドシだから、自分で考えてみて。

ヒントを出しておくと、y = X1 ≦ X2 ≦ X3 = x となる確率は、
X2 がどの範囲にあるかを考えればすぐ出てくる。あとは、並べ方。

# 問題作った人よくない。一様分布ということで作ってるみたい
# だけど、問題文ではそう特定できない。
>>735
お陰様で解った気がします。
3*3行列で実際に色々確かめたのも良かった気がします。

ありがとうございました。
739132人目の素数さん:04/07/10 18:30
統計学入門書のいい本紹介してくださいまし、ベイズ統計とかにも触れてあるのがいいです。

ここでついでに
「マグロウヒル大学演習」の「統計」は買わないほうがいいぞ、
氏家勝巳・土井誠、おめーら自分の書いた本一度でも読み直したことがあるか!!
日本語になってねーぞ

マグロウヒル大学演習シリーズは「離散数学」でこれは良い本だと思い、
各種買い揃えたけど大体良い本が多かったです、
しかし、この本だけは最悪だ
5ページ進むのに、一週間、あとから見直して、文書の意味を理解するだけでその8割の時間を費やしていて
内容理解が2割だと思ったとき、ゴミ箱行きにしてやったよ。
と、ちょっと、ブチきれモードだすた。
740132人目の素数さん:04/07/10 19:48
ベイズ統計の良い本がないね。
研究者が少なく、活気がないのが問題か?
741132人目の素数さん:04/07/10 19:51
>ベイズ統計とかにも触れてあるのがいいです。

ついでにベイズ理論という本はないんでないの?
考え方が違うからね・・
742132人目の素数さん:04/07/10 20:30
>>739
 P.G.ホーエルの「初等統計学」がお勧め。
 3章でベイズ理論をわかりやすく、丁寧に解説している。
 これ以上易しい本はないといわれているから、これを
 何度か読んで、いろんな問題をベイズの定理を使って
 解いてみるとよいでしょう。

 ベイズ統計の本もある。
 「ベイズ統計学入門」渡部 洋
 「ベイズ統計入門」繁桝 算男
 渡部のほうが易しいが、統計学の基礎知識がなければ
 途中でひっかかるかもしれない。
743132人目の素数さん:04/07/10 23:27
ベイズは実用に向かないのも事実だよね
744132人目の素数さん:04/07/10 23:33
遺伝子関係ではベイジアンネットワークを多用しているぞ
745132人目の素数さん:04/07/10 23:54
素朴な質問ですが

身長や成績が正規分布になるのは
ポアソン分布の近似解として現れているに過ぎないと考えてよいですか?
746132人目の素数さん:04/07/11 00:43
>739 ソフトカバーとハードカバーがありますがどっちがいいですか?
747736:04/07/11 01:43
>>737
レスありがとうございます。
考えたんですけど。いまいちつかめません。。
もうすこしヒントをいただけないですか?
>>747 y = X1 ≦ X2 ≦ X3 = x となる確率を出すには、まず、紙
と鉛筆を用意して、適当な長さの線分を引く。つぎに左端に 0、
右端に 1 と書く。それから、好きなところに、y, x と書き込む。
で、X2 がどこにあればいいか考える。

あとは、並び方考えて、3!倍。
749739:04/07/11 10:10
>>746
どうもです。助かります。
ちなみに、安いほうがいいです(笑)

750名無しさん@そうだ選挙に行こう:04/07/11 18:12
差の有意差でnsって何を意味するのですか?
かこいいおにいさまぁおせーてください!
751132人目の素数さん:04/07/11 21:31
統計学の立場からして、選挙の出口調査って信用出来るの?
752132人目の素数さん:04/07/11 21:48
信頼区間の中に入れば信用できる
753132人目の素数さん:04/07/11 22:01
σ^2x
これは何を表していますか?
分散でいいですか?
754132人目の素数さん:04/07/11 22:27
xは何?
σ^2は一般的に分散
755132人目の素数さん:04/07/11 22:37
xはなんていったらいいんでしょう…年数って書いてます。
ありがとうございました!
関連する部分をまるごと書かないと通じないのよ。
757132人目の素数さん:04/07/11 23:47
凄く初歩的な事なんですが、
「代表的標本」と「無作為抽出」の
意味を教えてください。
758132人目の素数さん:04/07/12 00:41
age
759132人目の素数さん:04/07/12 01:12
>>750
not significant
760132人目の素数さん:04/07/12 16:59
名目成長率からGDPデフレーターと実質成長率の和を引いたもので
引き算を使わないで表す方法ってありますか?
>>760
経済板へ行ってくれ。
762132人目の素数さん:04/07/12 19:57
ヒストグラムの分割数を作るときにスタージェスの公式というのが目安にできるらしいですが
この式の根拠っていうか、どうしてこんな式を作ったのかというか
式の意図みたいなものを知っている人いますか?

あっちこっち見て回ったんですが、式しか書いてない・・・
763132人目の素数さん:04/07/12 21:26
こんばんは!
統計学の資格みたいなものは、無いのですか?
764736:04/07/12 22:04
>>748
レス遅れてすいません。なんとなくつかめましたがレポートとして提出なのでちょっと自信がありません。
もしよければ不備な点をご指摘お願いしたいです。

まずy = X1 ≦ X2 ≦ X3 = x となる場合を考える。X2はX1とX3の間に来ればよいので(x-y)となりX1X2X3の並び方は3!=6通りより
6(x-y)となる。 ←ここまではなんとなくわかったのですがこれがなぜ密度関数になるのか?一様分布というのはどこにからんでいるのか?
ここらへんが自分のなかであいまいですっきりしません。

今春から確率統計の勉強を始めたばかりの素人なのでヒントをお願いします。
765132人目の素数さん:04/07/12 22:18
統計に関してわからないことがあり,投稿しました.
どなたか統計に詳しい方,ご教授ください.

ある測定法に関して,旧法と新法があり,下記のデータより,両者に差がないことを証明する場合,
どのような統計解析をすればよいのでしょうか?

まず私が取りかかったのは,分散の検定後,t検定による平均値の差の検定をしました.
3ロットとも差がなければ,旧法と新法に差がないと判断しても良いと思ったからです.
でも,このやり方は下記のようなデータでは使えないような気がして質問した次第です.

【データ】
ロットAの結果 旧法で得た結果:11  新法で得た結果:10
ロットBの結果 旧法で得た結果:48  新法で得た結果:53
ロットCの結果 旧法で得た結果:84  新法で得た結果:78

※各結果はn=3の平均値です.


よろしくお願い致します.
>765
よくみなさん誤用されるのですが、
統計では、”差がない”ことは結論できません。”差がみつからない”と結論します。

ロットA、ロットB、ロットCのどれでも差がみつからないことを言いたければ、
各ロットでの信頼水準を1-α’とすれば、全体の信頼水準は(1-α’)^3になります。
全体の有意水準をαとして
α=1-(1-α’)^3
からα’を逆算して検定すれば大丈夫。
>762
以下が参考文献
ttp://www-personal.buseco.monash.edu.au/~hyndman/papers/sturges.pdf
簡単に和訳すると、
階級数kで、i=0,...,k-1番目に(k-1)Ci個分布するのが理想と考えた。
kを大きくすると、これは正規分布の形に近づく。
全標本サイズはΣ(k-1)Ci =(1+1)^(k-1)=2^(k-1)
よって、k=1+log_2(n)

768132人目の素数さん:04/07/13 17:23
標本削除平均について調べているのですが
全く手掛かりがつかめません・・・
参考文献(『初等統計学1』/バタチャリヤ=ジョンソン著)は絶版、
図書館でも既に貸出中とのことorz

標本削除平均とはどのようなものなのか、定義や例などあれば教えてください。
769132人目の素数さん:04/07/13 23:54
>>768
trimed mean のことだと思います。
データの大きい方と小さい方から、
同数ずつデータを取り除いた残りのデータの
算術平均値のことだと思います。

「思います」というのは、使ったことが
なくて、以前、本で読んだだけだからです。

結果としては、中央値と同じように、
はずれ値の影響を受けにくい平均値と
いうことが言えると思います。

標本数に対して分散値から削除するデータ数を
決めるなどありそうだと想像できますが、
詳しいことは覚えていませんので、
理論的妥当性なども含めて、図書館から本を
借りられるようになったら、確かめてください。
>769
trimmed mean・・ってことは刈り込み平均と同義ですかね
もうちょっと調べてみます。
ご回答ありがとうございました。
Z^dの単純ランダムウォークで
d=3 だとする。
n段階で空間的なひろがりはどうなるか?(n時間後に、例えば
数直線若しくは座標でどのあたりにいるのがメジャーな状態か?)

解らない問題スレでスルーされました。どなたかお願いします。
772132人目の素数さん:04/07/15 07:14
あれ>
>>742
どもです、
「P.G.ホーエル」が見つからなかったので、
「ベイズ統計入門」繁桝 算男
を買いました、これいいですね、すごくスッキリしている。
知識的に足りない部分は「東京大学出版会」の「統計学入門」で補う事にしました。

>>767
どもどもです、助かります。
774132人目の素数さん:04/07/15 22:40
>>766
その方法でよいの?
標本が3以上の時はt検定は使えず、分散分析を使わないといけない
と習ったんですが・・・
>774
多重性に気を取られて、分散分析を忘れていた。
有意水準の調整をするより、統計量作れた方がいいに決まってる罠
ああ、はずかしぃ。
777132人目の素数さん:04/07/17 12:18
社会学方面の論文なんか見ていると、正しく回帰分析類を使えてるのは10%に満たないような気がしています。
全く意味をなさない数字を出して話を進めているのですが、咎める人はいないのでしょうか?
>>777
どんなの?
90%の方にどんなのがあるか晒してみそ。

もしくは、どのような誤用があるか問題点を指摘されたし。
779FeaturesOfTheGod ◆UdoWOLrsDM :04/07/17 16:14
Re:>777
咎める人が少ないのは、論文を細部に亘って読む人が少ないからだろう。
780132人目の素数さん:04/07/17 17:23
>>777
 10%という数値がどこから出てきたかわからないが、
 データに語らせる、という実証分野の研究においては、
 データによって考慮しなければならない事が違っている。

 学士論文ぐらいじゃ、「ま、適当に回帰分析でもやってみるか」
 ぐらいの論文しかないのは、しかたないと思うな。

 修士論文は、ほとんど無茶苦茶に思えるし、
 博士論文やジャーナル掲載論文でさえも、ごく一部を除いては、
 「いい加減だなあ」と思ってしまう。

 だから、実証なんてやると、苦しいだけで、評価を受けるのは
 至難のこと。
 おれ、実証研究はやめて、理論だけやろうかと思っているぐらいだ。
金融時系列のフラクタル分析(P10〜11)
全期間にわたって取引が行われない確率aが一定であると仮定する。
取引が行われたかどうかを表す指標関数Stを

    1 取引なし    a
St≡{
    0 取引あり  1-a

とすると、取引のない期間の長さktを


kt≡“∞Σk=1”(“kΠj=1”St-j)

  ※ここでは、Σの上に∞、下にk=1と言う表記を“∞Σk=1”
   Πも同じく“∞Πk=1”と表記させてください
   St-jはStからjを引いてるのではなくtからjをひいてます。

ここまでほぼ本のとおりです。
“∞Σk=1”(“kΠj=1”St-j)を解いてみると

=“1Πj=1”St-j+“2Πj=1”St-j+“3Πj=1”St-j+・・・+“∞Πj=1”St-j

=St-1+St-1×St-2+St-1×St-2×St-3+・・・+St-1×St-2×St-3×・・・×St-∞

となると思うのですが、途中までといてみても
確率から期間が出てきたように感じてしまい

kt≡“∞Σk=1”(“kΠj=1”St-j)

何故この式がでてくるのかさっぱり分かりません。
解説おねがいします。
782132人目の素数さん:04/07/18 02:41
質問スレでスルーされてしまいました・・・

XとYが正規分布(μ、σ^2)に従う独立な事象の確立関数であり、
A=(X+Y)/2,B=(X−Y)/2とおくと、
AとBが独立であることを示すには、どうすればいいですか?
教えてエロい人
> 教えてエロい人

古すぎ。おもしろくもない
>781
t=1のとき取引があったとすると、
...., S_0=1, S_1=0, S_2=1, S_3=1
k_3=S_2 + S_2*S_1 + S_2*S_1*S_0 + ...
=1+1*0+1*0*1+...
=1
k_4=S_3 + S_3*S_2 + S_3*S_2*S_1 + S_3*S_2*S_1*S_0 + ....
=1+1*1+1*1*0+1*1*0*1+....
=2
ということでは?
>782
A,Bが独立⇔Pr(A<a,B<b)=Pr(A<a)Pr(B<b)
786132人目の素数さん:04/07/18 23:46
SARSは、これまでに累積患者数が8100人に対して死亡者数は770人 (死亡率0.095)
である。SARSの死亡率は10%であるという仮説H0:P=0.10に対してそれ
よりも低いという対立仮説H1:P<0.10を設定し片方検定しなさい。ただし、
検定のサイズはα=0.05とする。

お願いします。説き方おしえてください
H0 p=0.1

有意水準を0.01とすると、n=8100,p=Po=0.1、両側検定なんで、公式を使い
Po-2.576*√{Po*(1-Po)/n}<p'<Po+2.576*√{Po*(1-Po)/n}
p'(=770/8100)がこの範囲内にあれば棄却できない、範囲外だと棄却できる。
ごめん。よく読んでなかった…
H0 p=0.1
H1 p<0.1
有意水準を0.05とすると、n=8100,Po=0.1、片側検定なんで、公式を使い
p'<Po-1.645*√{Po*(1-Po)/n}
の場合H0は棄却。それ以外は棄却できない。
p'=770/8100ね。
789781:04/07/19 20:01
>>784
ありがとうございます。
式の意味をきちんと理解できました。
790790:04/07/19 21:14
ある地点での車のスピードを調べたところ、ほぼ正規分布にしたがっており、
平均60km、標準偏差は20kmであった。制限速度が40kmのとき何%の車
が違反をしているか?これってどうやってとけばいいんですか?お願いします。
791132人目の素数さん:04/07/19 23:59
>>788
たすかりました 
あとでメシおごりますよ
時間順に観測した(たぶん自然ではない人工的な)データ列に関して
モデル生成とか、予測について論じた

代表的な研究や最新の研究を教えてください。
793132人目の素数さん:04/07/20 17:15
>>790
そんなときにお勧め「標準正規分布表」
http://staff.aist.go.jp/s-shin/normsdist.html
もうこれがほとんど答えみたいなもんだね。
しかし、標準偏差が20km/hってのはむちゃくちゃ危険だなー。
追い越し車線みたいのが無いと怖くて走れないね。
でも制限40だからごく普通の市道かな。事故るね。
794790:04/07/20 23:40
>>793
標準正規分布表使って、どうやって解けばいいんですかね?
レベル低くくて申し訳ないんですが、教えて頂けませんか。
よろしくお願いします。
795132人目の素数さん:04/07/21 01:54
>>794
おいおい…(;´Д`)

平均60km/h、標準偏差20km/h、制限速度40km/hから、
平均から20km/h以上「遅い」車しか制限を守っていないことになる。
よってz=20km/h。
z=σとなるので、表のz=1.00σの部分を見ると0.158655
全体を1としたとき0.158655の車しか制限を守っていないということになる。
よって、答えは1−0.158655=0.841345より
約83%。
ぶっそうな道路だ。
796132人目の素数さん:04/07/21 01:55
わあ間違いw
約84%だね。
797790:04/07/21 02:02
ありがとうございます。>>795
798132人目の素数さん:04/07/21 02:03
しかし6〜7台に1台は制限速度を守っているのに、
同じぐらいの数だけ倍の速度で突き抜けていく車が存在するということだ。
100台に1台は100キロ越えだ。
いくらなんでも設定に無理があるのでは…。
799132人目の素数さん:04/07/21 12:24
Y=α+βX+γZ+εという回帰式において、帰無仮説:α+β+γ=1、対立仮説:
α+β+γ≠1を検定するために、回帰式の変形をするってのはいいのですが、
どのように変形して、どの係数についてt値を見ればよいのでしょうか?
どなたか教えてください。
800132人目の素数さん:04/07/21 20:58
多変量解析についての質問です。頭がモヤモヤして仕方ないので質問させてください。

重回帰分析は
1.説明変数間は独立でなければならない
2.交絡因子を調整した結果をアウトプット
の2点を満たすと思うのですが、1と2が矛盾しているような気がして仕方がないのです。
(1)説明変数間に相関関係があるから交絡因子と言うのですよね?
(2)説明変数間に相関関係があるとマルチコが生じるのですよね・・・?

統計初心者ゆえ、用語などもでたらめかもしれませんがアドバイスお願いします。
801132人目の素数さん:04/07/22 01:17
自分の考えですが。

重回帰分析について

偏回帰係数を見たい場合は、
説明変数間が独立であることが必要

推定量として用いる場合は、
説明変数間が独立でなくても、不偏性は保持される、が、
独立変数間に非常に強い相関があったり,一次従属な変数関係がある場合には、
解析が不可能であったり,たとえ結果が求まったとしてもその信頼性は低い。
よって、説明変数間に高い相関があるものを含めない方がよい。

と解釈してるんですが、どうでしょうか?
802792:04/07/22 10:22
ちょっと調べなければならなくなったんですが
この分野の人間ではないので質問しました。

多変量時系列分析というか
多次元な時系列データに関する観測法とか、モデル推定だとか、予測するとか
効率的にやる方法など


特に最新の研究というと有名なものでは
どんなものがあるんでしょうか?
803132人目の素数さん:04/07/25 22:47
↑おれは最近、時系列関係はやってないから、
最近の状況はなかなかわからないんだけど、
時系列で新しい分析方法が発表されたとか、
そういうのは、最近聞いてないなあ。

時系列の学習書として定評があるのは、
"Time Series Analysys" , Hamilton
かなあ。
すごく詳しいんだけど、分厚くて重量あるから
持って歩くのは大変だけどね。
すみません。系統誤差など、計算上の誤差について
詳しく書かれた文献もしくはウェブサイトをご存知のかたいらっしゃいますか?
もしいらしたら教えていただきたいのですが・・・
805132人目の素数さん:04/07/27 11:59
あげ
806132人目の素数さん:04/07/27 14:44
統計学まで萌えに汚染されとる…
しかもオーム社…
807132人目の素数さん:04/07/27 17:38
>>804
 「計算上の誤差」をどういう意味で使われているか
 不明ですが、桁数不足によるもの、浮動小数点の内部表現形式に
 起因することなら、精度保証計算などの論文を見られるとよいでしょう。
 ただ、それらの「誤差」が系統誤差になるかどうかというと
 本質的に違うと思いますよ。

 系統誤差に関しては、おれは詳しくないですが、
 観測値が何らかの理由によって「傾く」という
 ことですから、これは言葉で説明することは
 可能かと思いますが、理論的に扱うことは困難とされている
 と思いましたが・・・。

808132人目の素数さん:04/07/27 19:07
>>807
 レスありがとうございます。
実は実験解析を扱っている者ですが、あまり統計学については詳しくなく、
そこで専門的なことを知っている人が居たらと思ってカキコしました。
 私が知りたいのはまさに後者の系統誤差とか統計誤差とか言われるところです。
確かに測っている定規そのものが間違っているみたいな感じなので、
理論的に扱うのは困難でしょうね。
>809
系統誤差は取り扱うのが難しいから、
無作為化によって、できるだけ、系統誤差を偶然誤差に変換してやる。
という感じ、実験計画法の分野だと思う。
ttp://homepage2.nifty.com/crop_shimane-u/kougi10new.htm
811132人目の素数さん:04/07/31 13:33
■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■

ベイズ統計学も知らずに量子力学を勘違いしている馬鹿物理学者へ。

量子力学は観測が振る舞いに影響を与えてしまう超ミクロ世界を論じている。
量子は観測できない。よって、確率(事後確率)を論じることができない。
だから事後確率の代わりに、観測者の思い込みを確率であるかのように扱う(尤度)。
それが波動関数と呼ばれるわけだ。

さて、観測によって事後確率が得られると、尤度はその瞬間に意味を為さなくなる。(波動関数の収束)
観測者の思い込みが壊れるんだから、これは当然だ。しかし、馬鹿物理学者はこれを「決定」と呼ぶ。
お前らは真性の馬鹿か? これは「判明」であって、「決定」ではない。小学生でも分かることだ。

「観測前に『決定』は起こっておらず、観測時に『決定』が起こる」 だと?
馬鹿も休み休み言えよ。それは尤度(思い込み)と事後確率(観測結果)を
同一時間軸に並べる愚行の結果に生み出される妄想なんだよ。
それが許されるのは量子の振る舞いを記述するときだけ。妄想を現実世界に持ち込むな!!!

実際は、観測前に「決定」は起こっている。それを観測できていないだけだ。
現象を直接観測することが不能であるが故に、やむなく波動関数=尤度を使って
量子力学は記述されているのに、「世界は波動関数なんだ!観測されなければ決定は起こらない!
人間の主観こそが世界を決定しているんだ!」 なんて叫んでいる物理馬鹿の、多いこと多いこと。

迷惑だから馬鹿物理学者はベイズ統計学を学んで考えを改めて学会に反省文でも提出してろ。

■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
>>811
面白いよ。もっと語ってみれ。
813FeaturesOfTheGod ◆UdoWOLrsDM :04/07/31 14:01
実際のところ、波動関数自身の物理的意味は明らかになっていないとか。
(ドブロイ波とかいうのがあるけど、あれもどうなんだろうねえ?)
814811:04/07/31 14:07
>>812
いやだ。
ボロを出せば叩かれるからな。

私は数学も物理も専門じゃない。
私はただの本好きのいちプログラマに過ぎない。

私は論理学と数学と物理学の間に見出した新しい関連を君に伝えた。
そして数式を構築して実験で観測するのは学者の仕事だ。

私の仕事は既に終わっている。
815132人目の素数さん:04/07/31 14:40
・観測前に確率(事後確率)は存在しない。
・観測前に存在するように思われる確率のようなもの
 =尤度
 =観測者の思い込みを広義の確率として扱えるように定義したもの
・観測前の量子は、波動関数で確率的に表現される。
・観測前の量子は、尤度で表現される。
・波動関数から得られる確率は尤度である
・波動関数の収束は、尤度(思い込み)が事後確率(観測結果)に転化する状況を意味している
・波動関数の収束は、「決定」を意味しない。
・波動関数の収束は、「判明」を意味している。
・観測時に「決定」が起こるという考えは、誤りである。
・観測時に起こるのは「判明」である。
・間違い 「シュレディンガーの猫の生死は、観測者によって観測されるまで『決定』されない。」
・正解 「シュレディンガーの猫の生死は、観測者によって観測されるまで『判明』されない。」
>>814
まぁ、そう固くなるな。確率解釈を否定する立場(俺)から、見て新鮮な議論だよ。
波動函数の理解が半端に見えるが。
817132人目の素数さん:04/07/31 17:29
>>816
シュレディンガーの猫
http://science3.2ch.net/test/read.cgi/sci/1082071914/l50 に自論を書いてみた。

確かに波動関数については、理解が足りなかったかもしれない。
だが、調べていて http://homepage2.nifty.com/eman/quantum/zahyo.html
を見つけたが、結論は

>さて今さら言わなくともバレバレだろうが、この時の連続的に変化する係数 というのは波動関数そのものである。
>よって状態ベクトル と座標ベクトル |x> の内積の値の2乗を取ったものが、その座標に粒子を見出す確率になっている
>という論法が成り立つ。

となっているようだ。シュレディンガーの猫が未観測な状態にあるとすれば、
これはまさに尤度(未観測状態における推定確率)そのものだろう。
818132人目の素数さん:04/07/31 18:08
Mantel's test ができるフリーソフトで、
シンプルなやつをどなたかご存知の方いませんでしょうか?
819132人目の素数さん:04/08/01 18:56
「人口千人対」の意味がよく分かりません。
各国の離婚率を調べているのですが、
http://plus.naver.co.jp/browse/db_detail.php?dir_id=61003&docid=12470&l_url=aHR0cDovL3BsdXMubmF2ZXIuY28uanAvcmVjb21tZW5kL2xpc3QucGhw
では

>離婚率(人口千対)
>日本2.27(平成15年推計値)
>アメリカ4.0(平成14年確定値)
>イギリス2.6
>ドイツ2.4
>ちょっとわかりにくいかもしれませんが、日本では現在3組に1組近くが離婚していると思ってもらってかまいません。

と書かれています。最初は日本では1000人中2.27人が離婚しているのだと思ったのですが、
これだと、
>日本では現在3組に1組近くが離婚していると思ってもらってかまいません
と繋がらないのでどう解釈すればいいのか困っています。
どうかご教示ください。
820132人目の素数さん:04/08/01 22:40
>>811
つか、エルゴーディック。。。
822819:04/08/01 23:17
>>820
なるほど、理解しました。
でも、それって結婚した人のうちどれだけ離婚したのかが分からないから、
全然参考にならないですよね('〜')
>>781
僕もその本が気になって読み始めました、たしかにその部分わかりにくいですよね。
まず、多銘柄に対して説明していないのに、多銘柄に対応するべくiを入れてあるけど
誤解を招くから、取り除いて欲しいと思った。
連続した非観測日も、あれは解説がないとかなりトリッキーだよね。
休みの日={1,1,1,0,1,1,1,1,0,0}
とすると
1
1*1
1*1*1
1*1*1*0
1*1*1*0*1
以下もう0が出てきたので、以下全部0
1は幾つ掛けても1だから、合計すると日数になると。
これで関数kができたから、この期待値・分散を計算してみようと・・・
なるほど面白いけど説明無しだと何が起こっているのか意味不明。

>>811

私は物理学者ではないが、代わりに返事しよう。

>■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■

>ベイズ統計学も知らずに量子力学を勘違いしている馬鹿物理学者へ。

>量子力学は観測が振る舞いに影響を与えてしまう超ミクロ世界を論じている。
>量子は観測できない。よって、確率(事後確率)を論じることができない。
>だから事後確率の代わりに、観測者の思い込みを確率であるかのように扱う(尤度)。
>それが波動関数と呼ばれるわけだ。

>さて、観測によって事後確率が得られると、尤度はその瞬間に意味を為さなくなる。(>波動関数の収束)
>観測者の思い込みが壊れるんだから、これは当然だ。しかし、馬鹿物理学者はこれを「>決定」と呼ぶ。
>お前らは真性の馬鹿か? これは「判明」であって、「決定」ではない。小学生でも分>かることだ。

>「観測前に『決定』は起こっておらず、観測時に『決定』が起こる」 だと?
>馬鹿も休み休み言えよ。それは尤度(思い込み)と事後確率(観測結果)を
>同一時間軸に並べる愚行の結果に生み出される妄想なんだよ。
>それが許されるのは量子の振る舞いを記述するときだけ。妄想を現実世界に持ち込むな>!!!

>実際は、観測前に「決定」は起こっている。それを観測できていないだけだ。
>現象を直接観測することが不能であるが故に、やむなく波動関数=尤度を使って

これは全て的はずれ。物理世界がエルゴーディックなら、完全に正当化されうる。
君が言うべき事は、「物理学的世界がエルゴーディックであるという証明などない
ではないか」ということであるべき。
しかし、エルゴーディックという仮定は自然なものであり、単に疑問を述べるだけ
では
>迷惑だから馬鹿物理学者はベイズ統計学を学んで考えを改めて学会に反省文でも提出してろ。

>■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■

こんな偉そうなことは言えない。
エルゴーディックでないと言う証明をオマエがまずやれ。


他と無関係に(?!)、唯一意味を持っている箇所は
>量子力学は記述されているのに、「世界は波動関数なんだ!観測されなければ決定は起こらない!
>人間の主観こそが世界を決定しているんだ!」 なんて叫んでいる物理馬鹿の、多いこと多いこと。

ここだけ。そしてここの部分は、「判明」だの「決定」だのは無関係。
(なんのこっちゃそれは?)

>「世界は波動関数なんだ!観測されなければ決定は起こらない!

これは正しい。問題は、このことと

>人間の主観こそが世界を決定しているんだ!」

とがつながらないことに気づいていない人間が一部いるということ。

例を挙げてもう少し分かりやすく説明しよう。
例えば手にサイコロをもって、振る。振ると目がでる。振らなければ目は出ない。
その意味で手はサイコロの目が出るという事実を「決定」している。
しかし、何の目がでるかを決定はしない。

波動関数は観測しなければ収束しない。観測すれば収束する。
だからこの意味で観測(人間の主観?)が決定している。
しかし、どういう収束をするかを決定しているのでは断じてない。
だから「人間の主観こそが世界を決定している」という言い分は成立しない。
それはサイコロを振るかどうかの決定権を人間がもっているという事実を根拠として、
なんの目が出るかを決める権利まで人間がもっていると主張しているのと同じだ。
無論ナンセンスだ。

827132人目の素数さん:04/08/02 00:20
>>822
 えーとですね、おれは人口とか世帯の調査が
 専門ではないのですが、おおざっぱに説明しますと、
 年が経過するにつれて現在の夫婦も年をとり、今の子供たちが
 結婚する年になって、またその子供が・・・、というのを
 考えなければならないのです。
 そうすると、現在の出生率が一定であると仮定して、寿命が75才
 と仮定して、30才までには9割が結婚するとして、(全部仮定になります)
 そして人口構成比から、順次推定を繰り返していかなければならない
 と思います。

 そういうふうに仮定をおいて、推定を繰り返せば、例えば
 今後40年間に一度結婚した人が、生涯に離婚をする確率は、
 推定値として、だいたい20%から25%となる、というふうに
 なるのだと思います。

 かなりこみいった計算が必要になると思いますから、
 論文を検索して、その結果を引用するほうがいいと思います。
 ただ、論文によって仮定が異なりますから、結論も多少異なると
 思いますけど・・・。
828811:04/08/03 04:51
>>825
エルゴード性などとはどこにも書いていないのに、いきなり何を言い出すんだい?
まずは、どうしてエルゴード性の話を持ち出したのか説明するところから始めたまえ。
でなければ君以外にとって、君のレスは煽りと見分けがつくまい。

ちなみに私は、物理法則にエルゴード性があるという仮定の下での話しているんだが。

>>826
あらゆる粒子は他の粒子を観測対象に持つと同時に、
他の粒子によって観測されている。それが「干渉」ということでは?

観測→
(A)   (B)
   ←観測

ならばあらゆる決定は人間不在の場所で進行し続けているはずだ。
すなわち 「観測されなければ決定は起こらない!」 という命題は、
「(観測者の立場に立ち得る他の粒子によって)観測(干渉)されなければ決定は起こらない!」
であるときだけ、正しいということなのでは?

故に、シュレディンガーの猫の生死は、蓋を開ける前に蓋の中の粒子によって観測(干渉)されることで、
既に完全に決定されている。人間の観測者は過去に起きた決定を観測し、
結果が「判明」するだけだ。決して、蓋を開けることで「決定」が起こるわけではないのだ。
物理板でなく数学板で必死になる理由がワカンネ。
むこうの板でやるとまずい話なのか?
なんなら物理板にスレ立てるけど。
>>829
それがいいね。
831824,825,826:04/08/03 14:32
エルゴーディック云々は、もしかしたらオレが外したのかも。。。

物理板に行くのがいいと思うけど、おそらく「判明」と「決定」とを区別する理由が
分からないと言われるだろうね。(物理学的に同じことだから)

あと、>>826に書いたことにちゃんと反応してない。
君は実は何も言っていない。物理学者が言っていることは
「人間の主観は世界の一部だ」ということなのであって、
「人間の主観こそが世界を決定しているんだ!」などとは言っていないハズ。
(一部のトンデモは知らないよ。)
だから、そもそも君の主張はズレていると思う。

832831:04/08/03 14:52
ちょっと補足。
>(物理学的に同じことだから)
というのは「判明」と「決定」とを混同しても、
物理学的になんの矛盾も生じない、という意味だよ。
だから君が言うべきは、「いいや、こうこうこう言う矛盾が生ずる」
でなくてはならないよ。「なんか変な気がする」みたいなことを
言っているだけで、
>迷惑だから馬鹿物理学者はベイズ統計学を学んで考えを改めて学会に
>反省文でも提出してろ。
こんなことを言ったら、バカは君のほうだからね。

833824,825,826:04/08/03 18:02
さらに補足(つーかいいわけ)
>>826

>波動関数は観測しなければ収束しない。観測すれば収束する。
は間違いだね。人間が観測すれば収束するが、人間が観測しなくても収束するね。

オレもオレで理解が浅いから、どうもレスが混乱している。
やっぱ、物理板に行くのがいいっすね。
834132人目の素数さん:04/08/03 20:47
835132人目の素数さん:04/08/03 22:32
今モーメント母関数について勉強しているのですが、ちょっと気になる事があって質問します。
確率密度関数からモーメント母関数への変換ができるのなら、
その逆、モーメント母関数から確率密度関数は作れないのでしょうか?
離散型なら、鶴亀算で解いてしまえば良いというのは判りました。
連続型でも解けそうな気がするのですが、解き方がどうしても判りません。
836132人目の素数さん:04/08/05 00:38
検定結果の表記についての質問です。

検定を行なった論文や報告書について
0.01≦P<0.05 なら*
0.001≦P<0.01なら**
P<0.001なら***と
P値の階層ごとに星の数を増やす表記はあまりイクナイ。
統計解析の結果は、帰無仮説に基づいた統計量(T値やF値等)とP値を
「そのまま」記載するべきである。

という警鐘をよく聞くのですが、このような思想が起こったのは、
「P値が小さいほど、差が大きくなる」という勘違いを蔓延させないためですか?
しかし、世の中には、このような*を沢山ちりばめたグラフや表がイパーイ。
難しいところですね。

837132人目の素数さん:04/08/05 09:01
>>836
昔はさぁ、α=.05 (など)における統計量と、データから算出される統計量
を比較して「有意であるか否か」を判定してたんだよ。だから、三段階くらい
の荒い判断しかできなかった。

しかし、ソフトウェアの発展と普及にともなって、観察データから算出される
統計量の p 値が直接求められるようになった。

> 「P値が小さいほど、差が大きくなる」という勘違いを蔓延させないためですか?

別に p値をそのまま出しても勘違いはなくならないと思う。
要は、三段階程度の「荒い」基準ではなく、より詳しい p 値を提示した方が
情報量がおおかろう、ということではないのか?


>>835
(面倒くさい議論は全部おいておくとして、)
モーメント母関数
M(t) = ∫f(x)exp(tx)dx
t = iω を代入すれば、M(iω) は f(x) のフーリエ変換になるから、
これのフーリエ逆変換を考えて
f(x) = ∫M(iω)exp(-iωx)dω
という風にモーメント母関数から確率密度関数を求められる。
検定ってなんか論理が転倒してるよな
840132人目の素数さん:04/08/05 15:05
ある分布をエクセルを使用して対数正規分布に近似する方法を教えていただけませんか?
(1/((SQRT(2*3.1415))*σ*x))*EXP(-((LN(x)-μ)^2)/(2*σ^2))
μ:平均値,σ:標準偏差

↑の対数正規分布の式でμ、σをソルバーを使って変化させ、元の分布にもっとも近い形になるような値を求めてみましたが、
どうもうまく行きません。
正しい近似法などがありましたら教えていただけないでしょうか?
一応、自分でも検索してみましたがなかなか見つからないのでここでお訊きしようと思いました。
このへんで聞いてみればよろしいかと

Excel総合相談所 26
http://pc5.2ch.net/test/read.cgi/bsoft/1091619391/
842840:04/08/05 15:34
ありがとうございま
なかなかよさそうなスレッドですね。
そこで訊いてみます。
>>838
どうもです、しかし不思議です僕は離散でのモーメントを計算した時、
実数の範囲で、それも一次方程式の範囲でグリグリと解いていたので、
どんどん方程式を増やしていって連続になるときも、当然実数の範囲になりそうな気がしました。
ところが、二次方程式があるわけでもないのに複素数を使うと解けるとは…
844132人目の素数さん:04/08/06 22:07
チェビシェフの不等式というのがありますが、
これは平均と分散から確率の最大・最少を計算することができます
もしも、平均・分散以外にもっと高次のモーメントが求まっていると
もっと細かく確率が計算できそうな気がするのですが、そういうのってあるんでしょうか?
845132人目の素数さん:04/08/07 00:00
>>844
確率変数Xの平均をE(X), 分散をV(X)とするとき, チェビシェフの不等式は
∀ε>0, P(|X-E(X)|>ε)≦V(X)/(ε^2)
と書かれることが多いが、もっと一般にnを自然数とするとき,
∀ε>0, P(|X-E(X)|>ε)≦E(|X-E(X)|^n)/(ε^n)
が成り立つ。V(X)による評価はn=2の場合。これが高次モーメントによる評価といえないか?

さらに一般に、f(x)を[0,∞)上の非負単調増加関数とするとき,
∀ε>0, P(X>ε)≦E(f(max{X,0}))/f(ε)
が成り立つ。Xとして|X-E(X)|を代入し,f(x)としてx^nをとれば上の式になる。

これらもチェビシェフの不等式と呼ばれる。
846132人目の素数さん:04/08/07 09:15
シンプレックス法を利用した非線形最小二乗法の方法について解説してある
本かサイトを教えてもらえませんか?
847132人目の素数さん:04/08/07 14:16
買っちまったよ。オーム社。
買うまいと思ったんだけどなあ。
>>847
感想どぞー
もえたんは絵は可愛いけど英語はダメダメだからな。どうせオーム社のもそんなんだろ?
849132人目の素数さん:04/08/11 08:50
これが意外にちゃんとしてる。
独立性の検定を出来るようになるまでやってくれる。

もえたんよりはずっとまともな本でした。
『n面体のサイコロを、すべての目が1回ずつ出るまで振り続けた場合の平均の回数』
を求めるには、どんな式を立てれば良いのでしょう?

最低の回数はnですが、最高は上限なさそう(いくら振っても目当ての目が出ないこともありそう)
なので、平均の求めようはない様な気もするんですが…詳しい方ご教授願います。
>>850
Xを全ての目が出たときの回数とすると
P(X=k)=(n-1/n)^(k-1)(1/n)
じゃないかなあだめだだめだまあそれが求められたとして
E(X)=sum kP(X=k)
となりますこれ無限和です
852132人目の素数さん:04/08/11 22:11
質問させていただきます。

今、あるものの変化する速度を測定したデータがありまして、
そのデータから、その速度の極大値を推定したいという
要望がありました。そこで、極値統計解析という手法で
推定すればよい、という風に言われたのですが。
極値統計解析に関する本は、本屋さんに行けばすぐに
見つかりますか?ぐぐってもあまり出てこなかった
のですが・・・できれば、その概要なんかを教えて
いただけると助かります。よろしくお願いします。
(なお、当方統計のことはほとんど理解しておりません
 ので、頓珍漢な書き込みであった場合は、平にご容赦)
>>849
あり
俺も買っちゃったYO。。。
854132人目の素数さん:04/08/15 14:23
2群比較の輪切り検定に関する質問です。

経時的に3回(試験前、1ヵ月後、終了時)測定されたデータについて、
対応の無い2群間(実薬群 VS プラセボ群)の検定を
行なう場合は、輪切り検定による多重性問題が生じてしまいます。

このような場合は、対応のないt検定あるいはウィルコクソンの順位和検定(U検定)
を複数回行い、ボンフェローニ補正による有意水準の調整
(例えば、2回検定を行なう場合は、P値が0.05/2=0.25を下回った場合に
有意差ありとする)を行なえば大丈夫でしょうか?

このタイプの多重性問題について記載のある参考書が見当たらないので
どなたかご教授お願いしまつ。
それでいいと思いますよ。
もっと難しいのもありますけど。参考になりそうな本。
ttp://www.amazon.co.jp/exec/obidos/ASIN/4254127553/qid%3D1092613560/250-6677057-5373826
856850:04/08/17 16:40
>>851
ありがとうございます!返答遅くなってしまってすみませんでした。
やっぱり正確な平均は求められなさそうですね。
857132人目の素数さん:04/08/24 02:00
232
858132人目の素数さん:04/08/24 03:14
>>851
まず、必要な試行の回数をXとし、その確率分布を考えてみてください。
そうすると「結果的に」それが「成功の確率を1/nとする負の二項分布」
に従うことが分かります。ですから、その平均は
n×1/(1/n)=n^2
となります。非常に直感的な結果ですね。何故直感的かというと、ある
一つの目が出るまでにサイをふらなければならない回数の平均は直感的
に考えてn回なわけです。すべての目が出るまでの平均回数は当然この
n倍、つまりn^2となります。
859132人目の素数さん:04/08/24 03:16
(正)つまりn^2となることをこの結果は示唆しているわけです。

最後の行訂正。
860132人目の素数さん:04/08/24 03:24
一つの目が出るまでにサイをふるという作業をn回繰り返しているのと同じなんだから
そのままn倍になるってことか。
じゃあ一つの目が出るまでの平均がn回であることを説明すればいいんだな。
861132人目の素数さん:04/08/24 03:32
その通りです。統計学の世界では、ある一つの目が初めて出るまでの
試行回数の確率分布を「幾何分布」と呼んでいます。
直感的には1回当たり1/nの確率でしかでないのだから、n回やったらいいだろう
ってことですね。普通のサイコロで1の目を出すのに、直感的には6回振ったら
いいじゃんと思うのと同じ理屈です。
撹乱項って英語でなんていうか知っている人いたら教えてくださいです。
http://love3.2ch.net/test/read.cgi/kageki/1093825381/

上記のurlは過激な恋愛板の『同誕生日の人に中出しするスレ』
ってやつなんですが、ここで参加人数をx人、男女比をr(r<1)
と仮定した場合、カップルが成立する確率は何%になるんでしょう。

1. 全体の中で少なくとも1組以上成立する確率
2. ある人(個人)が相手に巡り会える確率

この2つを求めてみたいなと思ってます。

同じトリップが1組以上成立する確率は、誕生日パラドックスの話と
ほぼ同じなんですぐ分かるんですが(参加人数130人でだいたい9割)
男女比を考慮した場合、自分の力不足のせいで少々苦戦してます。

男女カップルであり、かつトリップが同じ場合の
同時分布で解けそうな気配はあるんですが…よくわかりません。

詳細はリンク先のスレで確認お願いします。
男女比以外の条件は皆同等の確率と断定して考えてます。

初歩的な質問ですみませんがご教授よろしくお願いします。
864132人目の素数さん:04/08/31 07:56
ダイエット法にホットサンド法(H法)とオートミール法(O法)がある。
それぞれの方法に挑戦した人の中から10人をランダムに選び、減少した体重を測定
して偏差平方和を計算したところ、H法の偏差平方和=88、O法の偏差平方和=44が得られた。
2つのダイエット法の分散は等しいと言えるか否か検討しなさい。
ただし、F表より F(9,9;0.025)=4.026 F(9,9;0.05)=3.179である。
865132人目の素数さん:04/09/06 15:41
850
8667:04/09/06 21:52
867
8677:04/09/06 22:01
>854
ボンフェローニの調整では検出力で損をしてしまいます。
この場合、時点毎の検定統計量間に相関が出てきますので、その相関を考慮した、
解析が考えられます。手順としては、混合モデルで相関を割り出し、多変量t分布を
積分してp値を算出することになります。
統計学を独学で勉強しようと思ってるんですが数学の知識はどれくらい必要ですか?
数学の知識ゼロです
869FeaturesOfTheGod ◆UdoWOLrsDM :04/09/06 23:00
Re:>868 積分は確実に要る。
FeaturesOfTheGod ◆UdoWOLrsDMは、ウザイよ。
引っ込め。
>868
どの程度の統計学を勉強しようとしているのか分からないので一概には言えませんが、
簡単な多変量解析などであれば高校数学(理系)の知識があれば、
統計ソフトを使うのには申し分ないと思います。
より高度な統計を理解するには微積や行列の深い知識が欲しくなってきますが、
必要になったときに勉強すればいいと思います。
がんばってください。
872132人目の素数さん:04/09/07 21:53
>>871
本当にそう思ってる?
100歩譲ってSPSSは使えてもSASは実用的には使えないだろうな。
873132人目の素数さん:04/09/07 22:09
>>872
SASは使ったことないんで知らないけど、SPSSやJMPやRなら高校数学程度の知識で
十分実用的に使えるでしょ。
というか、事前の知識よりも新たな知識を身に付けようとする努力の方が重要。
>>873
仕事で統計を使ってないでしょ?
875とおりがかりの統計人:04/09/08 00:04
うー、今年の統計学会(連合大会)は南国育ちのおれにしては
ちょっと寒かったなあ。
生まれて初めて岩手県にいったよ。

でも、昼食の混雑はどうにかして欲しかったなあ・・・。
ま、なんとか発表を終えてほっとしようかと思った
矢先に地震と台風だもんねー。
あー、忙しい忙しい。

あ、それとね、お願いだから統計スレッドでは初心者の
方にはやさしくしてあげましょうね。
でないと統計やってる人が嫌な人に思われると困るしね。
よろしこ!
876871:04/09/08 01:05
>872
SPSSは日常的に使用(主に多次元尺度法と重回帰分析で)。
SASは使ったことないです。他には構造方程式関連のソフトを使ったり。
僕自身、高校数学の知識があれば統計ソフトを使うのに申し分ないというのは本当にそう信じてますよ。
向学心さえあればなんとでもなりますし。
877132人目の素数さん:04/09/09 00:23
質問です。
marginal anova,marginal meanというのは何でしょうか?
そのまま訳すと周辺分散分析?よくわかりませんでいた。

手持ちの統計本には載ってなかったので困っています。
また,ネットで検索してもHitしませんでした。
英語のページが3件ほどヒットしましたが,具体的な説明は載っていないみたいでした。

これらはいったいどのようなものなのでしょうか。。
日本語訳だけでもご教授いただけないでしょうか。お願いします。
878873:04/09/09 23:01
>>874
残念ながら、毎日のように業務で統計を使ってます。
SPSSメインでJMPも併用。
AMOS、R、Wekaは時々使うぐらいだね。

ちなみに、私自身は学生時代からずっと文系で来て、高校数学だって
怪しいぐらいの知識しかなかったけど、社会人になってから必要に迫ら
れて統計学を身につけた口です。
8797:04/09/12 02:38:54
>878
うらやましいです。業種は何ですか?よろしければ教えてください。
共分散構造分析はどんな場合(業種)で使われているのですか?
880871:04/09/12 10:22:18
僕の場合は共分散構造分析は認知心理学系のことで使ってます。
広く言えばマーケティングに利用できるかな、というかんじです。
881132人目の素数さん:04/09/12 11:30:51
程度が低いんだろうな。
882132人目の素数さん:04/09/12 14:12:12
spssをメインで使ってる香具師に、873のようなタイプが多いね。
ま、色々な考えの分析者がいて良いのではないでしょうか?
時々笑わせてもらいますが。
8837:04/09/12 14:33:07
>880
共分散構造分析は前から気になっていました。
ですが、パスの構成方法が恣意的になりがちではありませんか?
何かモデルの良さを表す指標はありますか?
884132人目の素数さん:04/09/12 14:49:08
>873
手法の難易度と求められる完成度によりますね。
たとえば線形回帰でしたら数理的な部分がわかっていなくてもできるが、
最終成果物の普遍性を考えるとやはり奥深いところまで理解していたほうがいいですね。
885132人目の素数さん:04/09/12 20:46:06
ふたつのものさし(ひとつは既製品、もうひとつは手作り)の精度を比較するため、ある長さを60回づつ測りました。
平均値はほぼ同じでその差0.2mmでした。SD値もやはりほぼ同じ。
これでふたつのものさしはおなじ精度だといいたいが、
 そんなばあいは何検定をしたらいい?
8867:04/09/12 21:27:56
>885
この場合に普通のt検定を使うと測定回数が多くなるとほとんど差が無いのに
有意になってしまう可能性が考えられます。
この場合はベイズ的アプローチによる仮説検定がよいでしょう。
あまり使われていないと思いますが、積極的に両軍が同じであると
いいたいときには特に有効な手法です。
887132人目の素数さん:04/09/12 21:28:57
【速報】冨樫義博、来年3月で引退【衝撃】
http://comic6.2ch.net/test/read.cgi/csaloon/1094987914/
888871:04/09/12 21:57:59
>883
測定方程式と構造方程式をそれぞれ別々に評価しようとするとき、
同時に評価しようとするときなどで数多くの方法が提案されています。
ですが、これぞ決定版!というものがないのが現状っぽいです。
889873:04/09/12 22:34:26
>>879
> 共分散構造分析はどんな場合(業種)で使われているのですか?

↓ここらへんの事例と同じような使い方をしています。
http://www.interscope.co.jp/method/a03.html
http://www.eiyo.ac.jp/kenkyu/lab/s051/gyoseki2.html
890132人目の素数さん:04/09/12 23:08:17
【社会】インターネット利用率ついに100%に−総務省の実態調査で判明

 先月27日に実施された、インターネット利用に関するアンケートで
 インターネットの利用率が100%となっていたことが明らかになった。
 麻生総務大臣は「これは政府主導によるIT政策の効果の現れと言っていいだろう」
 とのコメントを発表した。

 調査したのは、総務省統計局統計センターなど。今年四月に
 インターネット上でアンケートを実施し、約二万三千人から回答を得た。
891132人目の素数さん:04/09/14 01:30:09
↑笑えるよね!
インターネット上でアンケート取って、
インターネット利用率が100%とは!
がっはっは!
892132人目の素数さん:04/09/14 01:47:18
言われて気付いた俺はかなり鈍くなっている様だ。笑った!
893132人目の素数さん:04/09/14 02:14:14
パチスロの設定6で負ける確率を統計解析するオレはさすがですか?
894132人目の素数さん:04/09/14 11:58:46
下記のデータは50人の生徒の評価の分布です。
数値は人数で、50人は1学期と2学期で同一です。

    1学期  2学期
良い   3    5
やや良い  13   16
普通   21   17
やや悪い  7   7
悪い    6   5

「1学期から2学期にかけて改善したか」についての検定はいろいろあると
思いますが、このデータをカイ2乗検定をしても良いのでしょうか?
順序尺度だとカイ二乗はダメなのでしょうか。
895132人目の素数さん:04/09/14 12:25:20
ANOVAについての質問です。 STATISTICAというソフトで計算したいのです。ANOVA自体は理解していると
思うのですが、STATISTICAでどういうふうにデータ入力すればいいのか判らないのです。実は判らないのはTWO−WAY ANOVA
です(レベル4X4)。何方か、いいWEB SITEとか知ってたら教えてください。
簡潔な説明でも結構です。別のところに書いたんですが、ここを見つけたので、ここにも貼っておきます。
896132人目の素数さん:04/09/14 19:42:30
>>894
もし貴方のクラスにその50人しかいないのなら、検定は意味がありませんね。

その50人が母集団からのランダムサンプルなら、順位尺度以上で用いること
のできる検定をすべき。この場合U検定かな。
897132人目の素数さん:04/09/15 01:21:10
> 894 >896
この場合は、生徒ごとに、たとえば2学期の成績から1学期の成績を引いて、
符号付順位和検定(確かこんな名前)をするべき。
もともと良い人は良く、もともと悪い人は悪くなりがちになる点を考慮したほうが
よいでしょう。
898132人目の素数さん:04/09/15 01:30:32
>890
アンケートを取る所が交絡要因になっているんですね。
アンケートを取る際に陥りやすい点ですね。
899896:04/09/15 09:33:14
>>897
なるほろ
900894:04/09/15 09:33:56
>>896>>897

生徒ごとに差をとって中央値の検定することは決まっていたのですが、
50人分を集計して何かできないかと思い聞いた次第です。

やはり2人がご指摘の方法がベストのようですね。
ありがとうございました。
901132人目の素数さん:04/09/16 09:39:17
質問です。当方高校の知識しかありません。
>>112-114を読んで自分も常々疑問に感じてたことが書かれていて安心しました。
ところで標準偏差のかわりに絶対偏差をもちいた有用な理論とか公式はありますか?
902132人目の素数さん:04/09/16 22:50:53
>>862
cherry term
903132人目の素数さん:04/09/17 05:30:13
>>901
金融工学の分野で、絶対偏差モデルみたいのはないこともない。
904132人目の素数さん:04/09/19 14:46:00
過去ログ読んでも無いよう(自分がわからないだけ?)なので質問させていただきます。

例えば1/200の確率で当たり出ると言われているくじがあります。
しかし、当たりが本当に1/200で出るかはわかりません。

このくじの当たりが本当に1/200で出る検証をしたいときに、くじを引く回数をどの程度に設定したらその検証は信頼出来るものと言えるでしょうか?
また、その検証の信頼度を確率と試行回数の式で表せるならそれを教えてください。

更にお願いで申し訳ありませんが、それらの説明が載っているHPや参考文型等がありましたら教えてください。
お願いします。
905132人目の素数さん:04/09/19 19:22:43
↑そのくじってn本なの、それとも無限にあるの?
それによってちょっと違うから。
906904:04/09/19 20:04:08
>>905
すいません、くじの本数は無限です。
ただ、無限に引くって事は無理ですし、出来るだけ少ない数で検証をしたい
って事です。
907132人目の素数さん:04/09/19 20:17:38
あたりが出る確率が1.0000000000001/200である(1/200ではない)、
というような可能性も考慮しないといけないのなら、検証は事実上不可能。
あたりが出る可能性が実は0/200あるいは2/200、3/200、・・・である、
という可能性だけ考えればよいのなら、なんとかなる。どちら?
908904:04/09/19 20:30:56
なんどもすいません。
実際の確率の方は1/210や1/250、1/300の可能性があるかもしれません。
10001/2000000 このような確率にもなるかもしれません。

言葉足らずで申し訳ありませんが、「また」以降の「確率」とは1/200の事です。
実際の確率はわからないですが、確率を1/200と仮定してくじを引き、
その時に必要であろう試行回数との関係式があれば・・・

って事です。
909FeaturesOfTheGod ◆UdoWOLrsDM :04/09/19 20:33:37
Re:>908 統計的確率が何に近づいているか、それが問題だ。
910904:04/09/19 21:04:42
>>907
すいません、今意味がわかりました。
ちょっとの違いなら検証する事が出来ないって事ですね
911132人目の素数さん:04/09/19 21:40:31
FeaturesOfTheGod
ウザイ
912132人目の素数さん:04/09/19 22:55:44
>>904

n回ふったときに、x回当たりが出る確率は二項分布
nCx (1/200)^x (199/200)^(n-x)
期待される当たり数(二項分布の平均) n*(1/200)
また二項分布の分散はn*(1/200)*(199/200)
nが十分大なら正規近似できると考えて、推定される95%区間は
平均±1.96*標準偏差
= n*(1/200) ± 1.96*√n*(199/200^2)
この区間になければ1/200ではない(と断言して間違っている確率は5%以下)
20000回くじをひく場合、当たりの回数が80〜120
10000                36〜64
5000 15〜35

逆におおよその当たりの回数が推定できるなら、
逆算すれば何回くらいかはわかるんでないかい
913132人目の素数さん:04/09/19 23:10:05
>>858-861
「まだ出ていない目が出る」確率と考えると

・最初はどの目でもOK = 確率はn/n (=1)
・以降出ていない目が出るたびに (n-1)/1、(n-2)/n となっていく

ので、全部で

n/n * (n-1)/n * (n-2)/n * ... * 1/n  =  n!/n^n

となって、
平均は n^n/n! 回になるなのでは?
(この辺は861にある「1/nの確率は、n回やればいいだろう」とい考えと
同じ、つまり単純に確率の逆数で求めてます)

あーだめだ、自信ないわ
914132人日の素数さん:04/09/20 13:27:53
>>912
回数が少なければ少ないほど標準偏差が大きくなります。
信頼区間内であることをもって、割合が同じとする考え方では、回数が少なければ
成立してしまうので、適切ではありません。
割合が同じかどうかの検証だけが目的でしたら、ベイズ流の仮説検定が考えられる
でしょう。
915132人目の素数さん:04/09/20 19:25:17
分散分析を生物統計学で独学してます
記号の意味が分からないので教えて下さい
測定値 y(I,J) = U + A(I) + e(I,J)
U    全体の平均
A(I)  因子Aの水準Iの効果 
e(I,J) 測定値Y(i,j)の誤差

この後、母数U,a(I)を推定する、と話が進んで上に^がついた
U,a(I)が出てくるのですが、これはどういう意味でしょうか?
また上に−のついたy..は全測定値の平均という意味でしょうか
916132人目の素数さん:04/09/20 19:27:04
すみません a(I)はA(I)です
917132ん日の素数さ人:04/09/20 20:35:04
>>915
^の付いていないものは母集団の真の値、付いているものは標本による推定値。
y..は全測定値の平均値。上にマイナスが付いていたり付いていなかったりする。
918132人目の素数さん:04/09/22 05:22:53
>>904
問題を、
「母比率の検定(帰無仮説:p=1/200、対立仮説:p≠1/200、有為水準1%)において、真の比率が1/200から〜以上異なるときに、仮説を採択する確率を1%以下にしたい。標本はいくつ以上取ればよいか?」

みたいにすれば答えは出るよ。
919132人目の素数さん:04/09/22 14:30:49
初心者質問ですみません。
回帰係数と単相関で符号が違うのはどっちを見ればいいんですか?
920132人目の素数さん:04/09/23 02:07:25
>>918
なるほど、そういう考え方があったのか!
918さん、あなたの職種(学生?)は何ですか?
921132人目の素数さん:04/09/25 13:09:25
株とかで、適当な時点で購入、過去に付いた最大の価格より a円 だけ下がったら売却
という規則で売買したときの利益の分布を調べたいのですが良い計算方法っていうのはあるんでしょうか。

もう少し具体的に説明すると、
正規分布(似ていれば特にこれである必要はないです)で 0 から開始してランダムウオークする
数列があって、過去につけた最大値より a だけ小さい値になったときの価格を x とすると

分布関数
f(x) = 過去最大値よりaだけ小さくなったなった時の x の確率

となるような関数を計算してみたいです。

ちなみにパソコンで力ずくで計算してみると、a が小さい時は正規分布に近づいて a が大きい時は
指数分布の裾の広い感じの印象を受けます。(aが小さいときは数列を作る乱数の分布そのもののような気がします)
922132人目の素数さん:04/09/27 01:14:20
P1,Q1を(Ω1,B1) 上の確率測度.L1をQ1のP1に対する導関数.
P2,Q2を(Ω2,B2) 上の確率測度.L2をQ2のP2に対する導関数.
PをP1とP2の直積測度.QをQ1とQ2の直積測度.LをQのPに対する導関数.
(LをQのPに対する導関数⇔
あるNが存在して,P(N)=0 かつ Q(A)=∫_A LdP+Q(N∩A) (任意のAに対して) かつ L≧0)

命題:LとL1×L2はほとんどいたる所 P で一致する.

上の命題が正しいかどうか自信がありません.
Q1がP1に対して絶対連続,Q2がP2に対して絶対連続のときに成立することは証明できました
(文献にものってました)が一般の場合はどうなるのか…?

どなたかご存知の方がいらっしゃったらお教え下さい。
当方統計専攻の院生です。
923132人目の素数さん:04/09/27 07:02:38
平均=普通は成り立つの?
924132人目の素数さん:04/09/27 10:16:41
メディアンのほうが「普通」には近いかも。
平均は極端なものに引っ張られちゃうから。
925132人目の素数さん:04/09/27 20:58:53
>>924 メディアンってなに?
926132人目の素数さん:04/09/27 21:42:02
>>924 正規分布するなら普通と言ってもいい?
927132人目の素数さん:04/09/27 22:05:19
メディアン=中央値 です。

でも、それ以前に「普通」ってどういう定義なんでしょうねぇ。
しゃべり場10代みたいなテーマですが。
928132人目の素数さん:04/09/27 22:23:50
「普通とは何か」となれば、それは統計学の範疇を超えますね。
929132人目の素数さん:04/09/28 01:53:22
例えば平均身長は普通の身長っていうことになる?
930132人目の素数さん:04/09/28 10:15:23
子供が0.97人いる家庭は平均的だが異常だぞ
931132人目の素数さん:04/09/28 10:22:09
普通と平均がほぼ同じ意味で使われる場合と、そうでない場合がある。
932132人目の素数さん:04/09/28 10:30:27
>>929
実際に1000人分くらいサンプルをとってみて、
全員の身長から算出された平均値が
ちょうど170cmだったとする。

171以上が499人、169以下が500人だった。
んで、ちょうど170cmが一人だけいた。

170の人の身長は平均的だと言えても、普通だと言える?
普通って言葉の意味は、多義的すぎておぼつかないんじゃないかな。
933132人目の素数さん:04/09/28 23:27:41
>>932 でも身長の場合そんなにばらつきがないんじゃないかな?平均身長が170だとするとやっぱり170前後が一番多いんじゃないの?
934132人目の素数さん:04/09/29 08:27:20
母数の平均が普通といえるんじゃないだろうか
935132人目の素数さん:04/09/29 21:26:12
>>934 母数の平均とは?
936132人目の素数さん:04/09/29 23:43:11
母平均
937132人目の素数さん:04/09/30 00:01:00
日本のサラリーマンの賃金構造を調べるために、20才から30才の会社員40人を対象に調査を行なった。質問内容は次のとおりである。
基本給、性別、勤続年数、企業規模、学歴
そこで、基本給がどう決定されるかを見るために、回帰モデル、

を考える。ただし、各変数は次のとおりである。
WAGE: 基本給。単位は円。
SEX: 性別。男ならSEX=1、女ならSEX=0である。
CAREER: 勤続年数。
SMALL: 企業規模。中小企業ならSMALL=1、大企業ならSMALL=0である。
EUDC: 学歴。大卒ならEUDC=1、高卒ならEUDC=0である。
次の問いに答えよ。
(1) パラメータ ~ の値をデータより推定しなさい。
938132人目の素数さん:04/09/30 00:03:08
WAGESEXCAREERSMALLEDUC
215,7001411
242,1001611
253,7001711
162,9001011
185,5001211
135,5001010
292,50011110
・・・・・

エクセルでどうやら求めるようなんですが、
どうやったらでるんでしょうか?
自分で計算していたんですが、数字が合わなくなって挫折しました。
推定しろって書いてあったので、自分で計算じゃだめなようです。
939132人目の素数さん:04/09/30 00:07:50
あ、大事なところがでてませんでした。
回帰モデル
WAGE=B0+B1×SEX+B2×CAREER+B3×SMALL+B4×EDUC

WAGE   SEX   CAREER  SMALL   EDUC
215,700 1    4     1    1
242,100 1    6     1    1
253,700 1    7     1    1
162,900 1    0    1    1
185,500 1    2    1     1
135,500 1    0    1     0
940132人目の素数さん:04/09/30 11:18:06
宿題は自分でやりましょう
941132人目の素数さん:04/09/30 12:19:03
分析ツールの回帰分析でやればいいじゃん
942132人目の素数さん:04/09/30 12:22:40
ツール→分析ツール→回帰分析

「入力Y範囲」にwageのデータ
「入力X範囲」に説明変数のデータ →OK
943132人目の素数さん:04/09/30 23:36:36
>>942
そんなツールがあったんですか・・
どうやってやるかわからず、
今日締め切りだったのであきらめますたorz
944132人目の素数さん:04/10/01 01:05:31
まずググれよ・・・
945132人目の素数さん:04/10/01 02:36:55
たまに25,75パーセンタイル値に利用される
Tukeyのヒンジについて訊きたいのですが、

イメージ的には、
・中央値と最小値の「中間の順位の値」が
Tukeyのヒンジによる25パーセント点
・中央値と最大値の「中間の順位の値」が
Tukeyのヒンジによる75パーセント点という感じでしょうか?

だれかノンパラ統計量に詳しい人の解説キボン。
946132人目の素数さん:04/10/01 17:27:30
N面体のサイコロがあって、それを最大K回投げる。
1の目が出たら、S回投げる回数から減算する。
投げれなくなったら終了する。
1の目がx回でる確率f(x)を求めよ。
という問題なのですが、
N=300 K=3000 S=100で1万回シミュレート実験はしてみたのですが、
実際にf(x)はどのような式になるのでしょうか?
近似できる分布はないでしょうか?
ご指導お願いいたします。
947132人目の素数さん:04/10/01 22:16:51
>>946
問題設定がよくわからないのだが。
N,K,Sは固定だよね。
とりあえずN面体のサイコロ投げて、1が出たら何か減らすのはわかった。

Kは終了条件で、
サイコロの目が1出るたびにマイナスSしていって、
現在の試行数(仮にt)がt>Ktのときに終了するってこと?
(Ktは試行数tのときの終了回数)
948132人目の素数さん:04/10/02 06:17:44
>>946
分布は難しいな…。
とりあえず、S=1のときの1が出る回数の期待値は、
(1/(N+1)^2)(1-(-1/N)^K)+K/(N+1)
となった。
949132人目の素数さん:04/10/03 22:00:23
ブルー・バックスに豊田秀樹なる人物が何冊か書いてるが、どうなの?
偶然開いたページに「連続だから微分可能」とあって、のけぞったんだが。
950132人目の素数さん:04/10/03 22:42:04
951132人目の素数さん:04/10/04 08:17:13
豊田秀樹は早稲田の文学部の先生
心理学の視点からマーケティングのデータ分析とかしているような希ガス
952132人目の素数さん:04/10/05 22:13:10
分散分析と等分散の検定ってどう違うの?
いま、2つの群のバラツキが異なると言えるかどうか調べたいんだけど、どちらの検定方法を使えばいいのか教えてください。
953132人目の素数さん:04/10/05 22:27:11
>>952
2つの群のばらつきが異なるかどうかは、等分散の検定(F検定)で調べられます。
分散分析は2つ以上の群の平均値が同じであるかどうかを調べる検定です。
954132人目の素数さん:04/10/05 22:31:25
>>953
平均値が同じかどうか調べるのにt検定ってありますよね。
分散分析は、言葉どおり「分散」=「ばらつき」も調べるってことでは、ないのでしょうか?
955132人目の素数さん:04/10/05 22:43:36
>>954
t検定は2群の平均値が同じかどうかを調べる検定です。
もしもt検定が両側検定だったら、2群の場合の分散分析と同じ結果(p値)をはじき出します。
確か、t統計量の2乗が分散分析のF統計量になたはず。
因みに、2群以上のばらつきが同じかどうかを調べる検定にはバートレットの検定というものがあります。
956132人目の素数さん:04/10/05 22:46:04
自己レスです。

> t検定は2群の平均値が同じかどうかを調べる検定です。
すみません、これはもうご存知ですね。
957132人目の素数さん:04/10/05 22:52:57
>>955
なるほど、t検定と分散分析の関係、よくわかりました。ありがとうございます。
どうも、「分散」分析ということばに惑わされていたみたいです。
958132人目の素数さん:04/10/05 23:11:01
>>957
統計学ではまぎらわしい名前が多いようです。
共分散分析はべつに共分散を分析しているわけでもないし、
共分散構造分析なんていう似たようなものもあるし。
959132人目の素数さん:04/10/08 12:09:36
言語学の研究と統計に関して、質問があります。
どなたかわかる方、教えてください。

たとえば、現在の若者を対象にして、
ある状況ごとに、若者言葉「XX]を使用するかしないかを質問し、
状況ごとの有為差の有無を見たい場合って、
統計は、パラメトリックなのでしょうか?
それとも、ノンパラメトリックでしょうか?

言語使用の場合、文法ルールや、社会的習慣(社会言語学的ルール)
などによって、ある程度、規制されると思うので、
はたして、正規分布を前提に考えていいものかどうか
迷ってしまいます。
はたして、文法に規制される言語使用は、
歪度や尖度に特徴のある正規分布と考えていいのでしょうか?
960132人目の素数さん:04/10/08 21:54:35
>>959
まず、考えられる一番単純な解析方法は「言語使用の有無」と、2水準の「状況」を用いた
カイ2乗検定。カイ2乗検定がパラメトリックか、ノンパラメトリックかは、あまり聞いたことがありません。
これはパラメトリックかな?分布には、「標準正規分布に従う確率変数」を2乗した変数の分布(カイ2乗分布)が使われています。
そして、「社会的習慣」が言語使用に影響を与えていると考えられる場合には、、色々と考えられるのですが、
「社会的習慣」を共変量としたロジスティック回帰分析。もう一つ挙げるとすると、
(こっちのほうが理論的にはきれいかな?)「社会的習慣」を変量効果とした、ロジスティック変量効果モデル。
961959:04/10/09 01:04:11
>960

早速のお返事をどうもありがとうございました。
自力で、統計を勉強しているので、大変助かります。

カイ二乗は、使ったことがあるので、何とかなりそうです。
ロジスティック回帰分析 & ロジスティック変量効果モデルは、
正直言って、何のことだかさっぱりわからないので、統計の本を読んで、
頑張って勉強します。

あと、すみません、もう少しお伺いしたいことがあるのですが、
実は、言語使用状況が3つあるのですが、カイ二乗を
3回繰り返す形でも大丈夫でしょうか? 
ちなみに、データは対応のある形です。


962959:04/10/09 01:11:00
連続の質問で、すみません。
できれば、もう一つお伺いしたいことがあります。

言語使用の有無と、その言語を使用した場合のイメージ
を関連付けたい場合は、どのような手法がいいのでしょうか?
具体的には、XXという若者言葉を使うか否かを質問し、
同時に、その言葉を使った場合のイメージも聞いて、
言語を使用する子はどういうイメージで話し、
使わない子は、その言葉にどういうイメージを持っているかというのを
調べたいのです。
どの統計手法が適切なのか、ご享受いただけると、
大変ありがたいです。
963132人目の素数さん:04/10/09 01:27:37
>>959
ちょっと違うかもしれないけど、
chaidという手法を調べてみてはどうでしょう。
964132人目の素数さん:04/10/09 02:30:53
>>961
帰無仮説の設定によってはカイ二乗検定を3回繰り返すという方法も考えられると思います。
ですが、もしもそれらの検定の内、「1回でも有意ならば有意」とするのでしたら「検定の多重性」という問題が起きてきます。
959さんは次のどちらを主張したいですか?それによって検定手法は変わってきます。
1.「状況Aと状況B、状況Cにおける言葉の使用率」は、「全て同じ使用率」ではない。
2.「状況AとB」、「BとC」、「CとA」の内、いずれかの使用率が異なる。

>>962
それぞれの状況において、イメージAは○%、イメージBは×%、イメージCは△%と考えていく方法が考えられます。

>>963
その方法は、それぞれの状況での割合を把握するときには使えると思いますが、検定は行っていませんね。
965959 (961& 962):04/10/09 15:40:49
> 963
早速のレスをいただき、どうもありがとうございました。 
chaidですね。検定をするかどうかは、まだ決めていませんので、
(データと、私の理解力次第になると思いますが、)
勉強してみます。
966959 (961& 962):04/10/09 15:41:39
> 964

早速、レスをいただき、どうもありがとうございました。
主張したいのは、2.の各2水準間での検定です。
(全ての言語使用状況間において有意差がでなくてもいいので。。)
ということは、カイ二乗を3回繰り返しても大丈夫ということですよね。

それから、言語使用の有無とイメージの関係の分析を
難しく考えていたので、コレスポンド分析など
使ったこともない手法が必要なのかと思っていたのですが、
おかげさまで、すっきり&安心しました。

いろいろとご享受いただき、
大変助かりました。
どうもありがとうございました。
967132人目の素数さん:04/10/09 16:22:15
>>951
ふーん。使い方はともかく細部は信用しない方が良さそう。
968964:04/10/09 16:48:51
>>966
もしもカイ二乗検定を3回繰り返すのでしたら964にも書いた、「検定の多重性」という問題が起こってきます。
帰無仮説(A)、(B)、(C)の内、一つでも有意ならば有意とするとなると、実際にはあらかじめ決めた有意水準よりも大きい値で検定を行っていることになってしまいます。
つまり、有意ではないのに有意だといってしまう可能性が出てくるのです。
これを防ぐために色々な方法が考えられます。一番単純な方法は「ボンフェローニの調整」。
それぞれの検定から出てきたP値をそれぞれ3倍して、それから有意水準で検定を行うという方法です。
でも、この「ボンフェローニの調整」は検定の数が多くなればなるほど有意であるのに有意ではないといってしまう傾向があるので注意が必要です。
今回のように検定の数が3つぐらいだったら使用に耐えうるでしょう。
969132人目の素数さん:04/10/09 17:23:07
統計は解析くらいの知識しか使ってないのにマジ難しいと思う。
数学的にある程度わかっても調査とか経験しないとよくは
わからない模様。
970132人目の素数さん:04/10/09 20:47:58
3群の比較を3回の対比較で行うなら、各々の検定の有意水準は
全体の有意水準の1/2にしてもよい(1/3にする必要は無い)、はず。
971132人目の素数さん:04/10/10 04:07:37
>>970
それは多重比較の何と言う手法ですか?
972132人目の素数さん
>>971
たしか、Holm の方法。