1 :
◆OHr6mNLYV6 :
03/11/08 19:44
数学教えろ!!ひきこもりのくせに、
中学3年生の翔太が
>>2 をゲットしちゃいます
>>3 二次方程式ってめっさむずいよね。おしえてよ、ねぇおしえてよ
>>4 えーいいなーー おれ理科も出来ないんだよね
>>5 まじ数学できんのよ、理系いきたいんだけど おれ、国語はけっこーできるよ!!!!
>>6 あ、おれスカトロならいっぱいもってるよー。 すきなら交換しよ
>>7 いふ あいきゃん せっくす のはなしをしてるの いや、文法ちがうとかいわないでまじ、英語にがてだし
>>8 かてーきょーしのお姉さんと頑張って東大か 京大の 文系にいこーっと
>>9 あーーきも あーーきも あーきも あーきも あーきも あーきも もぃくぃ
>>10−1000 ひ き こ も り の く せ に
3 :
132人目の素数さん :03/11/11 18:38
データxが平均60,標準偏差5の正規分布に従うとする。 (1)65≦x≦72となる確率を求めよ。 (2)10個のサンプルの平均が57未満となる確率を求めよ。 文系にできるかー・゚・(ノД`)・゚・ウワァァン おねがいします。。。
4 :
132人目の素数さん :03/11/11 18:53
>>3 まず標準化。
z=(x-60)/5
で変数変換すると、zはN(0,1)に従う。
5 :
132人目の素数さん :03/11/11 18:59
F(x) は次の条件を満たすとする. 1.単調非増加関数. 2.右連続. 3.F(-∞)=1,F(∞)=0 このとき,任意のa∈(0,1)に対して,F(c)≦a≦F(c-0)となる実数cが存在する. という命題を証明しようと思ってます. c=inf{x:F(x)≦a} とおけば証明できると思い,F(c)≦aまで示すことができました. しかし,a≦F(c-0)の証明がうまくいきません. 正しいということはイメージで沸くのですが・・・. どなたか解決して頂けると助かります. ちなみにこの命題はネイマン=ピアソンの基本補題の証明中に使っています.
>>5 >c=inf{x:F(x)≦a}
supじゃないの?
7 :
132人目の素数さん :03/11/11 20:32
supではsup{x:F(x)≦a}=0となるであまり意味がありません. ちなみに単調非増加とは x<yならばF(x)≧F(y) となることをいいます.
まちがえました. 忘れてください.
やば!まちがえた. ちょっとまってください
まちがえました.
ホントですね. supならば証明できそうです. 連続投稿すいません.
sup型力士
といったものの・・・. なんだかこんがらがってきた. sup{x∈R:F(x)≦a}って存在するの? {x∈R:F(x)≦a}は上に有界じゃないし.(F(∞)=0より) 下には,有界だと思うけど. ちなみに下に有界の証明は, c ∈{x∈R:F(x)>a}をひとつ固定する. b ∈{x∈R:F(x)≦a}を任意にとるとき, F(c)>a≧F(b) より,c ≦b だから下に有界. やっぱりinfで証明すると思うんですけど. F(x)は分布関数ではないんですよね. 単調非増加関数なので.
15 :
132人目の素数さん :03/11/11 21:31
>>14 そんなのどっちでもいいんじゃ?
c=inf{x:F(x)≦a} とおいたんなら、a<F(c-ε)だから、ε→0とすればa≦limF(c-ε)=F(c-0)
16 :
132人目の素数さん :03/11/11 21:48
>>15 さんの言う通りでした.
どっちでも良さそうです.
任意の自然数nに対してa<F(c-(1/n)).
(なぜなら,ある自然数が存在してa≧F(c-(1/n))と仮定すると,
c-(1/n)∈{x:F(x)≦a}
となる.ゆえに,
c=inf{x:F(x)≦a} ≦c-(1/n)
これは,矛盾.)
以上より,a ≦lim F(c-(1/n))=F(c-0)
なるほど.
>>15 ありがとうございました.
また,一緒に考えてくれた
>>6 さん
>>14 さん>>sup型力士さんもありがとうございました.
>>sup型力士さんもありがとうございました ワロタ
ぶっちゃけ、
>>4 サマだけだと答えがわからないのです・・・すみません、答えまでご教授くださいましぃ〜m(_ _)m
19 :
132人目の素数さん :03/11/16 14:26
age
20 :
132人目の素数さん :03/11/16 14:52
21 :
132人目の素数さん :03/11/16 23:52
(1) Z=(X-60)/5 とおくと. P(65≦X≦72)=P(1≦Z≦2.4)=P(Z≦2.4)-P(Z<1)=P(Z≦2.4)-P(Z≦1) 後は数表を読め! (2) X1,…X10 i.i.d. N(60,5^2) とし,X'=(X1+…+X10)/10とおくと, X' は N(60,(5^2)/10)に従う. Z'=(X'-60)/(5√10)とおくと, P(X'<57)=P(Z<(57-60)/(5√10))=P(Z≦(57-60)/(5√10)) 後は数表嫁!
>>20 当方、経営学科一年です。
データ分析=統計学という枠組みの単位が与えられている授業を受けています。
度数分布表というやつを前期に習いましたが必死勉強した結果、穴埋め形式でやっとこさ解答は、出来るレベルです。。。
>>21 サマ、ありがとうございます
エクセルを使って解けと言われたんですが… 「2500個からなる無作為標本を考える。この標本は平均1,分散2であり, 正規分布ではない分布に従っている」 このとき,標本平均がxより小さくなる確率が0.025となるxを求めなさい。 という問題なんですが,最初の,平均1っていうのは 標本平均の平均という意味なんでしょうか?
ひょっとして母集団の平均が1で,分散が2という意味でしょうか? すると,標本平均を標準化すると,中心極限定理から, 平均1,分散2/2500 の正規分布になるんですか? 問題の文章の意味がいまいち把握できてないんです
一応の答えを出してみたんですが… 1.055 って出たんですが小さすぎるような気がします
ageないとやっぱり答えてもらいにくいですか…
27 :
132人目の素数さん :03/11/21 16:37
>>26 >>24 の考えで正しいと思う。
NORMSINV(0.025)=-1.95996 だから
標本平均がxより小さくなる確率が0.025となるxは
x=1-1.95996*√(2/2500)=0.94456
>>27 なるほど!
Zが(x+1)/√(2/2500)で,それがー1.95996になって
xに戻すと,0.94456になるということですね。
よくわかりました!ありがとうございます!
できればもう1つ…これはわからなければ飛ばしてもいいっていわれたんですが
「平均480,標準偏差320の分布から抽出して,
標本平均520になる確率が5%未満であるための標本の大きさを求めよ」
ってあったんですけど,
Z=(520−480)/(320/√n)=0.125√n より
NORMSINV(0.95)*8 したものを平方して
答え173.1547 となったんですが,あってるかどうか判定お願いできますか?
>>28 2行目は
(x+1) じゃなくて (x-1)の間違いです…
>>28 「標本平均がちょうど520になる」確率は0
「標本平均が520以上になる確率が5%未満になるための標本の大きさ」なら
それであってる。
>>30 ありがとうございます!
そこは自分も悩んでいるところなんです。
今また教科書を読み直しているところなんですが,
信頼区間というのを使うのかな,とも思ったんですが
それはまた違うのですか?
一様分布の偶数積率は1、奇数積率は0?
>>31 「信頼区間」は、母数が未知の場合に母数の推定に使う。
たとえば「母平均の95%信頼区間」とは、「母平均がその区間内の値であれば、標本
平均が実現値以上または以下になる確率が5%未満になる」ような区間。
確率変数である標本平均のひとつの実現値から、逆に定数パラメータである母平均を
確率的に推定する話なのがややこしい。
(「95%の確率で母平均は95%信頼区間の値を取る」と言ういい方はまずい。母平均は
確率変数ではないから。)
>>28 のように母平均がわかっている場合に標本平均の実現値の分布を調べるのは、単
なる普通の順序の確率推測で、「95%の確率で標本平均は440以上520以下の値をとる」
というだけのこと。(標本調査=試行はまだ行う前であることに注意)
最後の部分の数値訂正。
>>28 の例だと「95%の確率で標本平均は520以下の値を取る」あるいは「90%の確率で
標本平均は440以上520以下の値を取る」ですな
昨日なぜか書き込めなくて返事&お礼が遅れましてすみません
>>33-34 わかりやすい説明本当にありがとうございました!
もう一度教科書の方も読んできっちり理解しなおそうと思います
>>32 確率変数の範囲が a ≦ x ≦ b の連続一様分布の平均まわりのr次
積率は、rが奇数なら 0, 偶数なら ((b - a)/2)^r / (r + 1).
原点まわりなら、(b^(r+1) - a^(r+1))/((b - a)(r + 1)).
待ち行列モデルの問題集を教えて下さい。 お願いします。
38 :
132人目の素数さん :03/11/25 12:57
あげ
39 :
132人目の素数さん :03/11/25 13:04
ドラえもん。なんで、あの半島は嫌われてるの \  ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄V ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ / ____ヽ /  ̄  ̄ \ | | /, −、, -、l /、 ヽ | _| -| ・|< || |ヘ |―-、 | , ―-、 (6 _ー っ-´、} q -´ 二 ヽ | | -⊂) \ ヽ_  ̄ ̄ノノ ノ_/ー | | | ̄ ̄|/ (_ ∧ ̄ / 、 \ \ | / ヽ ` ,.|  ̄ | | O===== | `− ´ | | _| / | | (t ) / / | まず平気で他人のものをパックたり、 ウリナラ起源に捏造するからだよ。例えば テコンV、トンチャモン、パワモン、キティ ワンピース、ロンバケ(ドラマ)トリビアの泉、等その他多数 茶道、居合、日本刀、合気道、サムライ、相撲、 盆栽、弓道、寿司、等その他多数 次に人の歴史教科書にケチをつけておきながら 自分の国の歴史教科書や、言う事成す事、全てが捏造だらけなんだよ 他にも海の名前にケチをつけたり、日本の領土を占領したり 日本のマスコミやいろんな団体に不当な圧力をかけたり あげればキリがないね
素朴な質問です。 男女別で薬物の投与群・非投与群の計4群、各群4例ずつで統計解析を行いたいです。 用いる検定方法は何がいいですか? できるだけ検出力の高い奴がいいです、、、 宜しくお願いします。
42 :
132人目の素数さん :03/11/27 00:28
互いに独立な確率変数X,Yがともに一様分布U(0,1)に従うとき X+Yの密度関数をもとめよ 誰か助けてください
超初心者的質問で申し訳ないのですが、 アンケートをとろうと思っているのですが、統計学的には何人くらいとればいいのでしょうか? 例えば10人くらい調べて、3人が男、7人が女だとすると「人間の7割は女性である」というのは間違いですよね? 調べる人数が多ければ多いほど真値に向かって収束されていくと思うのですが、統計学的な最低ラインを教えて下さい お願いしますm(__)m
44 :
132人目の素数さん :03/11/30 15:24
age
質問させてください。 まったくの初学者が統計学を勉強するときに、最適な参考書を教えてください。
>>45 統計の初心者なのか
数学の初心者なのか
高校数学くらいはできるのか
初心者のうちは書店に並んでるやつを眺めて買うのが一番いいと思う。
すいません。肝心なことを書き忘れていました。 高校数学くらいはなんとか出来ます。 お願いします。
50 :
132人目の素数さん :03/12/03 01:33
>43 1人 だって100ぱーになんじゃん
51 :
132人目の素数さん :03/12/05 01:18
(順位A) (順位B) 9 9 3 3 12 11.5 5 6 8 10 14 13 1 1 7 5 6 4 11 11.5 4 7 2 2 15 15 13 14 10 8 見づらくてすいません。A,Bのスピアマンの順位相関係数を 求める手順(具体式)を教えていただけませんでしょうか? おそらく0.949あたりになるはずなのですが、何回やっても0.976・・・
52 :
132人目の素数さん :03/12/05 01:26
私がやったのは
ttp://aoki2.si.gunma-u.ac.jp/lecture/Soukan/spearman.html の「同順位がある場合」を参考にしまして、
SUMPRODUCT(A,B) = 28.5
Ta=(15^3-15) / 12 =280
Tb={ (15^3-15) - (11.5^3-11.5) } / 12 = 154.2188
から
(280+154.2188-28.5) / 2 / SQRT(280*154.2188) = 0.976219
となってしまうのです。
CORREL(A,B)だと0.949062041になるのですが、どこが間違ってるのでしょうか?
>>51-52 入れる公式。青木先生のところにちゃんと公式が書いて
あるから、確認してみよう。
1 - 6 * 28.5 / (15^3 - 15) = 0.949... でしょ。
ごめん、寝惚けてた。 公式は、 r_s = (Σx^2 + Σy^2 - Σd^2) / (2√(Σx^2y^2)) か r_s = ((n^3 - n) - 6Σd^2 - (T_x + T_y) / 2) / √((n^3 - n)^2 - (T_x + T_y)(n^3 - n) + T_xT_y) だった。ノンパラ久しぶりだから…。
ごめん、完全に寝惚けてる。 上の公式は、 r_s = (Σx^2 + Σy^2 - Σd^2) / (2√(Σx^2Σy^2)) 下の公式は多分、大丈夫だけど、まぎらわしいから S_x = Σ(t_i^3 - t_i) (t_i はタイの数) と書き直そう。 r_s = ((n^3 - n) - 6Σd^2 - (S_x + S_y) / 2) / √((n^3 - n)^2 - (S_x + S_y)(n^3 - n) + S_xS_y) 君のは、下の式の別ヴァージョンだけど T_x = (n^3 - n) - S_x を使ってるようだから、 Σd^2 の係数が落ちていると思う。
>>53-55 ありがとうございます。
教えて下さった式に値を放り込んでみたのですが、
どうしても0.9490・・・になりません(T_T)
たぶん私が根本的なところで間違ってる(代入間違い?)のだと思うのですが、
よろしければ
>>51 から計算した具体的な数字を入れた式を書いていただけませんでしょうか。
これは学校で出た問題なのですが、青木先生の所の式を使うように
言われてしまっていて、つらいです・・・
すいません、試行錯誤してるうちに解けてしまったようです(?)
>>51 のデータだと、
同順位は11位だけだからn_x=1
で、11位は2個あるからT1=2
っていうことでいいんでしょうか・・・数字はあったのでこういう事かしら(?_?
58 :
132人目の素数さん :03/12/08 20:16
ある集団の比率を求めるのに必要な最低限の人数は? …って問題なんですが、是非解説をお願いします じぇんじぇん分かりません…
↑ 正確には、ある制度の比率を推定するのに必要な最低人数を求めよ です 誰か分かる方いらっしゃいませんか???
60 :
132人目の素数さん :03/12/11 01:32
>>59 有意水準が与えられないと求められません。
その問題解くには、二項分布とか中心極限定理とか知ってる必要があるけど
君、知ってるの?
と、遅レスしてみた。
61 :
132人目の素数さん :03/12/16 22:51
下がりすぎ
62 :
132人目の素数さん :03/12/18 19:55
標本抽出の偏向を修正する方法・技術について説明しているお勧めの書籍などありましたら教えてください。
麻雀でじぶんの実力をはかるために平均順位というものがあります。 麻雀は4人でやりますので、1位、2位、3位、4位をとる可能性があります。 少ない試合数だと実力を測定するには偏りがあると思うのですが、何試合うてばまず誤差のない自分の平均順位を知ることができるのでしょうか? 数学でこれを求めることはできるのでしょうか?
65 :
132人目の素数さん :03/12/28 16:06
無限区間で一様分布は定義できないんですか? また、そういう試みって無いんでしょうか? 無限倍したら1になる数、っていうのを 作ったらなんとかできそうな気がしますが。
66 :
132人目の素数さん :03/12/28 20:08
>>64 1着から4着までをとる確率をp1,p2,p3,p4(p1+p2+p3+p4=1)とする。
今n回麻雀をやって、各着順の実現値がn1,n2,n3,n4(n1+n2+n3+n4=n)とすると、
平均着順の推定値は、(n1+2*n2+3*n3+4*n4)/n
これの分散を求めて正規近似して条件を求めればいいよ。
平均は p1+2*p2+3*p3+4*p4。分散はちょっとややこしいな。
(p1*(1-p1)+4*p2*(1-p2)+9*p3*(1-p3)+16*p4*(1-p4)-2*(2*p1*p2+3*p1*p3+4*p1*p4+6*p2*p3+8*p2*p4+12*p3*p4))/n
かな?まちがってるかもしれんけど。
で、この分散をVとすると、たとえば確率99%で誤差が上下0.1以内、とかなら、
2.58*V^0.5<=0.1なんで、
n>665.64×(上の分散の分子)になる。
2.58が正規分布の0.005%点。有意水準を変えたきゃここを変えればいい。
p1〜p4はわからんから、p1+p2+p3+p4=1、各pi>=0の条件の下での(上の分散の分子)の最大値を求めて、これを
mとでもすれば、
n>665.64×mが答えになる。
>>65 一様の意味を、同じ長さの区間内の値を取る確率はすべて等しい、という
普通の意味で考えると無理だね、やっぱり。確率の定義を根本から変える
必要があるし、そんなのが仮にできても現在の測度論は使えないし、意味
のあるものにはならないんじゃないかな。
>>66 詳細なレスありがとうございます
私確率についていまいちわかっていないので、レスについてじっくり考えさせていただきます。
質問があるのですが、n回麻雀をやって各着順の実現値がn1,n2,n3,n4(n1+n2+n3+n4=n)とあります。
この実際のデータがなければ、誤差は求めることは出来ないのでしょうか?
また正規分布ではなくて、2項分布を使うことは可能なのでしょうか?
>>67 いや、実現値って書いちゃったけど、n1,n2,n3,n4は確率変数と見て条件は出してるよ。
最後のnの条件にはn1,n2,n3,n4がいくらかって条件は使ってないでしょ。
実際のデータは実際に自分の着順の平均の推定値を求めるのには当然必要。
あと、2項分布じゃなくて正確にはこれは多項分布。だから分散の形が複雑になってる。
そのまま多項分布としてみても条件は出せるかもしれないけど、普通は回数多くなると
正規近似してしまう。2項分布の場合ですら計算が非常にめんどくさいから。
あと、誤差を求める、ってのはあんまり言い方が正しくない。あくまで確率・統計の世界
だから、誤差が〜以内になる確率が〜%以下になる、という言い方をする。
標準正規分布から無作為に5個の標本Z1,・・・,Z5を抽出するとき((Z1+Z5)^2)/2の分布はどんな分布に従うか という問題が分かりません 感覚的にはカイ二乗分布だと思うのですが・・・
70 :
132人目の素数さん :03/12/31 05:29
良スレage
>>69 自由度1のカイ二乗分布であってるよ。
Z1+Z5がN(0,2)に従う→(Z1+Z5)/√2がN(0,1)に従う→((Z1+Z5)/√2))^2はχ^2(1)に従う
という具合。
73 :
132人目の素数さん :04/01/06 23:26
「仮説検定とは何か」についてレポートを出されて、今仮説検定を勉強しています。有意水準は0.1、0.05、0.01などの値に事前に定めると教科書には書いてありますが、1%と10%では全然ちがうものだと思うのですが、どのように有意水準を決めるべきでしょうか?
有意水準っていうのは、仮説が正しいけど間違った決定をする(第1種の過誤)確率。 だから小さい方がいいに決まっている。 だけど、間違い方にはもうひとつあって、仮説が間違ってるけど、正しいと決定してしまう場合(第2種の過誤)もあって、 これは同じ標本数なら有意水準が小さいほどその確率が大きくなってしまう。 だから、第1種の過誤、第2種の過誤のどちらの確率を小さくしたいか、とり得る標本数はどの程度か等を総合的に判断して 有意水準を決定するのが望ましい。 でも一般には教科書に書いてあるとおり、有意水準を1%か5%にすることが多い。
75 :
132人目の素数さん :04/01/07 01:31
統計初心者です わからないので教えてください!!!! Zが標準分布に従うときE〔Z^k〕(k=1.2.3・・・)を求めよ
76 :
132人目の素数さん :04/01/07 01:44
>>75 標準分布というのは
標準正規分布のことかな?
f(Z)を確率分布として
期待値の定義から
E[Z^k]=∫Z^k f(Z)dZ
77 :
132人目の素数さん :04/01/07 01:50
76さん本当にありがとうございました^0^ わかりました!!!!
78 :
132人目の素数さん :04/01/07 01:59
XとYは独立でE〔X^2〕<∞、E〔Y^〕<∞とする。 このとき VAR〔aX+bY〕=a^2VAR〔X〕+b^2VAR〔Y〕 ってどうやるの?
79 :
132人目の素数さん :04/01/07 02:02
plimについてよくわからないのですが、 試行回数n、成功確率pの確率分布があるとき、 成功した回数Xについて、 plim[n→∞](X/n)=p は正しくて、 plim[n→∞](X-np)=0 は正しくないというのを説明せよという問題を出されたのですが、 plimの定義の式で、 plim[n→∞]Xバー=μ とあったので、 plimというのは期待値に収束するのだと思い、 E(X)=npより、 E(X/n)=p E(X-np)=0となるからどちらも正しいのではと思ったのですが、 どこが間違っているのでしょうか?
81 :
132人目の素数さん :04/01/07 02:11
>>80 plimを普通のlimと同じだと思っている時点で間違い
>plimの定義の式で、
>plim[n→∞]Xバー=μ とあったので
何をこのように書くと定義されているのか?
その元の命題を無視して
表現だけをみて期待値に収束だのなんだのいうのが間違い。
X=σZ+μとおく。ただしZは標準正規分布に従い−∞<μ<∞、σ>0のとき cov(X,X^2) VAR(x^2)を求めよ をすいませんが教えてください。
83 :
132人目の素数さん :04/01/07 02:16
>>80 ∀ε>0,
lim P(|X~(n) -μ|<ε) =1 (n→∞)
に
X~(n) =X/n
μ=p
X~(n) =X-np
μ=0
をそれぞれいれたら明らか。
84 :
132人目の素数さん :04/01/07 02:20
これ以外何もかいてないんです。。 すいません、お手数おかけして、、
>>82 定義どおり計算してみな。
Cov(X,Y)=E(XY)-E(X)E(Y)
Var(X)=E(X^2)-(E(X))^2
ごめんなさい、ありがとうございます 詳しい計算方法を教えていただけますと 本当に嬉しいのですが!!!! すいません。。
何故自分の手を動かそうとしないんだ
Φ(x)を標準正規分布の分布関数とする。 すなわち Φ(x)=∫xから−∞ (1/√2π)e^-t^/2dtである。ただしxは実数。 このときG(x)=Φ(ax)は正規分布N(0.1/a^2) の分布関数となることを示せ。a>0 の解法おしえてくれませんか?
すいません、ご親切にありがとうございます 統計全くやったことなくて 今日だされた課題に困っていまして。。、
ご面倒じゃなかったらやり方少しでよいのでお願いします
>>81 >>83 のlim P(|X~(n) -μ|<ε) =1 (n→∞)
という式は書いてあったのですが、
実際これを問題でどう使っていいのかわからず、
plimの見た感じの意味で解こうとしていました。
>>83 解説どうもありがとうございます。
plimの定義の式の使い方がわかりました。
それに代入すると明らかというのが
今考えていてまだ少しわからないのですが、
もう少し考えてみます。
>>92 Zの確率密度関数はf(t)=1/√(2π)exp(-t^2/2)なんだから
E(X・X^2)=∫[-∞,∞](σt+μ)・(σt+μ)^2f(t)dt
E(X)=∫[-∞,∞](σt+μ)f(t)dt
E(X^2)=∫[-∞,∞](σt+μ)^2f(t)dt
などを計算すればいいのでは?積分域を[0,∞)と(-∞,0]にわけてそれぞれの領域で
t=+√(2u)、t=-√(2u)などと変換すればΓ関数の値をもとめる問題に帰着できるハズ。
やってないから自信ないけど。
んー 場合分けするってことですか?
標準正規分布については、 E(Z)=0,E(Z^2)=1,E(Z^3)=0,E(Z^4)=3 となる。3次、4次はモーメント母関数とかキュムラント母関数を知っていれば簡単に求まるし、 4次ぐらいまでは覚えていてもいいぐらい。 これから、 E(X)〜E(X^4)までも求まるよね? 例えば、 E(X^3)=E(σ^3*X^3+3μ*σ^2*X^2+3μ^2*σX+μ^3) =σ^3*E(X^3)+3μ*σ^2*E(X^2)+3μ^2*σ*E(X)+μ^3 =3μ*σ^2+μ^3 ってかんじ。もちろん、ZがN(μ,σ^2)に従うことからいきなり求めてもいい。 で、 Cov(X,X^2)=E(X^3)-E(X)E(X^2) Var(X^2)=E(X^4)-(E(X^2))^2 に代入すれば答えが出る。 前者が2μ*σ^2、後者が4μ^2*σ^2+2σ^4になると思う。
>>96 ZがN(μ,σ^2)に従うことから→XがN(μ,σ^2)に従うことから
の間違い
すっごい感謝です! 本当に本当にありがとうございました!!! 恩義を忘れません!
99 :
132人目の素数さん :04/01/07 03:05
Xは平均λのポアゾン分布 f(x|λ)λ^x*e^−λ/x! x=0.1.2.3... に従うとする。 λ>0は未知 このとき指数分布族に従うことを示せ また自然母数自然母数空間を明示せよ を詳しく教えてください 期末試験対策で勉強してますが よくわかってません。 上のかたがた同様初心者ですので できるだけ詳しく教えていただけると 助かります よろしくおねがいします
100 :
132人目の素数さん :04/01/07 03:41
>>75 標準正規分布の密度関数に関する式
(1/√(2π))∫[-∞,∞]e^(-z^2/2)dz=1 においてαを正数としてz=(√α)xと置換して
(1/√(2π))∫[-∞,∞]e^(-αx^2/2)dx=α^(-1/2) が成り立つ。
両辺をαでn回微分し、α=1を代入すると
(1/√(2π))∫[-∞,∞](-x^2/2)^n * e^(-x^2/2)dx=(-1/2)(-3/2)・・・{-(2n-1)/2}
(1/√(2π))∫[-∞,∞]x^(2n) * e^(-x^2/2)dx=(2n-1)!!
標準正規分布の密度関数は偶関数なのでkが奇数のときE[z^k]=0
よって E[z^k] = 0(kが奇数のとき) 、 (k-1)!! (kが偶数のとき)
>>99 なんか問題が変だけど、ポアソン分布が指数分布族の形になることを言えばいいんだったら
1/x!*exp(xlogλ-λ)
ってかけるから明らか。
自然母数空間は、expの中のxの係数を母数と見たとき、そいつが取る範囲。
(-∞,∞)でよいよ。
102 :
132人目の素数さん :04/01/07 03:55
>>100 本当にありがとうございました!
感激しました!!!!!
103 :
おしえてちゃん :04/01/07 04:14
X1、X2、X3・・・Xnをベルヌーイ分布 fθ(x|θ)=θ^x(1-θ)^1-x x=0.1 θ∈(0.1) からのランダム標本として X={X1、X2...Xn}とし S(X)=Σnからi=1とする S=sがあたえられたときXの条件付確立 P(X=x|S=s)がθに依存しないことを 示すことにより Sがθの十分統計量であることを確認せよ おしえてください! おねがいします
104 :
132人目の素数さん :04/01/07 05:15
>>74 ありがとうございます!何となくわかりました。
105 :
132人目の素数さん :04/01/07 12:12
すごく根本的な質問ですみませんが、仮説検定をすることで一体何がわかるのでしょうか?レポートの問題に出されたんですが、うまくまとめられません…
106 :
132人目の素数さん :04/01/07 12:29
107 :
132人目の素数さん :04/01/07 17:25
根本的な質問ですみませんが、仮説検定をすることで一体何がわかるのでしょうか?レポートの問題に出されたのですが、よくわかりません…
「指数分布の原点周りの3次積率と平均値周りの3次積率を求めよ」という問題なのですが、 原点周りのやり方はどうにかできるのですが、平均値周りの積率が上手く求められません。 よろしくお願いします・・
>>103 問題を修正
> X1、X2、X3・・・Xnがベルヌーイ分布
> fθ(x|θ)=θ^x(1-θ)^1-x
> x=0, 1
> θ∈(0, 1)
> に従う独立な確率変数とする。
> Y={X1、X2...Xn}とし
> S(Y)=ΣXi(i=1 to n)とする
> S=sがあたえられたときYの条件付確率
> P(Y=y|S=s)がθに依存しないことを示すことにより
> Sがθの十分統計量であることを確認せよ
位にしておかないとNotationが混乱しててよくわかりません。
>>107 仮説を検定することができます。
検定結果を見て意思決定等を行います。
統計のエロイ人がいるみたいだ。勉強なるな。
112 :
132人目の素数さん :04/01/08 01:09
こんなん聞いてもいいんですかね・・・ 分散(Sx^2)というものがありますよね。 あれは、平均偏差を2乗した総和を平均して求めるのですが、 なぜ2乗するのかについては、本によると符号を統一するため、 とあります。 しかし、符号を統一するなら絶対値を取ればいいじゃないかと 思うのですが、なぜわざわざ2乗するんでしょうか。そのあと ルートに放り込んで標準偏差を出すなら最初から平均偏差の 絶対値を取って、それらを平均した数値を標準偏差とすれば 簡単な気がするのですが。 共分散を求めるときに変数X、Yの平均偏差を掛け合わせますが、 それと合わせるためなのでしょうか。
>>112 絶対偏差の概念もないわけではないですし、時々使われます。ただ、
∫|x|dxと∫x^2dxなら、どちらが数学的に扱いやすいか、というと断然後者です。
もし、あなたが、「標準」として∫|x|dxか√∫x^2dxのどちらかに決めなければいけない
としたら当然後者にしますよね?
しない、というのなら基礎から積分なりを勉強しなおすべきです。
絶対値の平均よりは2乗の平均の方が断然(数学的には)簡単かつ応用が利くものなのです。
絶対偏差の平均より2乗の平均の方がよく使われるのは数学的な有用度故と思っていただいて
かまいません。
よくわかりました。後者の方が明らかに平易で扱いやすいですね。 結局、標準偏差を単独でポンと求める程度の段階では有用性は あまりわからないが、もっと深い部分まで勉強していき複雑な数式を 駆使する段になると有用性が分かってくるのかもしれません。
>>114 その通り。共分散との整合性もその一例です。
116 :
132人目の素数さん :04/01/08 02:05
ごめんなさい統計の途中の 決定係数が上昇するとt値の絶対値も上昇するという 証明にでてくるのですが 0<(A^2/B)<(C^2/D)<1 ならば |(A/B)|<|(C/D)| ということはいえるのでしょうか?
117 :
質問をかえます。 :04/01/08 02:17
単純回帰分析でX値を変化させて 決定係数をあげたとき かならず回帰係数のスチューデントのt値の絶対値は前回と比べて おおきくなるのでしょうか?
なるなり。 回帰係数を固定して、xの変動幅を大きくすると回帰係数の標準誤差が小さくなるので(x^2が分母にくるから)、回帰係数をその標準誤差で割ることによって作られるt統計量はかならず大きくなるなり。
119 :
カイ2乗検定 :04/01/08 15:46
カイ2乗検定についてお訊ねします。いわゆる多項分布の検定(与えられた観測個数 がある比率に従っているかどうか)の場合に、 χ^2=Σ(観測個数-期待値)^2/期待値 が公式として本に載っているのですが、自分としては何故期待値で割るのかが納得 できません。カイ2乗分布の定義からすると、例えば2項分布の時はサンプル数が十 分に大きいとき(np,np(1-p))の正規分布に近似できるので、 χ^2=Σ(観測個数-np(=期待値))^2/np(1-p) ではないかと思うのです。先ほどの式と比べると分母部分が明らかに違います。 公式の証明をネット上で探したのですが、高度な数学知識が要求されるのでここで は証明をとばす、という表現があったりして、なかなか見つかりません。 初歩的な質問かも知れませんが、どなたか分かる方がいらっしゃいましたら、よろ しくお願いします。
>>119 ほかに詳しい人がカキコしてくれるかもしれませんが、
手元にある統計の本を見てみたら、
・「確率・統計入門」小針あき宏著 岩波書店
・「確率・統計」篠原昌彦著 朝倉書店
に書いてありました。小針の本から引用すると、次のようになります。
p.191命題7.11
母集団Eが、互いに共通部分のないn個のグループE_iから構成されており、
ランダムに選んだ一つの個体がE_iに属する確率がp_iであるとする。
いまその手段からランダムにN個の個体を選び、そのうちE_iに属するものが
x_i個であったとすると、Nが十分大きいとき
χ^2=Σ[i=1,n] (x_i-p_iN)^2/p_iN
は自由度がn-1のχ^2分布に従う。
証明は5ページにわたっていて難解ですが、丁寧に書いてあるので
一度目を通してはどうでしょうか。
121 :
カイ2乗検定 :04/01/08 19:30
>>120 ご返答ありがとうございます!今度探して読んでみます。しかし、証明に5ペ
ージ!やはり難解な証明だったんですね。それにしても、
χ^2=Σ(xi-p_iN)^2/p_iN
がカイ2乗分布に従うのは分かったのですが、前述の
χ^2=Σ(xi-p_iN)^2/p_iN(1-p_i)
もカイ2乗分布にしたがうような気がします。でも値は違うし、数学的な意味
の違いは何なんですかね?上の方は適合度をみるわけだから、期待値からのず
れを表しているというのは何となく分かるのですが...。
最近統計学の基礎を勉強し直し始めたのですが、統計学ってごく基礎的なこと
でも深く考えると、意味がイメージできなかったり、証明ができなかったりし
て奥が深いですね。使うだけなら、プログラムや例題に当てはめるだけでもで
きるんでしょうけど。もっと勉強せねば。
>>121 たとえば、n=2の時で、E1の確率がp、E2の確率がqとして、N回試行したときのそれぞれの回数がX1回、X2回とすれば、
(X1-Np)^2/(Npq)=(X2-Nq)^2/(Npq) (p+q=1、X1+X2=Nより)
は、自由度1のχ^2分布に(近似的に)したがうよ。でも当然足すとダメ。
(X1-Np)^2/Np+(X2-Nq)^2/Nqを上の関係式(p+q=1、X1+X2=N)に注意して計算したら、(X1-Np)^2/(Npq)になることは
すぐわかると思う。
これを一般のnに拡張したと思えばいい。っていってもそう簡単ではないが…。
123 :
おしえてちゃん :04/01/08 22:58
X1、X2、X3・・・Xnがベルヌーイ分布 fθ(x|θ)=θ^x(1-θ)^1-x x=0, 1 θ∈(0, 1) に従う独立な確率変数とする。 Y={X1、X2...Xn}とし S(Y)=ΣXi(i=1 to n)とする S=sがあたえられたときYの条件付確率 P(Y=y|S=s)がθに依存しないことを示すことにより Sがθの十分統計量であることを確認せよ 何度もごめんなさい 教えてください・・・・・!!!
>>123 y=(y1,y2,…yn)とすると、
P(S=s)=nCsθ^s*(1-θ)^(n-s) (足してsってことはX1,…,Xnのどれかn個がs)
P(Y=y,S=s)=θ^s*(1-θ)^(n-s) (y1+…+yn=sのとき)
=0 (その他)
よって、
P(Y=y|S=s)=1/nCs (y1+…+yn=sのとき)
=0 (その他)
だから、これはθに依存しないんで、Sはθの十分統計量といえる。
例えばn=3で、合計が2になる確率は3θ^2*(1-θ)
で、これを別々に分解しても、(1,1,0),(1,0,1),(0,1,1)それぞれをとる確率はθ^2*(1-θ)。
形が定数倍の差だけだから、合計が2である確率が分かってしまえば、個々の確率もわかってしまう。
これが、合計2だけじゃなくどんな状況でも起こるから、合計が分かってしまえば、それ以上どんな
に細かいことがわかってもθについて新しい情報は得られない、ってことになる。
これがθについて十分だ、充足だ、っていう意味。
125 :
カイ2乗検定 :04/01/09 00:42
>>122 おお、なるほど!Σ(xi-p_i*N)^2/p_i*Nというのは、Σの中の一つ一つの成分が
カイ二乗分布に従うのではなくて、すべての場合が足された状態で初めてカイ
2乗分布に近似されるということですね。勘違いしていました。
二項分布の場合はたまたま
Σ(xi-p_i*N)^2/p_i*N
の合計が近似された正規分布からの値である
(xi-Np)^2/Np(1-p)
と同じになるけれど、多項の場合は独立性の問題から、個々にこの値を
だして計算できないというところに期待値で割るという、この公式の
意味がある訳なんでしょうか。うーん、間違えているかもしれませんが、
自分的にはかなり納得です。皆さんどうもありがとうございました。
>>125 うーん、まだちょっと勘違いしてるところもあるかな…。
この検定の意味は、各iの要素の確率(p1,p2,…、p_n)が全体として適正かどうかを検出するもの。
各piだけを検定したいんだったら、出た個数Xiっていうのは2項分布Bin(N,p_i)に従う(p_iの確率で1か0か、
っていうN個の独立な確率変数の和だから。)から、近似的にXiがN(Np_i,Npi*(1-p_i))に従うとして検定した
らいい。
XiがN(Np_i,Npi*(1-p_i))に従う、ってことは(Xi-Np_i)^2/Np_i*(1-p_i)は自由度1のχ^2分布にしたがっている
のと同じこと。N(0,1)に従うものの2乗が自由度1のχ^2分布に従うから。
おっしゃるとおり、これらは独立じゃないからそのまま分母が分散のまま足してもχ^2分布になってくれない。
だけど、分母を期待値にして和をとったもの=χ^2和(Σ(xi-p_i*N)^2/p_i*Nのこと)が自由度n-1のχ^2分布
になってくれる(ややこしい証明がいるとこ)。これを使って、(p1,p2,…、p_n)が全体として適正かどう
かを調べられる、ということ。
>>122 は要素が2個しかないから、(p1,p2)が適正かどうか、っていうのは片方どちらかが適正かどうかが分かれば
いいわけで、結局、χ^2和(Σ(xi-p_i*N)^2/p_i*Nのこと)の形が、どちらか1個のp_iについてのχ^2検定の形に
なってしまう、というお話。
127 :
おしえてちゃん :04/01/09 01:47
>>124 ほんとにありがとうございます!
わかりやすかったです!
ためになりました!
128 :
132人目の素数さん :04/01/09 02:01
これおしえてください! X1.X2.....Xnは母数p(0<x<1)の ベルヌーイ分布に従うとする すなわち P(X1=0)=1-p P(X1=1)=p ことのき Un^2=1/n−1煤ii=1,n)(Xi−Xn)^2 →a.s p(1-p) ↑バーがついてる ただし Xn=1/nXi ↑これもバーがついてる が成立することをしめせ (大数の強法則を用いて) おねがいします!
129 :
カイ2乗検定 :04/01/09 02:27
>>126 要は各piを個別に見るときは、正規近似した分散で割ることによって、
χ^2分布から適合度を見ることができるけれど、独立性の問題から、
個々の各piの、分散で割ったχ^2の値を足すことで全体の適合度を見る
ことはできない。そこで期待値で分母を期待値にしたものの総和がχ^2
分布に従うという性質を利用して全体の適合度を見るということですね。
納得いたしました。ありがとうございます。
すいません、文章変ですね。そこで、のあとの、期待値で、はいりません。 申し訳ないです。
131 :
132人目の素数さん :04/01/09 03:26
128です すいません、どなたか教えていただけないでしょうか。。。。 よろしくおねがいします
単回帰分析をして、R2、パラメータの値、パラメータのt値を読み取り各国別に結果からどんなことがわかるか考察しろって問題をだされたんだけど。助けて。 個人消費(constant_1987_US$)に対するGDPの変動 y=a+bx y=GDP_at_market_prices_(constant_1987_US$) x=Private_consumption__etc._(constant_1987_US$) 個人消費(constant_1987_US$)に対するGDPの変動 日本 豪州 サモア インドネシア R2 0.99 0.99 0.369 0.965 個人消費 1.762 1.588 0.7331 1.85 t値 100.53 70.27 3.747 26.07 っつか、質問分自体に間違ってるとことかある? 自分じゃわからん。 一応自分の精一杯の考察(になってない?) →R2は1に近いほど 信頼性がある、t値は絶対値2より上ってことから サモアを除く2ヶ国のデータは信頼性が高い?
>>128 Un^2=1/(n-1)*(Xi-Xn(バー))^2 (普偏分散という)の平均は
E(Un^2)=V(Xi)=p(1-p)
このことは普通の統計の教科書なら絶対載ってる。
大数の強法則は、各Xiが独立同分布で、平均μなら、
1/n*(X1+…Xn)→μ (a.s)
ってことだから題意は明らかだよね。
大体想像はつくけど、もうすこしきちんと数式書いた方がいいよ。
普偏分散→不偏分散の間違い
>>133 やっぱりあんまり明らかじゃないな。
もっと詳しい人の書き込みキボン。
>>128 1/n*(Xi-Xn(バー))^2=1/n*((Xi-E(Xi))^2-(Xn(バー)-E(Xi))^2)
=1/n*(Xi-p)^2-(Xn(バー)-p)^2
=1/n*(Xi-p)^2-(1/n*嚢i-p)^2
これはよく使われる式変形。
(Xi-p)^2、Xiはそれぞれ独立同分布確率変数列で、E((Xi-p)^2)=p(1-p)、E(Xi)=pだから、大数の強法則より、
1/n*(Xi-p)^2→p(1-p) a.s. 1/n*嚢i→p a.s.
よって、1/n*(Xi-Xn(バー))^2→p(1-p) a.s.
よって、1/(n-1)*(Xi-Xn(バー))^2→p(1-p) a.s.
n-1で割ってるのは不偏分散を意識したもんでしょう。nをとばせば当然どちらでも分散に概収束する。
>>132 パラメータについての説明もいれなきゃだめだよ。
個人消費の行は多分、係数bのことだよね?
R2、t値から見て日本、豪州は個人消費とGDPに相関があり(t値による検定)かつ、この回帰直線でうまく
関係が説明されている(R2の1に対する近さ)ことがわかる。インドネシアもまずまず。
よって、この回帰直線で各国のGDPの個人消費に対する感応度が比較でき、インドネシア、日本、豪州の
順に感応度が高いことがわかる、というようなことを書けばいい。
138 :
132人目の素数さん :04/01/10 05:31
良スレage
139 :
132人目の素数さん :04/01/10 16:03
確率変数Yが母数λの指数分布 fY(y|λ)=λe^(-λy)*T(0.∞) に従うとする ただしλ>0 ことのきYの期待値E[Y]を求めよ をおしえてください お願いします
141 :
おしえてちゃん :04/01/11 01:58
X1.X2....Xn(n≧2)を正規分布N(μ、σ^2)からの 大きさnのランダム標本とし X(1)、X(2)、、、X(n) (X(1)≦X(2)≦、、、≦X(n))を その順序統計量とする mn=(n+1)/2 (nが奇数) =n/2 (nが偶数) とおきZn=X(mn)を標本メデアンとする X1のメデアンはμとなることを示せ 更に√n*(Zn-μ)はどのような分布に収束するか答えよ って解説回答いただけないでしょうか
>>137 レスありがとう。大学、一般教養の授業の宿題だったんだけど、授業あんまり
まじめに聞いてなかったんで。137さんの指摘を参考にしてやりました。
ありがとう
>>141 >X1のメデアンはμとなることを示せ
は意味不明だよ。X(2n+1)の平均がμになることなら、X(2n+1)-μの密度関数を書いてやれば偶関数になるから平均ゼロはほぼ明らか。
√n*(Zn-μ)の極限分布は、結論だけ言えばN(μ,(π/2)*σ^2)。
一般に、uをF(u)=1/2なる点とすれば、√n*(Zn-u)の極限分布はN(0,1/(4*f(u)^2))になる。
証明はスターリングの公式とかを使えばできる。(そう難しくはない。)
今は、元の分布がN(μ,σ^2)だから、u=μで、f(μ)=1/(√(2π)*σ)を代入して答え。
144 :
132人目の素数さん :04/01/12 14:49
143サマありがとうです! でもまだちょっとわからないんでさらに 詳しくお願いできませんか!? すいません、お手数かけます
>>144 どこがどう分からないのか書いてくれなきゃ答えようがないよ。
っていうかこの説明で全体的に何がなんだか、ってんなら今のあなたに理解できる問題じゃないよ。
順序統計量ってどんなものか知ってる? そもそも問題文はあってるの?
146 :
132人目の素数さん :04/01/12 21:30
重回帰分析の寄与率って、どういうデータだったら低くなっちゃうの?
147 :
132人目の素数さん :04/01/13 19:09
上で一度聞いたかもしれないのですが Zが標準分布に従うとき E[Z^k](k=1.2.3.4)を求めよ を詳しくもう一度教えてもらえませんか よろしくお願いいたします
149 :
132人目の素数さん :04/01/13 19:46
! ありがとうございます!!!!
150 :
132人目の素数さん :04/01/13 20:01
X1、X2....Xn(n≧2)をコーシー分布 f(x)=1/πσ*1/1+[(x-μ)/σ]^2*I(-∞.∞) からの大きさnのランダム標本とし X(1).X(2)...X(n) (X(1)≦X(2)...≦X(n)) をその順序統計量とする mn=(n+1)/2・・・nが奇数 =n/2・・・・・偶数 とおいて Zn=X(mn)を標本メデアンとする X1のメデアンはμになることを示せ 更に√n*(Znーμ)はどのような分布に収束するか をできるだけ詳しく教えてください よろしくおねがいいたします お手数おかけしてすいません
>>150 極限分布は、N(0,(πσ)^2/4)。
>>143 で、f(μ)=1/(πσ)になるから。
問題があってるなら、X1のメジアンってのは、分布関数をF(x)として、F(u)=1/2となる点uのことのようだね。
よって、F(μ)=1/2になることを示せばいいんだけど、これは密度関数の形を見れば明らかでしょ?
きちんと示すなら、∫[-∞,μ]f(x)dx=∫[μ,∞]f(x)dxとなることを示せばよく、
Y=X-μと変数変換すれば簡単に示せる。
>>141 も同じね。
152 :
132人目の素数さん :04/01/14 00:55
メデアン 初めて聞いた メデアン いい響きだ。 ちなみに、carvatureを カーベイチャーと書いている本があった。 これまた感動。
153 :
132人目の素数さん :04/01/14 03:06
>>146 どういうデータってのは・・・たとえば、あまり相関のないデータ同士とか、そういう感じか?
それなら・・・
>>147 以降に期待(藁
154 :
132人目の素数さん :04/01/14 03:18
151さま ありがとうございました 本当に感謝してます!!!!!
155 :
132人目の素数さん :04/01/14 03:24
教えてください Φ(x)を標準正規分布の分布関数とする すなわち Φ(x)=∫(-∞.x)(1/√2π)*e^(-t^2/2)dt である(xは実数) このときG(x)=Φ(ax)は正規分布N(0.1/a^2)の 分布関数になることを示せ(a>0) よろしくおねがいいたします。
>>155 t=asって変数変換して積分を書き換えたら明らかだろ?ちょっとは自分で考えろや。
157 :
132人目の素数さん :04/01/14 04:00
>>156 ぜんぜんわからないんです(><)
ごめんなさい
普通の積分でよいのでしょうか?
普通の積分っていうか、t=asって変数変換してΦ(ax)をsの積分の形に書き換えたら、 ∫(-∞,x)(a/√2π)exp(-(as)^2/2)dsってなって、積分の中身がN(0,1/a^2)の密度関数になるでしょ?
お金を払う理由は時間がかかりそうでお礼なしではもうしわけないからですので、 もし金銭のやりとりがいけないとしたら商品券5000円分もしくは 相当の品でお礼させてください。こまってるのでつ・・・
161 :
132人目の素数さん :04/01/14 11:31
> お金は渋谷池袋新宿辺りで手渡しします わらた
162 :
132人目の素数さん :04/01/14 11:35
急に勉強したくなったんだけど そもそもココに書いてある記号、用語の意味がワケワカラン そんな漏れにお勧めの本教えて〜 (品質管理のことを知りたい場合ココで聞くほうがいいんだよね?)
ココってどこだよ。 品質管理って何の話だよ。
164 :
132人目の素数さん :04/01/14 11:52
>>162 単に統計の基礎を知りたいのであれば
「統計学入門」 東京大学出版会
あたり。
よく工場でやってる品質管理って統計を使うもの じゃないのかと思ったんだけど・・・(^_^; だから数学板でも統計スレの人が詳しいかと・・・
>>164 それ以外で、エクセルなどで頻繁に使う関数などについてかかれている
統計の本はありますか?
エクセルの本ではなくて。
統計の本を2,3冊手元に置いておきたいので。
168 :
132人目の素数さん :04/01/14 18:27
>>167 言いたいことがよくわからんけど
エクセルのヘルプやエクセル関数辞典を読んで
よくわからんものが出てきたとすれば
とりあえず検索。
何を頻繁に使うかは人それぞれだし
その時に応じて、本を買い足したほうがいい。
169 :
132人目の素数さん :04/01/15 08:02
うっかりミスでした。この話無かったことにしてください。
171 :
132人目の素数さん :04/01/15 12:06
, - 、 / ̄7 __ _ (_ ヽ / ハ ヽ / ヽ __ r-、 r‐-, `ー' ´ ,-‐' ̄ `ヽヽ ヽl / / | / / / / _, -'´ ̄``ヽ _, -‐-、ヽ_r7 ,ハ )ヽ ヽヽ_,7/ ノ/ / / / / ,‐ヽ ヽ '、__rっ ) l / / l ヽ__) / / / // / .(__,/ ) | / / L/ (__ノ ,r‐' ノ __`'´ ヽ_ノ l l `′ ,、 `ー'´ / ヽ /`ヽ / / /フ | | r-、 `ー' `ー′ L__/ r"> // | | ヽヽ ,.._ / / { { || 〉〉 ,-、 // { { い | | /ノ / / ,、 { { ヽヽ、 ヽ`'二_二' / / / / ノ /7 ヽヽ、 `'-ニ,/´_=;;;;=_ ヽ`ニノ / / { { `ー-`ニニ /r'゙_ ヽ / _`',`ー-‐'´ノ r'7 ヽヽ、 _,.ノl. r 。ヽ| | r'。ヽ!'-ニ二__// 「`! `'-`ニニ二-ァ | `ー'_ !」 _ー' |ヾー―---‐'´ ,-、 l ! ,. -'´ri |l ‘~`ー'~′ l| r‐`ニニ'ー- 、_// ヽ、ヽ--―'ニ ‐'´ {ヾ ! ,r;'ニーニヽ、!l/}ヽ、 ``ー‐'´_ __ ``'' ''´ /,トミ! ir,!-┴-!、ヾ, !'/\ヽ、_ /ノ い、 ///ハ||′-―-、`|||' l ヽ `ヽ、二./ \`ー―'ニ´‐',/ ! ||!/ ヽl|| lヽ \ ,-、 ,、 ̄ ,. -'_/ ! ||!______l|| l \`ー‐'´ ノ `‐`r―‐'ー-、! .!'、|_|_|_,ノ!| L. -‐`ニ ´ ! 「`ヽ、l ヾー―――'ソ L..-、 | | |:::::::::l ` ̄ ̄ ̄´ l::::::| | | |::::::l l::::l l
172 :
132人目の素数さん :04/01/16 02:21
尺度に対するピットマン推定量の導出方法を教えてください。
>>159 ちょっと面白そうだからのぞいてみた。そんなに難しくないと思うけど。
たとえば、マンチェスターユナイテッド(以下A)とアーセナル(以下B)がマンチェスターUのホームで戦った場合、
Aの得点は、平均187/112のポアソン乱数
Bの得点は、平均216/140のポアソン乱数、から発生させて、
Aの得点を表1のHomeAとAwayBの交点、Bの得点を表2のHomeAとAwayBの交点にかきこむ。
もし、Aの得点>Bの得点ならば、表3のHomeAとAwayBの交点にhome
Aの得点<Bの得点ならば、away
Aの得点=Bの得点ならばdraw
リーグ戦成績表には、それに応じて与えられる勝ち点を書き込むだけだと思う。
>また、リーグ戦を多数回シミュレートした結果から、各チームの「勝点(下の成績表最
とあるから、その一個上の問題は、別に何度もリーグ戦を繰り返す必要がなく、一回シミュレート
すればよいだけに思える。
最後の問題は、以上のプログラムを何度も行うようにすればよい。
home とawayで守備力と攻撃力が何にも変化無いって変なモデルだと思う。
上智大学経済学部か
区間推定で,信頼区間の幅を狭めるには どうしたらいいんでしょうか…?
「サンプルサイズを増やす」というやつの他に何が あるんでしょう?
176 :
132人目の素数さん :04/01/16 20:10
Δxを微少量とする。 Δx→0の時、P{x<X≦x+Δx}→P(Φ) となると思ったのですが、教科書には →P{X=x} と書いてました。なぜだか分かりません・・・ 誰か理由を教えてください
177 :
132人目の素数さん :04/01/16 22:47
>>176 分布関数がX=xで連続のときは、P(Φ)もP{X=x}も同じでしょ。
その1点を取る確率が0だから。
分布関数がその点でジャンプしているときは、Δx→0の時、P{x<X≦x+Δx}→P{x<X≦x+0}
=P{X=x}でいいんじゃない?
179 :
132人目の素数さん :04/01/17 00:23
180 :
132人目の素数さん :04/01/17 02:14
>>178 >分布関数がその点でジャンプしているときは、Δx→0の時、P{x<X≦x+Δx}→P{x<X≦x+0}
>=P{X=x}でいいんじゃない?
まずいように思う。
離散的な分布関数なんか考えてもらえばわかると思うけど
簡単に言っちゃうと、サイコロで・・・やったら最後の等式は、まずいでしょ?
>>180 ごめんなさい。考えなしに書いてしまいました。何冊か本をあたってみましたが、どれも
P{x+Δx<X≦x}→P{x+0<X≦x} =P{X=x}
と書いてありました。確かに分布は右連続なのでまずいですね。失礼しました。
182 :
132人目の素数さん :04/01/17 16:42
>>181 P{x-Δx<X≦x}→P{x-0<X≦x} =P{X=x}
じゃないか?(符号が逆)
183 :
132人目の素数さん :04/01/17 18:40
読んで解った気になれる簡単な統計の本ってありますか? 知りたいのは検定周りで、ウィルコクソンの順位和検定あたりまで 難しい数式ヌキで解説してくれていると嬉しいのですが。
184 :
132人目の素数さん :04/01/17 18:57
数式なしでどうやって、統計を解った気になれるのかわからんけど・・・。 無理じゃね?
185 :
132人目の素数さん :04/01/18 13:00
信号の周波数解析,FFT解析をした際にパワースペクトルがでてきます. 横軸周波数,縦軸スペクトル密度のグラフがかけるわけですが,このスペクトルピークが有意であるのかないのかを調べる方法は, ピークの周波数分布を描き,この分布の平均値および標準偏差より分布の1-α(有意水準α)にあたる両側の部分を信頼区間と考えればよいのでしょうか.
>>185 ピークの周波数分布ってどゆこと?具体的にどう決めるの?
横軸が周波数の区間で縦軸が頻度のヒストグラムです.
ふーん…。俺は統計屋だから時系列解析はあんまり詳しくないけど、そもそも時系列解析って、 各観測データをひとつの時系列データとしてみて、その周波数なりを分析するんだよね? 統計はあくまで独立な多数の観測データに対して適用する、っていうのが基本的なスタンスで、 この仮定の下に体系が確立してるもの。 だから、理論的にそういうピークの周波数分布みたいなものに、統計的推定を使う根拠はないと 思う。 具体的な分布のイメージがつかめないんだけど、必ずしも正規分布のような形にはならないんじゃ ないのかな?
>188 なるほど. たしかに正規分布にはならないです. しかし,logをとると正規分布になります. ではピーク値が0が限りなく近くて,その値に意味がない あるいは有意であるという判定をするためには どうしたらよいのでしょうか.
190 :
132人目の素数さん :04/01/18 17:50
SPSSのラーニングエディションを格安で売っている店はありますか? ビックカメラとか探していますが見つかりません。 紀伊国屋で売っていますが12000円。微妙に高いです。
>>189 どんなデータでも対数正規になるの?
よく知らないけど、統計的にそういう有意判定をするのは難しいと思うよ。
理由は
>>188 に書いたとおりでそもそも統計の枠組みじゃないから。
そのやり方を論理的に確立すれば1本論文書けるよ、きっと。
後は、ここで聞くより担当教官に聞いたほうがいいね。
>>188 複数回の「一定期間のサンプリング」が独立であると言えれば
それぞれのサンプリングから得られるパワースペクトルを
独立試行によって吐き出されるベクトルとみなして、ウィルクスのΛ。
これで「何かあったんじゃね?」ぐらいは。無理かな?
よく読んでなかった。上は無し。
いろいろ教えていただきましてありがとうございます. 分布のことなのですが,時系列データが正規分布だとすると, スペクトルは正規分布にもとづく独立2変数の二乗和ということで Χ二乗分布になるということです. この分布から95%の信頼区間を求めても 統計的に意味がないのでしょうか.
196 :
132人目の素数さん :04/01/18 19:37
母集団の分布が平均50、標準偏差10であるとき、 ここから20個のサンプルを何回も取り出す。 (1)「このサンプルの平均値」の平均値は理論上いくらか (2)「このサンプルの平均値」の分散は理論上いくらか どなたかこの問題の解答を教えて下さい、お願いします
197 :
132人目の素数さん :04/01/18 19:44
198 :
132人目の素数さん :04/01/18 19:48
199 :
132人目の素数さん :04/01/18 20:09
>>195 意味がないっていうか、それは時系列が正規かつ独立っていう仮定をおいて初めてχ^2が出るわけでしょ?
それを基に検定なり推定なりをするのはおかしい。
スペクトルは時系列データの表現を変えたものにすぎないわけだからね。
普通に全然どんな分布かわからないデータをとってきて、これって標準正規分布のはずだから、3以上の数は
無視しよう、なんて言うのと同じことになっちゃう。
201 :
132人目の素数さん :04/01/18 20:26
統計データの検索サイトってありますか?
202 :
132人目の素数さん :04/01/18 20:36
>>199 ありがとうございます!!
できれば計算過程も教えていただけないでしょうか?
203 :
132人目の素数さん :04/01/18 20:42
標本平均はs=(x1+x2+...+xn)/n だから、 E[s]=E[x1+x2+...+xn]/n =(E[x1]+E[x2]+...+E[xn])/n=nμ/μ=μ (μ:母平均) V[s]=V[x1+x2+...+xn]/(n^2) =(V[x1]+V[x2]+...+V[xn])/n^2 =(nσ^2)/(n^2)=σ^2/n (σ^2:母分散) たぶん殆どの統計の入門の教科書に書いてある
>200 しつこく申し訳ないのですが, 母集団がどんな分布であろうともnが大きければ中心極限定理により、 その標本平均は、正規分布 に近似できることができるんですよね? それならば,平均値の分布からそれぞれの値が有意に大きいか 小さいのかはわからないのでしょうか.
205 :
132人目の素数さん :04/01/18 20:55
誰かこの問題解いてください 今、母集団の平均値がわからず、推定したい。分散は過去のデータから 100であることはわかっている。今、10個のサンプルを取り、平均値は 50であった。母集団の平均値を、95%の確立で表す区間を求めよ。 本当に困っています、お願いします
>>204 独立同分布なサンプルの標本平均はね。
実際、スペクトルの周波数分布は対数正規っぽくしかなんないんでしょ?
その分布から出した平均値を推定値としてみたとき、その推定値に対する信頼区間、っていうのなら定義できるよ。
ただ、あくまで時系列データをすべて使用したパラメータの推定値に対する信頼区間であって、出てきた結果を有意
水準〜で無視する、とかいう意味合いはないよ。
>>205 (50-1.96*10/√10,50+1.96*10/√10)
210 :
132人目の素数さん :04/01/19 00:21
>>210 世にある統計データを拾ってきていちゃもんつけれ!ってレポートなの?
とんでもない教官だなw
212 :
132人目の素数さん :04/01/19 00:29
そうなんですよ。 どこが足りないかって。
>>212 ってことは教官が一応、足りなさそうなのをピックアップしていて、そのひとつが
この警察庁データなのね?
214 :
132人目の素数さん :04/01/19 00:34
いえ、そういうわけではなく自分で好きなテーマをもってきて それについて文句言うっていうことです。
>>214 そっか。やっぱひどい教官だw
こんな検挙数並べただけのデータよりもっと問題ありそうなのを選んできた方がいいんじゃね?
とはいえ例はあげられないけど…。
216 :
132人目の素数さん :04/01/19 00:41
そう思って色々探してはいるんですけど見つからなくて・・・
>>216 そのハイテク犯罪のデータだけ見れば、例えばパソコンや携帯の普及率なども
調べて、普及率の伸びとハイテク犯罪の伸びについての関係についても触れる
べき、とかそんな感じのことしかいえないね。
普通の統計機関で、そうそう明らかに間違った分析をしてるところはないから、
こういうデータも持ってきて、こういう分析もすべきだ、というようなレポー
トにすりゃいいんじゃない?
218 :
132人目の素数さん :04/01/19 01:11
かなり問題だらけのデータだと思うけども 機械の普及がハイテク犯罪の検挙数を増やしているのか 法律の整備や宣伝が、相談件数の増加に繋がっているのか ただ最近は警察が頑張って働いただけなのかも知れないし。 まるで犯罪が増えてるように見せているけど、 不正アクセス禁止法が99年の夏に成立で まだ4年半くらい なんかこれだけでは、犯罪が増えているように騙そうとしているような感じ
219 :
132人目の素数さん :04/01/19 03:49
>>217 ,218
ありがとうございます。参考にさせていただきます。
220 :
132人目の素数さん :04/01/19 10:48
どうでもいい統計でも 見せ方によっては…ってな好例だな
221 :
132人目の素数さん :04/01/19 16:22
大学受験以降数学とは縁がナイ者だが(しかもネタとして完全に時機を逸した 感があるが)・・・ 首都圏全体で600のサンプル数しかない視聴率調査で、95%の信頼区間で 検出できる視聴率の差ってどのくらいなもんなのか、誰か計算して答えて ちょーだい!! 感覚的には16%と20%くらいじゃ有意差ないような気がするし、小数点以下 まで発表しても全く意味ないような気がするんだが・・・
一元配置分散分析で用いるF検定は、なぜ上側5%だけでいいのでしょう? 両側5%で行わないのはなぜですか?
223 :
132人目の素数さん :04/01/19 19:28
視聴率は二項分布で、サンプル数が多いため正規近似可能だから、 (統計的には30以上なら近似可能)、 標本標準偏差は√(p(1-p)/n) 標本平均が20%(p=0.2)なら、標本標準偏差は0.01633で、95%信頼区間は (16.8%、23,2%) よって、16と20だったら有意差ありだが、まぁ221の言うことは当たってるね。
統計科学のフロンティアシリーズってどうよ
>>222 要は等分散性の検定なんだが、級間平方和/自由度の方が級内平方和/自由度より大きいんで、
級間平方和を分子にとって、片側検定とするわけだ。逆は帰無仮説に入っていない、ってこと。
>>225 ふむふむ、なんとなくですが分かったような気がします。
ありがとうございます。
しかしここの質問に答えられる方ってすごいですな。
おいらも何か専門的な知識を持ってればいいんですが。
227 :
132人目の素数さん :04/01/22 22:18
数量化U類をExcelでやってるんだが、「件数が不足してます」とエラーがでる。 マニュアルには、「サンプル数が全説明変数のカテゴリー総数より少ない場合に、 このエラーメッセージが出ます。対処:サンプルを増やしてください。」とある。 もうアンケート対象がいないんで、サンプルを増やせないんだが、どうすれば良いの?
Excel スレで質問する。
>>227 Execlスレで質問する以前の問題だろ。
いくつのサンプルに対していくつの説明変数をとってんだよ。普通ありえない状況だが…。
>>229 サンプル数21で説明変数のカテゴリーが6つです
すんません スロ好きの厨房です サイコロを一つ振ると1/6って理論的には分かるのですが 本物のサイコロでもそういう風になりますか? だってサイコロって穴が削ってありますよね 本当はごく少しの空気抵抗やバランスにより 1/6ではないのでは?いつも気になってしまいます 教えて下さい 厨房
232 :
132人目の素数さん :04/01/23 00:29
>>231 あなたの言うとおりなりません。
数学で考えるサイコロは理想的なものです。
この世には存在しません。
233 :
132人目の素数さん :04/01/24 00:07
質問スレから誘導されてきました。 超初心者なんですけど・・・ X1,X2,X3・・・XnをN(3,9)からの大きさn=25のランダムサンプルとする。 標本平均Xが真の平均μ=3から絶対値で2以下の範囲に入る確率は P(X-μ≧δ)=P(√n(X-μ)/δ≧√n)=P(Z≧√n)=P(Z≧5) としてn、μ、δにそれぞれ25、3、√9、を入れて良いのでしょうか? それともN(3,9)の正規化の必要はありますか?
234 :
132人目の素数さん :04/01/24 00:36
>>233 その式が正しいかどうかはしらんけど
既に、正規化されているのであれば
μ=0だし、多分、δ(デルタ)じゃなくて
σ(シグマ)だと思われるが、これも1だ。
従って、正規化されている公式には
μとかσとかいうものはない。
>>233 標本平均 X~ (←バーのつもり)は N(μ,σ/√n) に従う。
>標本平均Xが真の平均μ=3から絶対値で2以下の範囲に入る確率は
この意味がはっきりしない。 |X~-μ|≦2 ということ?
>δ(デルタ)じゃなくてσ(シグマ) そうでした。すんません。 > |X~-μ|≦2 ということ? そうです。 つまり、正規化の必要は無いと言うことでしょうか?
237 :
132人目の素数さん :04/01/24 00:49
>>236 注意するとすれば、正規化は関係ないと思っていいだろう。
他の所に、写し間違い等があるようだが。
有難うございました。
>>233 P(|X~-μ|≦2)=P(|X~-μ|/(σ/√n)≦2/(σ/√n))=P(|X~-μ|/(σ/√n)≦10/3)
=P(|z|≦10/3)
とここまで変形すれば、正規分布表が使える。
2群の年齢平均値に差がない事を言う場合って、 「対応のないt検定をして、有意確率が有意水準以上になる」 っていう検定すればいいんですか? って今日、こんな質問を受けたんですが、自分としては Welchしろとか、有意確率が有意水準以上だからといって 差がないという主張をするのは怪しすぎると突っ込みたくて。 おいら、間違ってます?
ふと考えたら、U検定じゃだめなんですかね、上の。
242 :
132人目の素数さん :04/01/24 16:06
完備可分距離空間のことをポーランド空間といいますが、 ポーランドの語源は、何でしょう? 人名とかですか?
>>240 「平均値に差は無い」が帰無仮説だから、差が無いというより、差があるとは言えない、ってことだけどね。
検定方式で言えば、
t検定…2群が等分散かつ、正規近似できる場合。
Welch…上記で等分散性が棄却された場合。
他のノンパラ検定(U検定、コルモゴロフ・スミルノフ)
…上記以外。例えば2群のサンプルが少なかったり、明らかに正規分布とは異なる分布形になっていたり、って場合。
という感じかな。
年齢とか身長のような特徴を表すものだったら、とりあえずコルモゴロフ・スミルノフかなぁ、って気がする。
どういう2群かにもよるんだけどね。
>>243 日本語うまいですな。そうやって突っ込めば良かったんですね。
訊いてきた人も初心者で、おいらもさほど詳しくないので
なんて説明すればいいか迷ってました。
今度訊かれたらそのまま言っておきます。感謝。
245 :
132人目の素数さん :04/01/25 14:42
標本分散と不偏標本分散の違いって何ですか??
246 :
132人目の素数さん :04/01/25 16:24
Xをある製品の耐久年数とし、平均μ、標準偏差σ=5の正規変数であると仮定する。今、μの推定値として ̄Xをとることにするが、μとの最大誤差を0.5として、この最大誤差を越える確率を5%とすれば、いくらの標本を得る必要があるか。 よろしくお願いしますm(_ _)m
>>246 標本数がn の場合、 ̄Xは N(μ,σ/√n) に従う。
P(| ̄X-μ|>0.5)=P(|( ̄X-μ)/(σ/√n)| > 0.5/(σ/√n) )
=P( |z|> (√n)/10 )=0.05
となるような値は 1.96 だから
(√n)/10 = 1.96 とおくと n=384.16
385個以上の標本が必要。
248 :
132人目の素数さん :04/01/25 18:38
>>247 わかりました!!何かよくわからないことやってましたιありがとうございますm(_ _)m
249 :
132人目の素数さん :04/01/25 18:45
携帯電話の電池の継続使用時間が平均800時間の正規分布に従うものとする。これらの電池の少なくとも90%は700時間以上の寿命を持って欲しいとすると、これを満足させるσの最大値はいくらになるか。 よくわかりません…(;_;)
>>249 P(X≧700)=P((X-800)/σ≧ -100/σ )
z=(X-800)/σとおくとzは標準正規分布に従う。
標準正規分布の下位10%点は-1.28である。
これらの電池の少なくとも90%は700時間以上の寿命を
持って欲しいとすると -100/σ ≦-1.28 となればよい。
よって σ≦100/1.28=625/8
>>245 母集団(母平均μ母分散σ^2)から
n個の標本を取り出した。とする
標本平均=標本の平均=母平均の不偏推定値
標本分散(nで割る方)=標本の分散
普遍標本分散(n−1で割る方)=母分散の不偏推定値
普通、母平均、母分散がわからないから、標本から推定してやるってこと。
標本の分散が母分散の不偏推定値と異なることに注意。
何でn−1で割るのは、自由度の話になるはず。
252 :
132人目の素数さん :04/01/25 22:17
253 :
132人目の素数さん :04/01/26 00:56
ありがとうございます!標準分布の単元のテストの問題だったので、そうだと思いこんでずっと解けませんでした(^_^;)これからは問題をよく読んでみようと思いますι
254 :
困ったOLさん :04/01/26 23:02
おわかりになる方がいらっしゃいましたら教えて下さい。 会社でお客様に手続き書類を発送し、返送された書類 のなかにどうしても書類不備がでます。 (不備はお客様側の不備で私の不備ではありません) 昨年は不備率2%(5200件中100件)でしたが、上司より 今年は1.3%にするようにと言われました。 毎年毎年下げろと言われこれ以上下げられないと思い 納得いきませんでした。 30%を20%にというなら努力の方法もあるので 納得出来ますが、不備というのは自然発生的に ある程度の数字は出てきてしまうものだと思うのです。 ミスの発生する確率のようなもので・・・・・ 統計学に関係があると思いこちらにお邪魔しました。 その辺のところご存知の方がいらっしゃいましたら どうぞ教えていただけないでしょうか。 (場違いな質問でしたら申し訳ございません) どうぞよろしくお願い致します。
255 :
132人目の素数さん :04/01/27 00:01
お世話になります。 問:石油会社が石油添加物加えることにより石油1リットルあたりの 燃費を上げることが出来ると主張している。これまでの燃費は平均10km、 標準偏差5kmの正規分布にしたがっていると仮定。このとき、どのように帰無仮説と対立仮説を 設定し、どのようなときに石油会社の主張は正しいと認められるか? 宜しくお願いします。
済みません、ミスりました。こっちが本物です。 問:石油会社が石油添加物加えることにより石油1リットルあたりの 燃費を上げることが出来ると主張している。これまでの燃費は平均10km、 標準偏差5kmの正規分布にしたがっていると仮定。 また、新しい添加物を加えた車の燃費の分布は未知の平均μ、標準偏差10km の正規分布に従うと仮定する。このとき、どのように帰無仮説と対立仮説を 設定し、どのようなときに石油会社の主張は正しいと認められるか? 宜しくお願いします。
>>254 統計的には、現状のまま何も改善策を打たないとすれば、翌年度は
90%の確率で、不備率が1.6%〜2.2%
95%の確率で、不備率が1.5%〜2.3%
99%の確率で、不備率が1.4%〜2.4%
の間になると思われる、ということが言えます。
このまま何も改善策を打たなければ、自然に1.3%になることを期待するのはほぼ見込みがないということですね。
いわゆる自然発生的な不備率の最小限界がいくらか、といったことはこれだけの統計で出てくるお話じゃありません。
あなたにできることは、改善策として考えうることをできるだけ行うことだけです。
上司にはとりあえず、
「一応現在できうる打つべき改善策は打つが、統計的に90%の確率でも現在の件数では約0.6%の幅の誤差があり、
必ずしも1.3%を達成できるとは保証はできません。」
とでも言っておけばいいんではないですか。
>>256 帰無仮説:μ=10、対立仮説:μ>10とすればいいんじゃない?
後は正規分布の平均の片側検定。普通の統計の教科書には絶対載ってるから自分で調べてください。
帰無仮説が棄却されたら石油会社は正しいといえる。
259 :
困ったOLさん :04/01/27 00:55
>>257 132人目の素数さんへ
お返事ありがとうございます。
毎日毎日必死で改善策等はやれるだけやっていて、それなのに
これ以上どうしろっていうの〜〜(泣)っていう感じでしたので
藁にもすがる思いでこちらに書きこみました。
本当に本当にありがとうございました。
おかげで安心して眠れます。
(朝が早いのでいつも11時には就寝なんです。)
おやすみなさい。ありがとうございました。
260 :
132人目の素数さん :04/01/27 04:53
偽相関の身近な具体例を教えてください
>>260 「ハゲほど給料が高い」ぐらいでどう?
ハゲと年齢に相関、給料と年齢に相関があるから、ハゲは直接給料と因果関係はないけど
見かけ上相関があるように見える。
>>242 誤爆?
ポーランドは国名のポーランド。第二時大戦前、そのへんの空間の研究者にポーラン
ド人が多く、ポーランド学派を形成した。
余談だが、志賀浩二「無限からの光芒」を読むとその頃の雰囲気が分かって面白い。
あの・・・単回帰直線の解き方を教えてくださいっ(Д<)
>>261 さん
ありがとうございます。
参考書読んでもわかりにくかったので質問させていただいた文系学生でした。
教科書で調べましたが、 この問題nも有意度も不明なので手が付けられません。 √n(X~-μ0)/σ を使うんですか? どうにかお願い出来ないでしょうか?
自己解決しました。
偽相関について。 男が買うオムツの売上、と、ビールの売上、には相関があった。 一見、関係なさそうー>偽相関 男がオムツだけを買うのが恥ずかしいから、ビールもついでに買う、 という、心理学的根拠が示されるー>偽相関でない? 偽相関かどうかの基準はどうなんだろうか?
268 :
132人目の素数さん :04/01/28 19:46
ある正規変数から10個の標本を取り出して不偏標本分散を求めたところ、3.76であった。この母集団の分散σ^2を2とする時、標本分散が3.76以上になる確率はいくらか。 さっぱりわかりません…お願いします!
>>268 不偏標本分散が3.76だったら標本分散は3.384だけど…。
真の分散が2の場合、10個の標本をとってきたときの標本分散がある値以上に
なる確率はχ^2分布から求められるよ。問題の前半部分とは関係なく。
270 :
132人目の素数さん :04/01/28 22:59
>>269 では、P(U≧16.92)より、答えは5%ですか?
271 :
☆キキ+キ゚Д゚ ◆qpmo.OOqAo :04/01/28 23:01
>>270 問題文のうしろの「標本分散」が「不偏標本分散」ならそういうこと。
多分、その意味なんだろけど。
273 :
132人目の素数さん :04/01/29 05:05
>>272 多分先生のミスだと思います。ありがとうございました!!
274 :
皆さんやってみて :04/01/29 18:13
不眠症のための睡眠薬Aの効果を調べるために、 20人の不眠症患者を無作為に選び、 睡眠薬Aを投与した。その結果、睡眠時間の増加は以下のようになった 0,6 -0,3 2,4 1,3 -0,5 1,5 0,9 -0,6 0,9 4,3 2,7 -0,1 1,9 3,2 1,6 1,3 1,8 1,8 3,3 1,8 (1)睡眠時間の平均増加時間uに対するさまざまな信頼度の (両側、片側)信頼区間を作り、 睡眠薬の効果について考察しなさい (2)睡眠時間が平均的に1時間以上増加したら、 睡眠薬の効果があったと判断すると、 上の実験結果より睡眠薬の効果があったと判断してよいか、どうなのか考察しなさい (3)睡眠時間の増加の標準偏差は、標本の大きさによらず、 いつもほぼ一定の値であることが知られている。 この事を利用して、 睡眠時間の平均増加時間の両側信頼期間の区間幅を1時間未満にするには、 何人の患者に対して実験すべきか考えなさい。 (4)統計的データ解析法について、A4以内でまとめなさい。 この問題ができた方はE−mail下さい
276 :
皆さんやってみて :04/01/29 18:37
マルチしてしまってすいません 皆さんできますか
>>276 分かるけど、基本的にマルティには答えるなと言われているので
諦めてください。
>>276 別に難しい問題じゃないし、できる人は当然いっぱいいると思うが、やってみて、なんて言い方だとやってくれる
人は多分いないよ。自分はできるけどおまえらできますか、みたいな感じだから。
(4)は丁寧に頼まれてもやってくれる人はいないよ、きっとw
279 :
やってみてください :04/01/29 19:21
不眠症のための睡眠薬Aの効果を調べるために、 20人の不眠症患者を無作為に選び、 睡眠薬Aを投与した。その結果、睡眠時間の増加は以下のようになった 0,6 -0,3 2,4 1,3 -0,5 1,5 0,9 -0,6 0,9 4,3 2,7 -0,1 1,9 3,2 1,6 1,3 1,8 1,8 3,3 1,8 (1)睡眠時間の平均増加時間uに対するさまざまな信頼度の (両側、片側)信頼区間を作り、 睡眠薬の効果について考察しなさい (2)睡眠時間が平均的に1時間以上増加したら、 睡眠薬の効果があったと判断すると、 上の実験結果より睡眠薬の効果があったと判断してよいか、どうなのか考察しなさい (3)睡眠時間の増加の標準偏差は、標本の大きさによらず、 いつもほぼ一定の値であることが知られている。 この事を利用して、 睡眠時間の平均増加時間の両側信頼期間の区間幅を1時間未満にするには、 何人の患者に対して実験すべきか考えなさい。 (4)統計的データ解析法について、A4以内でまとめなさい。
コピペやめぃ。
281 :
おながいします :04/01/29 23:28
(Xa,Xb,Xc)の自己相関行列が A B C 5 1 0 D E F =1 3 2 G H I 0 2 4 で与えられるとき、線形予測係数α1、α2を求めよ。 全く意味が分かりません、、、
282 :
132人目の素数さん :04/01/30 12:41
朝食を食べている学生の割合を調べるのにアンケートをとった 1000人がアンケートに答えその内の600が食べていると答えた 食べている人の割合の推定量の分散の推定値を求めよ -------------------------------------------------------- ↑上の問題で「推定量の分散」の意味がわからず全く解けません 解き方と解答を教えてもらえないでしょうか?
意味がわからないものの解法と解答を教えてもらうことに意味はあるのだろうか?
284 :
132人目の素数さん :04/01/31 00:14
ほんとに基本的なことで恐縮ですが、以下の問題について教えてください。 生物雑種第2代の分離比が、ある実験の結果42:157であった。この結果を用いて この結果がメンデルの分離の法則による分離比(1:3)を満足しているかどうか 検定せよ。 この問題に対して私はメンデルの法則に”満足している”ことを知りたいのだ から、帰無仮説は”満足していない”と考えました。 この考え方はおかしいのでしょうか?おかしいとしたら、どのように考えれば よいのかアドバイスをお願いいたします。
>>284 「満足していない」という仮説を立てるのは自由だが、その仮説からいったい
どういう計算ができるのか?と自問してみたまへ。
287 :
☆キキ+キ゚Д゚ ◆qpmo.OOqAo :04/01/31 02:00
>>281 (Xa,Xb,Xc)から、何かを線形予測したいんだろけど、自己相関行列だけからじゃわからんよ。
その問題の前後になんか条件とか説明は無いの?
>>282 本当は問題にどういう推定量を使うか書いていないからわからないんだけど、一般的な解釈で解答すれば次の通り。
割合の推定量ってのはたぶん、食べている人の人数をX、全体人数をNとすればX/Nのことだろ。
んで、食べている人の割合の真の値がpなら、このXは、2項分布Bin(N,p)に従う。
この分散はNp(1-p)だから、X/Nの分散は、p(1-p)/Nになる。
今、このp(1-p)/Nの中のpは真の確率だけど、これをpの推定値600/1000で置き換えたものを、
X/Nの分散の推定値としてみることができる。
だから、0.6*(1-0.6)/1000=0.00024が多分出題者の求めている答えだと思う。
>>284 考え方としてはいい方向だよ。間違っているときに積極的に捨てたい仮説が帰無仮説だから。
だけど、検定の方式というのは、帰無仮説を仮定したときに、実際起こった結果が起こる確率
を計算できなければ判定ができない。
よって、
>>286 氏の言うとおり、仮説が色々な値をとる様な場合は、この確率の計算ができない
から、必然的に値がはっきりしてる方を帰無仮説にとることになる。
だから、「3:1である」と「3:1でない」だったら、値が1つに決まっていて確率計算が
できる前者を帰無仮説にとるわけだね。
290 :
132人目の素数さん :04/02/01 20:39
誘導でこっちにきました。統計で質問です。 サンプル数15 Aの割合60パーセント、Bの割合80パーセント AとBに有意差があるか検定したいのですがどうすればいいですか?
291 :
132人目の素数さん :04/02/01 21:52
『モンティ・ホールのジレンマ』はどういうこととどういうことがジレンマになってるんですか?
>>290 ちょっと状況は違うけど、2群の母比率の差に関する検定を準用すればいいんではないかな。
>>291 正解っぽい解答が2つ以上存在すること(1/2と1/3)。すぐに1/3と分かる人にとってはジレンマでも
なんでもないんだけどね。
複数の正しいと思われる互いに矛盾する解答が存在する場合が「ジレンマ」、論理的に解がありそう
だけど解が見つからないような場合が「パラドックス」。
同じような意味で使われる場合も多いけど。
二項分布のPの求め方を教えてください
>>293 推定値を求めたいなら、出た割合をpの推定値とするのが普通。
295 :
助けて頂けませんか? :04/02/03 16:26
274・279の者ではないのですが、 統計の問題なんですが解けないので、助けて頂けませんか? できれば解説等も書いてあれば幸いです。 問 不眠症のための睡眠薬Aの効果を調べるために、 20人の不眠症患者を無作為に選び、睡眠薬Aを投与した。 その結果、睡眠薬の増加は以下のようになった。 (1)睡眠時間の平均増加時間Uに対する 様々な信頼度の(両側、片側)信頼区間を作り、 睡眠薬の効果について考察しなさい。 (2)睡眠時間が平均的に1時間以上増加したら、 睡眠薬の効果があったと判断することにすると、 下の実験結果より睡眠薬の効果があったと判断してよいか、 どうかを考察しなさい。 (3)睡眠時間の増加の標準偏差値は、 標本の大きさによらず、 いつもほぼ一定の値であることは知られている。 このことを利用して、 睡眠時間の平均増加時間の両側信頼区間の区間幅を1時間未満にするには、 何人の患者に対して実験すべきか考えなさい。 _______________________________ |0.6|−0.3|2.4|1.3|−0.5|1.5|0.9|−0.6|0.9|4.3| ーーーーーーーーーーーーーーーーーーーーーーーーーーーー |2.7|−0.1|1.9|3.2| 1.6|1.3|1.8| 1.8|3.3|1.8| ーーーーーーーーーーーーーーーーーーーーーーーーーーーー 見にくいかもしれませんが、御願い致します
>>295 まず不思議なのは
このスレに来て
何故、274・279に同じ問題の
コピペがあるということが分かったのか?
297 :
助けて頂けませんか? :04/02/03 16:52
他の板に同じのが載っているという事でしょうか? それとも答えるに値しない程の低レベルの問題と言う事とかでしょうか? 見当違いの答えをしているのでしたら、申し訳ありません。 殆ど統計を勉強していなかった為、全くと言って良い程理解出来ないので、 解き方のヒントだけでも頂けたら有難いです。
>>297 で、教科書は読んだのかな?
丸投げにしか見えないのだけど。
>>297 あなたはこの問題をどこで手に入れ、何故この問題を解く必要があるのか?
というあたりを答えてもらいましょうか。
どうみても あなたは
>>279 と同じ人だと思いますが
全く同じ問題で、かつ、名前欄に妙なメッセージを入れているし
300 :
教えてください :04/02/03 17:40
私は上の睡眠薬のレポートができないと統計学の単位がもらえないのです。 だから誰か助けてください。 この問題は授業のレポートです。 私は貧乏なのでみんなのように教科書をかったりできないので大変困っています。
図書館・・・
>>300 これは医学部のレポートだろ?
ホントにお金無いの?(w
303 :
教えてください :04/02/03 17:50
もしよければ誰か親切な方教えてくれないでしょうか。図書館の本はすでに借りられていました
来年また頑張れば? 教科書を買う金なんて 2〜3日分、食費削るか 半日くらい肉体労働のバイトすればすぐ たまるじゃん。
ここまで荒し続けて来ていまさら何言ってるの?ってカンジ。
306 :
助けて頂けませんか? :04/02/03 18:09
295・297です 297の人は恐らく同じ学校か、 同じ教師の教わってるのではないでしょうか? 自分はテキストは持っていますが、 読んでいるうちにだんだん分からなくなってきてしまうんです・・・ 検定の考え方までなら少しは理解出来ますが、標準正規分布図を描き、 選択域・棄却域の場所等からが理解不能になってしまうんです。 以降はどの様に考えれば良いのでしょうか? 御手数でしょうか、宜しく御願い致します。
307 :
助けて頂けませんか? :04/02/03 18:13
間違えました!! 300の人が同じ学校か、同じ教師という事です!!
308 :
132人目の素数さん :04/02/03 18:13
>>306 だったら、君のテキストを貸してあげれば?(w
>>307 簡単にいっちゃうと
自作自演で自分が何番かこんがらがって来たということかな?
>>295 (1)
正規分布を仮定。
データの標本平均x~、(不偏)標本分散s^2をもとめて、
(x~-t(ε/2)*s/√(n-1), x~+t(ε/2)*s/√(n-1))
ここで、t(ε)は自由度19のt分布のε点。εは、1%や5%をとる。
(2)
標本平均が1より大きいから、帰無仮説μ=1、対立仮説μ>1で検定。
有意水準εなら、x~-1>t(ε)*s/√(n-1)で、仮説が棄却される。
仮説が棄却されたら効果ありと言っていい。
(3)
(1)で作った信頼区間から幅は、2*t(ε/2)*s/√(n-1)が分かる。
これが1未満になる、っていう不等式をnについて解くだけ。
これで何が何だか分からないようだったら素直に単位落としなさい。
>>310 間違えた。(1)のs^2はただの標本分散(20で割る)の方。
312 :
助けて頂けませんか? :04/02/03 18:42
295です >>310・311さん御指導有難う御座いました。 ダメもとで解いてみます。 >>皆様 既出の同じ質問をして、 自作自演に取られる様に感じさせてしまい失礼致しました。 不快な気分にさせてしまい、 大変申し訳御座いませんでした。 最後に、295・297・306・307は自分が書いたものですが、 それ以外は自分のではない事だけを記しておきます。
馬鹿ばっかの学部だな。
314 :
132人目の素数さん :04/02/04 05:31
母分布がN(μ、2^2)であるとき、これからサイズ100の標本を抽出したところ 、標本平均 _ 100 X=1/100狽wi i=1 は8.5であった。信頼度95%で母平均μの信頼区間はいくらのか 求めよ!! 全く分かりません!!誰か解いてください!!お願いします!!
315 :
132人目の素数さん :04/02/04 05:42
,..-──- 、 /. : : : : : : : : : \ 冒 /.: : : : : : : : : : : : : : ヽ l l ,!::: : : :,-…-…-ミ: : : : :', ./〜ヽ{:: : : : :i '⌒' '⌒' i: : : : :} ________ |__| {:: : : : | ェェ ェェ |: : : : :} / . .||ポサ.|| { : : : :| ,.、 |:: : : :;! < うわゎぁぁぁぁぁっ /|.l ン||_.ヾ: :: :i r‐-ニ-┐| : : :ノ \ |  ̄ -!、 ゞイ! ヽ 二゙ノ イゞ‐′  ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ | −! \` ー一'´丿 \ ノ ,二!\ \___/ /`丶、 /\ / \ /~ト、 / l \ / 、 `ソ! \/l::::|ハ/ l-7 _ヽ /\ ,へi ⊂ニ''ー-ゝ_`ヽ、 |_厂 _゙:、 ∧  ̄ ,ト| >‐- ̄` \. | .r'´ ヽ、 ,ヘ \_,. ' | | 丁二_ 7\、|イ _/ ̄ \ i \ ハ |::::|`''ー-、,_/ /\_ _/⌒ヽ _________________________________________________ このスレを見た人は、10年以内にかならず氏にます。 でも、逃れる方法はあります、 ※10日以内に20箇所のスレにこれをはるのです。 すみません、僕、氏にたくないんだす
316 :
132人目の素数さん :04/02/04 13:04
どなか次の問題よろしくお願いします。 ある商店街における従来の平均駐車時間は42.5分であるという。 最近、平均駐車時間が長くなっているとして駐車場を拡張する計画が出された。 拡張にはそれなりの費用がかかる。 果たして本当に駐車時間が長くなったかを調べるため、 ランダムに36枚の入出力記録用紙を調べたところ、平均は46分であった。 今までの経験から標準偏差は7.6分であることが分かっている。 拡張計画を推進するかどうか、統計的な見地から判断しないさい。
317 :
310 311さんへ :04/02/04 15:46
本当にご指導ありがとうございます。 もしよければ解説付きで全回答していただけないでしょうか。
キタ━━━━━━(゚∀゚)━━━━━━━!!!!!
319 :
310 311さんへ :04/02/04 16:51
おねがいします
320 :
310 311さんへ :04/02/04 17:10
もう一度お助けください
>>317 >310に書かれている文章が読めないのか?
>これで何が何だか分からないようだったら素直に単位落としなさい。
322 :
310 311 321さんへ :04/02/04 17:37
自力で解くことができました。 御指導有難う御座いました。 不快な気分にさせてしまい、 大変申し訳御座いませんでした。 最後に、317・319・320は自分のではない事だけを記しておきます。
323 :
132人目の素数さん :04/02/04 17:43
アホばっかりだな
324 :
132人目の素数さん :04/02/04 18:16
すいませんお願いします。 区間[-1/2,1/2]を台に持つ一様分布をXとしたときに Xj〜f(x)をすべて独立として、 その和の平均z2=(x1+x2)/2 ,z3=(x1+x2+x3)/3 のp.d.f.を求めろという問題なのですが。
>>324 問題がおかしいだろ。
そもそも日本語になってない。
>>314 分散既知の正規母集団の平均の信頼区間(x~-u(ε)σ/√n,x~+u(ε)σ/√n)に代入するだけ。
>>316 帰無仮説 μ=42.5、対立仮説 μ>42.5とおいて正規母集団の平均の分散既知の場合の片側検定。
x~>42.5+u(ε)σ/√nで仮説を棄却。
仮説が棄却されれば長くなったと言え、拡張計画を推進するべき、となる。
>>324 普通に変数変換なり、P((X+Y)/2<z)を求めて微分するなりして求めりゃいいが、かなりめんどくさい
場合分けが必要。
Z2=(X1+X2)/2は、f(z)=2(1-2|z|) (-1/2<=z<=1/2)かな。
Z3はかなりめんどくさい。がんばれ。
327 :
132人目の素数さん :04/02/05 17:57
数学は全くの初心者の実家が手打ちのそば屋で働く者です。 うちでは蕎麦粉8割、小麦粉1.5割、中力粉0.5割の割合で粉を混ぜます。 このできたものが完全に混ざり合っているかを証明する方法ってありますか? なんとなく毎日蕎麦を作っていて、ふと気になったもので。 統計とは関係ないのでしょうか?
>>327 小麦粉と中力粉がどう違うのか説明せよ。いずれにせよ
数学はこの問題には無力。熱力学のエントロピーの
概念が近いが、それでも意味のある結論は出ないだろう。
割り粉に食紅で色をつけることでもできれば、それを混ぜて実験
できるが、粉に色をつける方法を思いつかない。水かけたらアウト
だしね。顕微鏡で見る手もあるが(小麦粉の粒子が大きいはず)
混ぜ方の良否はわからないだろう。
うん、あれ何度かきまぜたら混ぜ終わったといえるのか、よく
わかんないんだよね。昔の本職は材料を桶にいれて木の棒で
何度も何度もかきまぜたそうだ。
>>324 問題の表記に変なところがあるが、問題自体は自明(というか、
よくあるやつ)なので、結果だけ出しておく。2変数の和の
pdfは三角分布(3角形)になる。底辺は [-1/2, 1/2] で面積
は1だから、高さはわかるよな。3変数の和はそれを少し崩した、
放物線を3個組み合わせた形になる。だんだん正規分布の形に
近づく。計算するには、分布をフーリエ変換してn乗して、
逆フーリエ変換するのだ。
>>328 レスありがとうございます。
やっぱり統計学とは関係なかったんですね。
蕎麦ではないんだけど、昔聞いた話でなにかを混ぜた時に四等分して、
一つを更に四等分した物をサンプルにすると混ざり具合がわかると
聞いたことがあったんです。
こういうのは学術的になんて言うのか知りたかったというのもありまして。
小麦粉と中力粉の違いってのはウチでの単に呼び方で小麦粉=強力粉
ってことです。スマソ。
ちなみにそれらの違いは粒子の大きさだけです。
>>330 中力粉と強力粉の違いなら、そりゃ粒子の大きさじゃないぞ。
グルテン(たんぱく成分)の含有率の差だ。これ以上はスレ違い
にて省略。
4等分うんぬんは、一回の攪拌操作でどれだけの混合がなされて
いるかを定量化する試みだろう。木鉢に粉が 1kg 入っているとし
て、一回の攪拌ではそれを 100個に分割する、言い換えれば 10gの
小部分に分割する操作と仮定する。操作を n回くりかえして、結果
が粉の粒子の体積くらいまで分割されれば完全に混合されたと
いえるだろう。もし粉の 1粒を 1μgとすれば、
log(10^9)/log(10^2) = 9/2 = 4.5 で、4〜5回の攪拌でまざって
しまう。けっこう早いものだね。
332 :
132人目の素数さん :04/02/06 14:54
すみません、質問いいですか? わからない問題スレで誘導されました。 f(x)=exp[-(x-x_i)^2/2σ^2 + k*x] というガウス型の関数の規格化をしたいんですが、手ほどきお願いします。
333 :
132人目の素数さん :04/02/06 16:07
>>332 まず、指数の部分を平方完成する。
-{(x-x_i)^2/(2σ^2)} + k*x
= -(1/(2σ^2)) { (x-x_i)^2 -(2σ^2)kx}
= -(1/(2σ^2)) { x^2 -2(x_i +kσ^2)x +(x_i)^2}
= -(1/(2σ^2)) { (x -(x_i +kσ^2))^2 -(2x_i kσ^2 + (kσ^2)^2) }
= (1/2){ 2 x_i k +(k^2)(σ^2)} -(1/(2σ^2)) (x -(x_i +kσ^2))^2
これの前半はxに関係無い項
f(x)=exp[-(x-x_i)^2/2σ^2 + k*x]
= exp((1/2){ 2 x_i k +(k^2)(σ^2)} ) exp(-(1/(2σ^2)) (x -(x_i +kσ^2))^2)
y = x -(x_i +kσ^2)/((√2)σ)と置けば
f(x) = exp((1/2){ 2 x_i k +(k^2)(σ^2)} ) exp(-y^2)
なので、普通のガウス積分を使って正規化できる。
>>333 ご丁寧な解説有難う御座います!
これで確率、期待値が計算できますぅ!
>>326 遅くなりましたがどうもありがとうございます。
よろしければ次の問題もよろしくお願いします。
アメリカのある州の警察学校の女子生徒が、体育科目の男女合格率に
差があるとして雇用機会均等条例違反で訴えた。
女性は9人中6人が合格し、男性は37人中34人が合格した。
条例には、雇用昇進に関する各種のテストにおいて男性の合格率が
著しく高くならないように男女の合格率の許容される比を0.8と定めている。
果たしてこの科目に性差別があるといえるか。
また、合格率の許容比が1のときはどうか。
336 :
132人目の素数さん :04/02/07 14:14
非線形混合モデルのレベル3ランダム効果の分散を、ラプラスでの近似に成功 したヤシはいるのだろうか?
反応なしか...ちょっと質問の出し方が唐突過ぎたか。 それではもうちょっと詳しく。 3レベル非線形混合モデル(Nonlinear Mixed Model)でロジットをリンク関数として 使っている。レベル1でのひとつの係数をランダム係数とし、レベル2で その係数を(固定効果+ランダム効果)とし、ランダム効果の分散を推定 する。さらにレベル2の固定効果をレベル3でまたまた(固定効果+ランダム効果) とし、ランダム効果の分散を推定する、というモデルなのですが... 一般的にはPQL (Penalized Quasi-Likelihood) で推定するのが早いけど、 バイアスが生じる。そこでラプラス方程式を応用して近似すると、 かなり推定値が良くなる。レベル2の分散の推定ではそれが応用された例が HLMというソフトだ。 で、レベル3にラプラス近似を成功した人はいるのか?というのが質問だ。 もちろん質問するくらいなのでHLMでもレべル3の分散にはまだ応用して いない。 もちろん正統な最尤法でえっちらとやれば、よい推定値が出るのだが何しろ遅い。 PQL+ラプラスで数分のものが最尤法では2、3日かかる。 何かこれに関して知っている人はいませんかぁ?
338 :
132人目の素数さん :04/02/08 12:03
下のような計画(例)で薬剤の有用性を判定したいのですが。 ある疾患を患っている患者を40名集め、その患者に対して薬剤Xを投与する。 投与前および投与1週間後に下記のスコア表に基づき、重篤度を判定する。 (1.微弱 2.軽度 3.中程度 4.やや重篤 5.かなり重篤) 薬剤Xの投与が疾患に対して有効であるかどうかを検定せよ。 データ例 投与前 投与1週間後 3 2 4 2 4 3 5 3 4 1 4 5 3 1 …… …… 調べたところ、対応のあるt検定(1標本t検定)のノンパラメトリックバージョンの 検定をすればいいと分かりましたが、マン・ホイットニー検定は対応の無い検定(2標本型)にしか対応していないので、 ウィルコクソンの符号付順位和検定を使うのが妥当でしょうか?
339 :
132人目の素数さん :04/02/08 15:41
age
質問よいでしょうか。 部分空間へ射影したときの平均二条誤差を最小にする主成分分析で、 サンプルになるベクトルの要素が正の値をとる場合、 最大の固有値に対応する固有ベクトルの方向(又はその逆)に、 「必ず」平均値があると思うんですが、 あってますかね?
>>338 妥当だと思います。
ただし、その計画では、薬剤が有効なのか、時間経過や心理的効果によるものなのかが、見分けがつきません。
大げさな例をあげると、風邪の人に薬剤を投与して1週間たてば、薬剤を投与していなくても、症状は改善する、ということです。
疾患が慢性的なものであるという知見があれば、時間経過の影響は考えなくてよいでしょう。
時間経過や心理的効果を除きたければ、
A群 薬剤 B群 プラセボ マン・ホイットニーの U 検定
勉強中の身のため、ご参考まで。
342 :
132人目の素数さん :04/02/11 13:01
>>341 >>338 でつ。回答していただきありがとうございまつ。
慢性的な疾患(例えば、高脂血症や皮膚疾患や心疾患など)ならば
この方法で問題なさそうですね。
質問取り下げます。 何か根本的にわかっていないような気がします。
344 :
132人目の素数さん :04/02/12 14:35
χ二乗値が570になることってありますか? 電卓で計算しなきゃいけないレポートがあって自分で計算したら 570という数字が出てきてしまいますた…
345 :
132人目の素数さん :04/02/12 22:39
age
>>344 期待値A:1, 実現値A:18, 期待値B:1, 実現値B:18, 自由度2-1=1
χ^2=(18-1)^2/1+(18-1)^2/1= (17^2)*2=578
347 :
132人目の素数さん :04/02/13 20:08
グラフを作ったとき各プロットの有意差の有無をアルファベット を用いて表せと言われたのですが良くわかりません。 a,b,c...と書いてあれば各プロットに有意差があることがわかるのですが、 ab,bcdなどと書く意味やつけ方がわかりません。 どうか御教授下さい。 検索や文献をさがしても見つかりませんでした。
348 :
132人目の素数さん :04/02/14 00:53
重回帰分析について質問よろしいでしょうか。 今、ある機械である製品を製造するとします。 その時の機械の条件や環境の条件を独立変数として、いくつかXを取り出します。 製造された製品の物性を目的変数Yとして、回帰式を計算するとします。 たとえば、変動する条件(独立変数)を4つ取り出したとして、回帰式で 表すと、 Y=a+b*X1+c*X2+d*X3+e*X4+ε と表せます。この時の4つの独立変数X1〜X4のうち、目的変数Yに最も 影響を及ぼしている独立変数を評価する方法はあるのでしょうか? それぞれの独立変数の単位は異なるので、回帰係数で比較する事はできない と思うのですが…、どうすればいいのでしょうか? 「Yに最も影響している条件(変数)は○○です」というような評価は可能でしょうか。 駄文申し訳ありません、、、どなたか教えてください
349 :
132人目の素数さん :04/02/15 01:07
あげ
>350 影響を見る場合は偏回帰係数を標準化する必要はないのですか?
>351 標準化する必要があります。 細かいところを気にしなければ、標準化偏回帰係数を見ればよいです。 ただし、多重共線性に注意しましょう。結果がものすごく変わることがあります。 私がゴチャゴチャ言ってるのは、 重回帰分析は寄与がわかっても、因果(影響)はわからない!ということ。 回帰を学ぶ上で、寄与と因果は、しっかり区別しなくてはいけません。 影響を見るのは、因果的推測と言って、最新の研究。ま、基本は重回帰だけど。
統計学は全くの素人なのですが、疑問に思うことがあります。
http://www1.odn.ne.jp/youth-study/ このサイトで、高校生の生活と意識に関する調査というものについてです。
問7「あなたのクラスには、男子生徒と女子生徒の割合はどのくらいですか?」
という設問で、日本のデータを見ると43.9%が「ほぼ全員女子」で、
女子校のようです(男子のみは11.9%)。
そのため、
問10「あなたのクラスでは、次のことについて、男子と女子はどっちが多いですか?」
という問以下詳細15問の回答のうち、女子のデータは全て「女子が多い」となるのは、
当然のような気がします。
同じように問7のデータから、男子校(74.5%)、女子校(71.4%)から
サンプリングしたと思われる韓国のデータでは、問10の中の15問は
全て無回答の比率が50〜70%になっているのは、異性がいないので
比較できないと判断したためと思えます。
この調査の「概要」を読むと、
問10の<クラスの中の男子生徒と女子生徒の行動>についての項目で、
>日本の女子生徒は「先生によく反抗する人」「校則をよく守らない人」に対して、
>「女子が多い」と肯定するのが特徴である。
とされていますが、どうも釈然としません。サンプルのかたよりからすると、
統計上、間違った解釈ではないのでしょうか。
354 :
132人目の素数さん :04/02/17 20:54
>354 変数選択の話ですね。 予測するのには、できるだけ変数が少なく相関が高い方が良いモデルとなります。 そこで、各偏回帰係数が0かどうかを検定します。 P値は、ある偏回帰係数が0である確率を表しています。 各偏回帰係数のP値を計算してみて、大きいものから削っていき、 最もよいモデルのところで止めます。 要するに、0に近い偏回帰係数を削っていくだけです。 多分、同じ結果になると思います。(0に近いところは順番が少し変わるかも。 変数選択して、最良のモデルを作ってから、標準化偏回帰係数で解釈。 コレが1番良いかと。
356 :
132人目の素数さん :04/02/18 21:38
2336 名無しさんにズームイン! sage諏訪 New! 04/02/18 21:27 ID:BynTAKDd
うわーーーーーーーー書けるっ!!!!書けますうぅぅぅぅぅぅぅ!!!!!!!!
2337 名無しさんにズームイン! New! 04/02/18 21:27 ID:n8ilzDQ6
あ
2338 1001 New! Over 1000 Thread
このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。
2339 1001 New! Over 1000 Thread
このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。
2340 名無し募集中。。。 New! 04/02/18 21:27 ID:Ha+lJUyb
>>2000 おめ
おまいら!大変ですよ!この現象を統計学理論で説明して下さい!
W杯アジア地区第1次予選「日本×オマーン」 PART14
http://live8.2ch.net/test/read.cgi/liventv/1077105141/
357 :
132人目の素数さん :04/02/19 18:55
発生確率1/6で、試行回数10回の、標準偏差の式を教えてくだされ。
358 :
132人目の素数さん :04/02/19 19:12
359 :
132人目の素数さん :04/02/19 19:18
>>358 当たりがでる確率が1/6のくじを、10回くじ引きした場合の、
実際に起きた場合ではなく、理論的な標準偏差値の算出方法です。
質問のしかたが、悪いかもしれませんが・・・解るでしょうか?
360 :
132人目の素数さん :04/02/20 00:06
統計超初心者なので簡単な質問かも知れませんが許して下さい。 実は明日レポート提出なので・・・ 薬品Aを1000人に使ったとき、100人が副作用が出ました。 薬品Bでは1500人中、1000人が副作用がでました。 こういう場合に、統計学的に有意に薬品Aの方がよい、というにはどんな検定すればいいんでしょうか。 実際の数字はもっと確率が近いんです。 統計のソフトはエクセル統計を使ってます。 よろしくお願いします。
よーし、統計初心者の漏れが惑わす回答をしちゃうぞ。 有意に「良い」ということは出来ないが、 母比率の差の検定とかでしょうか。 間違ってたらすまそ。一回くらい答えられる人になりたかったのよ。
>353 集めた日本、アメリカ、、、のサンプルからの、 集めた日本、アメリカ、、、のサンプルの解釈としては間違ってはいないが、 そのサンプルが偏っているので、 その解釈を日本全体、アメリカ全体、、、の解釈としているところに 問題があるんではないでしょうか? 先日、TVで、 「高学歴である裁判官は、同じ高学歴の被告をひいきしている。 その証拠に、死刑になった被告のうち高学歴の者は少ししかいない。 そういう統計が出てるんです。」 とか、なんとか、言っていた人がいたが、 確かに、死刑になった被告のうち高学歴の者は少ししかいないのは正しい解釈だろう。 だが、その解釈=裁判官がひいきしている、という解釈はどうか?と。 それを調べたいならば、 高学歴の死刑になった被告/高学歴の死刑を求刑された被告 低学歴の死刑になった被告/低学歴の死刑を求刑された被告 を比較するべきだろう、と。 解釈が都合のいいように飛躍してるんですよね。 こうやって、統計の評判が落ちていくんだろうな、と思う今日この頃。
363 :
132人目の素数さん :04/02/21 00:25
実務上、重回帰分析で要因分析なんて相関関係があるから不可能ですよね?と言うか無意味ですよね?
364 :
132人目の素数さん :04/02/21 02:46
>361 おしい。。。では、補足を。 2群の母比率の差の検定は、片側検定を定義できるので、 有意に「良い」と言えます。
366 :
132人目の素数さん :04/02/21 11:27
363なんですが実際はどうなのでしょう? コンサルタントが明らかに無意味な重回帰分析をしているようにしか思えないのです。
367 :
132人目の素数さん :04/02/21 11:41
例えば民力データの 〜18歳 人口 18〜23歳 人口 23〜28歳 人口 29〜 人口 4つの独立変数と 従属変数:売上高 を使って年齢別の要因分析をするなんてどう考えても変ですよね?
>>365 そ、そっか_| ̄|○
(´-`).。oO(いつかちゃんと答えられる人になれますように・・・)
>>360 をt検定でやろうとするとどうなるんですかね?
t検定って平均値の差を検定するものだと思いこんでました。
370 :
132人目の素数さん :04/02/22 13:32
367ですが私の質問はDQN過ぎますか?
>367 363で >実務上、重回帰分析で要因分析なんて相関関係があるから不可能ですよね?と言うか無意味ですよね? 相関関係があるから不可能??意味がよくわからない 相関関係がわかるだけで、要因かどうかはわからないってことでしょうか? 367で >例えば民力データの > 〜18歳 人口 >18〜23歳 人口 >23〜28歳 人口 >29〜 人口 >4つの独立変数と >従属変数:売上高 >を使って年齢別の要因分析をするなんてどう考えても変ですよね? どう考えても?実務的な意見が欲しかったのでは?理論的な意見でもいいの? どのように考えて、どこが変なのか?を示すべきかと。 質問の意図がはっきりしないことと、 実務家じゃないので、レス控えてました。
372 :
132人目の素数さん :04/02/25 17:11
本当にあほな質問で泣きたくなるのですが、 標本と母集団の違いってはっきり一言で言うとなんでしょうか。 サンプルが20個あっても30個あっても標本なのでしょうか。 どなたかお答えください。
A,B二つの工場から消費地へ製品を輸送する場合,輸送費はAから 消費地まで1トン当り6万円,Bからは1トン当り10万円かかるという。 工場の毎月の生産量はA工場は50トン,B工場は40トンである。 2工場から2工場から消費地へ合わせて65トン送りたい。輸送費を最小にするには 各工場から何トンずつ送ればよいか。 答えは分かるけど解き方がワカラン_| ̄|○ どなたか御教授願います・・・。
よーしまた統計初心者の漏れが答えちゃうぞー!
今度こそはちゃんと答えられるようになってやる!
>>372 ある集団があったときに、サンプルとして取り出したものが「標本」で、
そのサンプルを取り出せる可能性をもつ物全てが「母集団」かしら。
一言で言うと、「母集団から取ったサンプルが標本」。
自分で読んでて何言ってるかわからんなぁ(^^;
20個30個あったとしても、それが集団の全てで無い限りは標本です。
>>373 線形計画法で解けるはずなので解いてみます。
>>373 あれ?線形計画法以前の問題?
その条件だとA工場に最大量わりふったほうが安い?
何か別条件無いのかしら。
>>375 線形計画法の問題なんですけど,これ以外他の条件無いんですよ。
おっしゃる通りAに最大量割り振った方が安いと思うんですけど,
線形計画法用いての課程が分からなくて・・・。
やっぱ漏れが初心者過ぎて何か考え違いしてるのかなぁ・・・ こんなんじゃだめかしら? A工場から x (トン)、B工場から y (トン)送る 輸送費を k とします。すると、 x + y = 65 ・・・(1) 6x + 10y = k ・・・(2) x =< 50 , y =<40 ・・・(3) が成り立ちます。 (1)をグラフで書くと y = -x + 65 上で [25,40]から[50,15]までになります。・・・(4) ここで(2)式は y = -3/5 x + 1/10 k ・・・(5)より、 (4)と(5)が重なる範囲内で、kが最も小さい時を選べば良いのです。 従って、(50,15)の時にkが最小となり、 「輸送費はA工場から50トン、B工場から10トン送ったときに最小となる」 が導かれます。
>>376 あ、やっぱりこれでいいんですか。
ってことでこれを参考にして下さいヽ(´ー`)ノようやく答えられた
座標を表す括弧が[ ]と( )でありますけどまぁ気にしないで下さい。
379 :
132人目の素数さん :04/02/25 20:07
>>377-378 解説ありがとうございました!
似たような別問題があるのでそっちをこの方法でやってみます!
いえいえ、またわからなかったらどうぞヽ(´ー`)ノ
って
>>377 、最後の最後で間違えてるな_| ̄|○ B工場から15トンね
>374 おしぃ。母集団と標本について補足を。 母集団から無作為に(ランダムに)抽出したものが標本です。 あと、わかりやすいように英語。 (parent) population 母集団 sample 標本 random sampling 無作為抽出
374さん、381さん、丁寧な解説ありがとうございました。 と言うことは、母集団か標本かを見分けるには、数を見るのではなく 内容を見るのですね。抽出したと書いてなければ、母集団として 判断してもいいのでしょうか。車の例などは、10個であれば標本だと わかるのですが(世界には10個以上車があるから・・・ですよね?) たとえば、バスケットボールの点数などはどうなんでしょうか。 10回バスケットボールの記録を測れば、その10回は母集団に なると考えていいのですか。よろしくお願いします。
>381 すいません、間違えました。 標本=母集団から抽出したもの 標本は母集団から無作為に抽出されなければならない、でした。 >382 まず、 母集団=知識・情報を得たいと考えている対象の全体 バスケットボールの点数の知識・情報を得たい。 バスケットボールの点数の全体は、0〜∞。 母集団は、バスケットボールの点数0〜∞。 標本は、10個。 標本から母集団を推定。 有限母集団、無限母集団の話と、 母集団と標本の関係の話が絡んでます。 上は無限母集団の場合です。次に、有限母集団の方を考えてみましょう。 1シーズンのバスケットの点数の知識・情報を得たい。 1シーズンのバスケットの点数の全体は、そのまま。 母集団は1シーズンのバスケットの点数全体 標本をいくつかとる。 標本から母集団を推定。 結論、標本からじゃなくて、目的から母集団を決めましょう。 一般的なバスケットボールの点数を調べたければ、その10回は標本。 その10回のバスケットボールの点数を調べたければ、その10回は母集団。
381さん、詳しい解説をありがとうございます。 これですっきりしました。くだらない質問にお付き合いくださって 本当にありがとうございます。ここに来てみて良かったです。
385 :
自由度n-1 :04/02/28 11:00
初歩的な質問、且つ以前もこの手の話はでてきていたと思いますが、 自由度n-1の定義について、教えていただきたいと思います。 「n-1個の偏差を与えると残り1個は自動的に決まる」ようなことが 参考書に書かれてありますが、どうもピンと来ません。 具体的にはどういうことなのか、わかる方がおりましたら、 ご説明いただきたく思います。 宜しくお願いします。
よーし今度こそ。 例えばn個のバラバラな数字(X1〜Xn)があったとすると、 それらから平均値mが決定されますね。 さて、逆に、平均値mを固定したまま(X1〜X(n-1))の数字を 自由に動かす、つまりn-1個の偏差を与えたとしても、 平均値mは固定されたままですから、最後の一個は逆算から自動的に決まります。 なぜならn個の数字の合計値は必ずm×nになっているからです。 合計値がm×nで、しかもn-1個の数が全て分かっていれば最後の一個は引き算で出せますよね。 やっぱおいら日本語下手だな(´・ω・`)統計以前の問題だ
387 :
自由度n-1 :04/02/28 18:59
>>386 さん、ありがとうございます。
>平均値mは固定されたままですから、最後の一個は逆算から自動的に決まります。
だいたいイメージはつかめました。
それでは、なぜ平方和などをn-1で割る必要があるのでしょうか。
nではなぜだめなのでしょうか。
宜しくお願い致します。
>>387 どういたしまして。つたない日本語ですいません。
さて、今度は不偏分散についての質問ですね。
これに関しては、以前学校でレポートの課題として出されて、
おいらもだいぶ頑張って(ネットからパクリながら)解説を書きました。
ttp://trao2go.hp.infoseek.co.jp/toukei1.pdf [4 分散と不偏分散]のところと[6 余談(理由)]が役に立つかと。
恥ずかしいので今日の夕方くらいまでに消してしまう予定です。
あと、統計の先輩方、間違ってたらご指摘よろしくお願いいたします。
389 :
132人目の素数さん :04/02/29 08:37
>388 ほとんど完璧ですな.では,ちょいちょい修正を. おかしいところは, 1.母平均μの説明が入っていない. 2.母分散σ^2は,ひとつの決まった値なので小文字だが, 標本分散と不偏標本分散は,確率変数なので,大文字. 3.母分散は値なので不偏母分散というものはない.不偏=不偏推定量. 多分, 母平均,母分散は値.標本平均,標本分散,不偏標本分散は確率変数. がごちゃごちゃになっていると思います. 母平均=E[標本平均],母分散=E[不偏標本分散]です. 母分散が未知だから,標本から母分散を求めたい. 平均が母分散になる,できるだけ分散の小さい推定量を見つけたい 証明したいのは, E[不偏標本分散]=E[n/n-1 標本分散]=母分散 前の=は不偏標本分散と標本分散の定義式を見ればすぐわかる.
390 :
132人目の素数さん :04/02/29 08:39
(続) 手直しすると,(注意.X~は標本平均のつもりです. 余談の最初に, 「母平均μ,母分散σ^2の母集団から,無作為にX1,X2,...,Xnを抽出すると, X1,X2,...,Xnは,平均μ,分散σ^2の独立な確率変数となる. よって,E[Xi]=μ,V[Xi]=E[(Xi-μ)^2]=σ^2 (i=1,2,...,n)」 を入れて, E[S^2]=.............=1/n Σ(E[(Xi-μ)^2]) -E[(X~-μ)^2] =1/n ΣV[Xi] -V[X~] ここで V[X]=σ^2 V[X~]=....=σ^2/n よって E[S^2]=...=(n-1)/n σ^2 よって, 母分散=n/(n-1) E[標本分散] また, E[不偏標本分散]=E[n/n-1標本分散]=母分散 ということは,不偏標本分散の平均は母分散になる. よって,不偏標本分散は母分散の不偏推定量
391 :
自由度n-1 :04/02/29 09:37
>>388 ,389さん、あるがとうございます。
大分頭の中が整理されてきました。
つまり、言葉で表すと、
偏差平方和をnで割ると、かたよりをもってしまうため、
標本分散が母分散の不偏推定値であるためには、n-1で
割る必要があるということでしょうか。
ただの分散と不偏分散が頭の中でごっちゃになっていたようです。
392 :
自由度n-1 :04/02/29 09:46
>>391 訂正
分散=標本分散でしたね。
そうしますと、不偏標本分散が母分散の不偏推定量であるためには
n-1で割る必要がある、となるのですね。
失礼いたしました。
393 :
132人目の素数さん :04/02/29 18:40
>>352 遅レスだけど、
>ただし、多重共線性に注意しましょう。結果がものすごく変わることがあります。
注意しましょうと言うよりは、実務上、説明変数が3個以上あるとマルチ湖は避けられない。
標準化偏回帰係数を見ても意味がないのがほとんど。
394 :
132人目の素数さん :04/02/29 19:13
重回帰分析で要因分析は無理ってことか・・・・・
>352 相関の高い説明変数を削って、変数選択しててからでも、意味ないのでしょうか? 各説明変数の相関が低ければ、標準化偏回帰係数の意味があると思うのですが。 でも、削った説明変数の解釈に困るか。。。 共分散構造解析とかするんでしょうか?
>352じゃなくて>393です。
>>389 ご指摘ありがとうございます。
>母平均,母分散は値.標本平均,標本分散,不偏標本分散は確率変数.
>がごちゃごちゃになっていると思います.
まさにその通りでした・・・
いやはや、統計初心者を脱却するにはまだまだ時間がかかりそうです。
>>391 =392
そういうことだと思います。
ではPDFは消してしまいますね。
相関の高い説明変数をいくら削っても、残った変数の相関係数はゼロじゃないでしょ? それが2,3個だったらまだいいけど、それ以上になったら標準化偏回帰係数を見ても無駄。 事前に主成分分析をかましたりするんだけど複雑になりすぎる。
なるほど。 主成分分析をかませば、相関0の説明変数を作れて、 それから、重回帰にかけて、 第1主成分、第2主成分、…の偏回帰係数を比較、 最も寄与の大きい説明変数はどれか?と言われると、困りますね。 だいたい、X1とX2が相関があれば、 X1の寄与が大きくなればX2の寄与も大きくなるから、 X1とX2の寄与が大きい、つまり、 説明変数の合成変数で出てくるのは、当然か。。。
>348 今さらながらに思うと、 標準化した目的変数と各説明変数を単回帰にかけて相関係数を比較し、 最も相関の高い説明変数は、コレです。 と、言っても良かったのかも知れない。。。 2番目3番目と言われると困るが。。。どうなんでしょう?
401 :
132人目の素数さん :04/03/02 20:59
ただの興味本位なんだけど、学生?実務家?
学生です。
403 :
132人目の素数さん :04/03/03 23:54
無作為標本についてお聞きしたいことがあります。 ある母集団のある薬の服用について調べたいときに、 その母集団の人々のリストを全て持っているとします。 当然ながら、どの人が服用していて、 どの人が服用してないかはわかりません。 その母集団のリストから無作為抽出にて標本を定めて、 その標本の方々に対して面接にて調査を行ったとします。 その際に、服用していないという方は、調査をやめにして、 服用しているという方のみに調査をして、調査結果をまとめたという、 この結果っていうのは、無作為標本に基づいた結果と言えるのでしょうか? 服用していない方には調査をやめにした、というところがひっかかって、 でも、その薬の飲む頻度とか服用期間とかを知りたい場合は、 服用していない人々に聞いても仕方がないので、っていう考え方もあるし、 果たしてこれって無作為標本に基づくのだろうかっていう疑問が出てきたのです。 説明をつけて教えて下さると幸いです。 よろしくお願い致します。
自信持って答えられるほどじゃないので、参考程度に。 まず、 母集団=知識・情報を得たいと考えている対象の全体 です。 もちろん、母集団が、”そのリスト上の人々”で、 途中で調査をやめるというのは、無作為標本ではありません。 しかし、母集団=”薬を服用しているそのリスト上の人々”と設定すると、 母集団からの無作為標本になると思います。
405 :
132人目の素数さん :04/03/05 14:00
多次元尺度法でお手本になるようなプログラムソース どこかにないかなと探してます。 C/C++だと一番読みやすいんですけど、知ってる方 いましたら、よろしくご教示ください。よろすく
406 :
132人目の素数さん :04/03/09 01:44
g
128
408 :
132人目の素数さん :04/03/09 21:09
大変抽象的な質問で申し訳ありません。以下の質問に答えて頂ければ 幸いです。 ある検査機の不良品感知センサーが正常に作動しているかどうかを 確認するための実験を行いたいと考えております。実験の内容としては、 既知の不良品を良品に混ぜて、それを検査機に流し、既知の結果が得られる かどうか、というものです。センサーが正常(異常)である、と言えるためには、 どのような実験系を組めばよろしいかと思いますでしょうか? 当方、統計の知識に乏しく、質問も的外れの気もしますが、 よろしくお願い致します。
409 :
132人目の素数さん :04/03/10 13:23
区間推定の式に関する質問です。x系列とy系列があって(x,y)のサンプル とって、M次の多項式回帰したとすますね。つまり回帰式が y=a0+a1*x+a2*x^2+.....+aM*x^M でこの式から、あるxに対するyを推定するとします。 これ区間推定で y+-δ のように求めたいのですが、 δ=t_α/2*Se ですよね。 で、それはいいのですが、Se(予測誤差の分散ていうの?) どうやってもとめるのですかね。 Se=(Σ(y_hati_yi)^2/(N-2)*(1+1/n+(x-x_mean)^2/Σ(xi-x_mean))^2))^0.5 ってのあったんですが、これって回帰式がy=a+bxとかの時だけ の気がするのですが、、、、何言ってるか分かる賢い人いたら 多項式の場合のSeの式教えてください。
410 :
132人目の素数さん :04/03/10 13:57
↑ y_hati_yi ---> y_hat(回帰式からのy)- yi(実際の値)
>>408 それって全数検査なの、それとも抜き取り?
412 :
132人目の素数さん :04/03/10 15:19
412
>>411 さん、
全数検査で考えております。
要は的中率を求めるもので、センサーの精度を見たい訳です。
宜しくお願い致します。
すいません、数学嫌いなもんで、ちょっと検討がつかないので質問します。 サンプル集団が二つあるとして、その分散の違いを見たいのです。 単純に不偏標準偏差をもとめて比較する以外に方法はありますか? サンプルのデータのエラーを考慮して比較するぐらいしか思いつきません(涙)
415 :
132人目の素数さん :04/03/22 15:58
浮上
416 :
オラウータン :04/03/22 15:58
ある集団の平均とその部分である集団の平均が違うとき、それが偶然では なく違うってのは、どう計算したら良いのでしょうか?
両方とも正規分布に従うと仮定し、両方の平均が 同じである場合に、実際にそれだけのずれが出来る 確率を求めて、余りにも小さかったら(1%以下とか) 恐らく何か理由があって平均が違うのだろう、と 言うことになる。帰無仮説棄却。 あとは灯台出版会の本で勉強すれ。
>>414 何がしたいのかそれだけではサッパリわからんが、
等分散性の検定をすればいいんじゃない?
そういう意味じゃないのか?
419 :
132人目の素数さん :04/03/23 01:17
>>408 2週間前だからもう調査したのかもしれないけど、
測定器の精度を調べるのにはMSAって方法が一般的となっている。
ISO9000準拠。
(R&R/TV)*100 (%)
420 :
132人目の素数さん :04/03/24 01:31
サイコロの目の出方がちゃんとしてるかどうか調べるには どうやって調べればいいのでしょうか? たとえば 1 1 1 2 2 2 3 3 3 4 4 4 5 5 5 6 6 6 って感じで目が出たとすると、 各目の出る確率は1/6で正しいのですが、 目の出方が普通じゃないですよね? 順番に出てる。もっとランダムに出るべきなのに。 こういうのをおかしいって判定することはできるのでしょうか?
母比率の検定では無理な気がするが… 普通にプロットして考えるといいのでは? c管理図の要領。 「周期的に同じ傾向が現れる」というのは、 管理図では異常の可能性ありとみなす。 他には、 14連続交互増減、平均値以下(以上)が4連続以上出現、 連続6点増加(減少)、±1σ領域に点が集中(サイコロなら3,4) このあたりは実際にどれほど起こらないか、 自分で確率を計算すればわかると思う。
ごめん
>>420 最初の2行と最後の1行だけしか読んでなかった
425 :
132人目の素数さん :04/03/25 19:55
すいません、さんざん既出とは思いますが、統計学を学ぶにあたってバイブルや良書はありますでしょうか? 携帯なので過去ログは勘弁して下さい 私はまったくの統計学初学者です できれば返答お願いしますm(__)m
426 :
132人目の素数さん :04/03/26 00:51
統計学入門 東京大学教養学部統計学教室編 東京大学出版会
>>426 ありがとうございます!
早速明日探してきますm(__)m
428 :
132人目の素数さん :04/03/27 01:56
統計学を学ぶ先輩方に質問なのですが、 大学でやるような問題ならだいたい解ける、というレベルに達するまで一日何時間勉強して何ヵ月(または何年)かかりましたか? もちろん個人差があると思いますのでだいたいで結構です 小学生みたいな質問ですが、これからの勉強の指標にしたいのでお願いします
「大学でやるような問題がだいたい解ける」という書き方が本当に小学生みた・・ゲホンゲホン とりあえず高卒程度の知識があるのなら、 1.一般教養課程で統計学の単位をとる→1〜2日 2.専門課程で統計学の単位をとる→数日 3.数学科以外(経済、工学、農学等)で統計学の知識を利用した論文を書く→数日〜数週間 4.数学科で統計学をテーマとした論文を書く→数ヶ月〜数年 ぐらい?誰か適当にフォローして。 因みに1と2は「本質的な理解をしてなくても単位が取れればいい」という場合の日数ねw
430 :
132人目の素数さん :04/03/28 01:28
基地外な宿題に答えてください。 20回サンプルされました。平均は10.432、標準偏差は3.237ですた。 (あ)98%信頼区間を求めよ ←こんなのはまあいい (い)信頼区間を+-0.001にするには何回サンプル取ればいいか? は?そんなん莫大なサンプル数になると思うんですが、、、 これはt分布表使うやり方でいいんですよねえ。 サンプル数変わっても平均と標準偏差は一定と仮定でいいんでせうか? 莫大な答えになって、こんなんでいいのかと思わせる問題はやめて いただきたいのだが、、、
計算してないから莫大って言うのがどれくらいか分からんが、 時間空間コストの現実性は対象依存だろ。
432 :
132人目の素数さん :04/03/28 17:14
大数の法則か。
433 :
132人目の素数さん :04/03/30 16:01
すいません、質問します。 一様最小分散不偏推定量と最小分散不偏推定量についての 違いというのはあるのでしょうか? 本によってはどちらかしか載っていなかったので、 ちょっと気になりました。くだらない質問ですがお願いします。
434 :
132人目の素数さん :04/03/30 18:08
>>425 どういう人かわかりませんので、
>>426 の東大出版会の
本でもいいかと思いますが、それが難しいようでしたら、
「はじめての統計学」鳥居泰彦著もよろしいかと思います。
社会人の人や、普段数学を全くやっていない学生に統計学を
したいと聞かれたときには、こっちのほうを勧めています。
>>435 あー、再アップしときました。
前回指摘された部分は直してません。
ご存じかと思いますが、もともとは分散用に書いたので、
適宜読み替えて下さい。
アップありがとうございます 早速、拝見させていただきます
438 :
132人目の素数さん :04/04/03 15:25
医学的な評価(かなり重篤・重篤・やや問題あり・問題なし等)の解析を する場合 かなり重篤:4 重篤:3 やや問題あり:2 問題なし:1 のスコアを重篤度に割り当てて 処理前と処置後を比較する場合(1群比較)⇒ウィルコクソンの符号付順位検定 実薬とプラセボを比較する場合(2群比較)⇒マン・ホイットニー検定(ウィルコクソンの順位和検定) でOKですか? また、スコアの割り当て方はこのように単純な割り当て方で大丈夫でしょうか?
誘導されたのでこちらへ 例として言えば 1/100=100/10000 ↑数学上は=なんでしょうが実際問題同じじゃないと思うのです たとえば、なにか揉め事があったとして 100人の中の1人が自分の味方をしてくれるのと 10000人の中の100人が自分の味方をしてくれるのでは全然違うと思いませんか? 10発のうち1個玉が入ってるロシアンルーレットと 100発のうち10個玉が入ってるロシアンルーレットどっちを選びますか?
440 :
132人目の素数さん :04/04/04 17:19
441 :
132人目の素数さん :04/04/04 18:15
>>439 数学上はではなく
そこでの = は、平均値が等しいという意味。
何が等しいと言っているのかを指定しないと
意味がない。
例えば、単位の違うもの、
長さ = 面積
みたいなことはしてはいけないでしょ。
数学上でも、こういうのはしてはいけない。
割合とか、確率とかが等しいか否かというのは
平均値だけでは決まらないので
違うものだと感じるのも仕方ない。
442 :
132人目の素数さん :04/04/09 23:06
SDEに関する推定の問題って扱ってる人知ってますか? ファイナンスで使いたいんですが・・・ あと,ジャンプのあるやつとか,推定できるんですか?
443 :
132人目の素数さん :04/04/11 04:53
最小二乗法(多項式近似)に関する質問。 ちょっと数学的センスが必要かも。 あるデータを多項式で近似しようとして、丸ごとだと、あんま近似よくない から、区間をいくつかに分けてそこで多項式近似するとします。 区間の境界の点どうしますかね?区間ごとの多項式曲線無理やりつなげるの はさすがによくない気がしますが。。。 正解は一つではなくてようはアイデアの問題でしょうが、 なかなかいいアイデアが浮かばない。。
444 :
132人目の素数さん :04/04/13 03:56
>443 ひとつのアイデアとしては、 X1<境界点X2<X3で、予測がx<X2でf(x)、X2<X3でg(x)のとき、 X1<x<X3の予測を f(x)*p+g(x)*(1-p) ただし、p=(X3-x)/(X3-X1) と重み付けしてやるとか。 滑らかにしたかったら、場合分けの範囲を被らせてやるとか。 でも、滑らかにしすぎると、場合分けした意味がなくなる予感。
445 :
132人目の素数さん :04/04/13 04:41
>442 専門じゃないので、かじっただけですが、 多分、SDE=Stochastic Differencial Equation(確率微分方程式) のことだとして、とりあえず、 ファイナンス,確率微分方程式、(ジャンプ) で、ぐぐってみると、どれだけの人がやってるかわかるかと。 伊藤さん、ブラックショールズさんとか余裕という人なら、すいません。
446 :
132人目の素数さん :04/04/13 19:38
>443 区分の境界点で、推定値が連続した値をとるようにした関数で、 スプライン関数というのがあるそうな。 ノンパラメトリック回帰の分野になると思われます。 カーネル関数を用いて局所的にやる方法もあるらしい。
447 :
132人目の素数さん :04/04/13 21:29
凸包の中から一様にサンプリングするアルゴリズムを 誰か考えてください。 お願いします。
448 :
132人目の素数さん :04/04/14 02:31
>438 昔は、1群比較でやっていましたが、今は、 処置前と処置後を比較する場合(1群比較)は、 治療以外の要因による見かけの治癒、軽快 例、心理学的作用(患者側、医者側ともに)、自然治癒軽快など、 による要因の作用を取り除けないので、 やはり、対照群を置く、2群比較でデザインするようです。 要するに、1群比較だと、治療以外の要因じゃないんですか?と突っ込まれても 反論できない。>意味ないじゃん スコアの割り当ては、それだけじゃ、なんとも。 まぁ、普通はそれでいいと思いますが。
449 :
132人目の素数さん :04/04/14 02:45
>447 何がやりたいのかイマイチわからないんですが、 凸包の中の点に番号ふって、同じだけクジつくって、ひいて、その番号の点をサンプリング、とか まぁ、PCで乱数発生させて、やるんだろうけど。
450 :
初学者です。 :04/04/14 21:13
多変量解析を1から勉強し始めたいと考えています。 ひとまず、深い内容は置いておき、「多変量解析で 何ができるのか」からまず知りたいと思っております。 どんな本から勉強すればよいのでしょうか。 お詳しい方おしえていただけないでしょうか。 お願いします。 ちなみに統計学は初歩程度の知識しかありません。
451 :
132人目の素数さん :04/04/17 11:41
ベイズの定理が載ってる確率に関する良い書籍って無いかなぁ?
452 :
132人目の素数さん :04/04/17 11:52
>>451 基本的な定理なので、大抵の本には載っています。
統計の本で
「統計学入門」東京大学出版会
あたりから読むといいかと思います。
確率論の本は、素人には難しいのであまりオススメしません。
一般の人がイメージするような確率は大抵は統計学です。
数学でいうところの確率論は、大学で学ぶ基本的な数学を知らないと理解できません。
453 :
132人目の素数さん :04/04/17 11:58
なるほど、確率論と統計学は違うと…なるほどなるほど
どなたか教えて下さい。 ベイズの定理を使った解と、ミニマックス法を使った解が 一致するという定理があったと思いますが、名前を忘れて しまいました。 hall-steinの定理とか、なんとか、そういった雰囲気の名前 だったと思うのですが、はっきりと思い出せないのです。 よろしくお願いします。
455 :
132人目の素数さん :04/04/17 12:25
ここで質問するのは場違いかもしれませんが、
http://www.fsa.go.jp/inter/bis/bj_20010117_1e.pdf のP101の426の算出式をEXCELの統計関数を利用して
算出しても、ドキュメントの通りになりません。
EXCEL算出式(PD=0.2)
976.5*NORMSDIST(1.043*NORMSINV(0.2)+0.766)*(1+0.47*((1-J204)/J204^0.44))=784.3
ドキュメント=479
統計関数の使用法が違っているのでしょうか。
ご存知の方いらっしゃいましたら、教えてください。
456 :
132人目の素数さん :04/04/17 12:53
>>450 ちょっと古いけど,
・柳井晴夫・岩坪秀一『複雑さに挑む科学−多変量解析入門』(講談社ブルーバックス)
が,事例も豊富で分かりやすいです.
ただし,この本をしっかりと理解するには,行列・ベクトルの知識が必要です.
もし,上の本が難しければ,やはり古い本ですが,
・古谷野亘『数学が苦手な人のための多変量解析ガイド』川島書店
などはどうでしょうか?
なお,この多変量解析については,心理学の分野で応用が
進んでいますので,心理板の心理統計スレで質問されると
有益な助言が得られるかもしれません.
心理統計のテキストでは,私はまだ未読ですが,
・南風原朝和『心理統計学の基礎』(有斐閣アルマ)
はよい評判を聞いています.
458 :
132人目の素数さん :04/04/20 17:28
統計学はおなかがいっぱいになりまつか?
>458 応用次第では?
460 :
132人目の素数さん :04/04/21 22:03
学校の統計学の授業に全くついていけないんですけど、なんかいい本ないですか? 基礎の基礎からわかりやすく書いてる本がいいんですけど。
461 :
132人目の素数さん :04/04/21 22:08
>>460 昭晃堂
統計学
は演習本だが説明も丁寧でわかりやすい。
初学者に向いている。
理系でということになると、共立出版・数理統計学の基礎(野田一雄著)クラスだろうか。
もう全く手も足も出ないということであれば、とりあえず日本実業出版社 統計・確率のしくみ(郡山彬)
でなれることを勧める。
463 :
132人目の素数さん :04/04/22 04:13
統計は、勉強すればするほど、だまされている気になってくるのは、 気のせいだろうか?
>>460 ・文系なのか,理系なのか?今何年生なのか?
・文系であれば,大学受験で数学を勉強したか?
・「学校の統計学の授業」というのは,一般教養の科目なのか,
あるいは専門課程の科目なのか?
・今使っているテキストは何か?
といったあたりを書いてくれないと,答えようがない.
465 :
132人目の素数さん :04/04/22 17:15
xi=(X-Xm),yi=(Y-Ym),σ^2=pは既知である Σxi^2=q,Σyi^2=r,Σxiyi=v である。 Yi=α+βXi+uiのときの最小二乗推定量はa,b 1)β>0を検定せよ 2)β=1のときの第二種の過誤をもとめよ。 この2がわかりません。 かなり初歩的な問題ですみません。 P(U)=P(Hoを採択|H0が間違っている) ということまではわかるのですが 具体的に求めることはできるのでしょうか?
サンプル量は30でした。 有意水準は0.05です
467 :
132人目の素数さん :04/04/22 20:34
誘導されてきました。 統計処理が分からんす。 右手の握力を図ります。 その時、片手だけ握るのと両手一緒に握る場合の結果を処理したいと 思ってます。どこをどう処理すればよろしいでしょうか。 男子16人、女子16人を測ってます。 測定の仕方で有意差が出るかどうかからまず調べたいのでつが…
468 :
132人目の素数さん :04/04/22 20:56
>>467 >測定の仕方で有意差が出るかどうかからまず調べたいのでつが…
測定の仕方ってのは何?
有意差ってのは、何と何の差?
469 :
132人目の素数さん :04/04/22 21:21
測定の仕方 1右だけ握った場合の右の握力 2両方同時に握った場合の右の握力 (つまりは右の握力) 有意差 上記1と2の測定結果 です。はっきりいって私は統計のど素人です。 統計のサイト見てますが、よくわかりません。 迷惑でなかったら、入門に適したサイトとかも 紹介していただけると嬉しいです。
470 :
132人目の素数さん :04/04/22 22:41
近頃、確率の現実への対応問題を考えています。 統計によって導き出された仮説を現実問題へ適用する場合 ・理想的コインの裏表について、何故同様に確からしいと言えるのか。 ・ランダムサンプリングによって、何故母集団と近似できるのか。 などがありますが、これらはどうして一定の値(確率)に収束するのでしょうか? 科学哲学というか、確率の成立根拠を問うような質問になって申し訳ないです。
教えて下さい。 グラフや表を作る時に、「全体のデータ個数」という意味で「N=」と書くじゃないですか。 この「N=」って何の略なんですか?ナンバー?
472 :
132人目の素数さん :04/04/23 07:49
473 :
132人目の素数さん :04/04/23 08:54
>470 まず、統計と確率はちがいます。統計は確率を利用させてもらっているだけです。 コインの問題。 表裏各々1/2の確率で出るコインを理想的コインと定義。 現実には、コインは理想コインではないから、 帰無仮説:表裏各々確率1/2 対立仮説:表裏各々確率1/2でない 有意水準5%で検定する。 検定量が棄却域に入れば、「表裏各々確率1/2ではない」 入らなければ、「表裏各々確率1/2ではないとは言えない」 要するに、本当に、表裏各々確率1/2ならば、 100回中95回は「表裏各々確率1/2ではないとは言えない」になるということ。 もし、検定量が棄却域に入らなければ、統計的には、 「表裏各々確率1/2ではないとは言えない」と解釈します。 以下は、自分の勝手な感覚ですが、 実際に有意ならば、統計的に有意になるだろう 要するに、統計的に有意だからと言って、実際に有意とは断言できないが、 他に統計的手法よりいい手法がないから、仕方なしに使っている という感じでしょうか。そんな感じの論文を見かけたことがあります。 あと、言葉の定義が曖昧です。文系の方でしょうか。 根源的なことを問うなら、なおさら、定義を見直した方がいいと思います。
>465 2)でβ=1のとき、って言ってるから、 P(II)=P(Hoを採択|β=1) を求めてやる 帰無仮説β=0のときの検定量の分布と、 対立仮説β=1のときの検定量の分布は、ちょうど1ずれてて、 β=1のときの検定量の分布で棄却域に入らない確率を求めればよいはず
475 :
132人目の素数さん :04/04/23 19:12
>>473 回答ありがとうございます。
適当に質問してしまったようでご迷惑おかけします。
統計的な手法では、無視してもたいした問題のない
誤差があることを認めているわけですね。
そして、その仮説検定によって得られた信頼度に基づいての推測は
あくまで「有意」、または「近似」であるということですね。
さっき私の聞いたのは、根源的なことというより
言葉の使い方を聞くようなものになりますが、
例えば、理想的コインを延々と投げ続けて裏表を数える場合に
裏、表の相対度数がある一定の値(理論値)に収束を見せるような現象は
「ある”規則”に従っている」と言えるものなのでしょうか?
ある事象が特定の確率分布に従うことは、一種の”秩序”と
見なせるのかどうかということです。
言葉足らずでしたらすみません・・。
>472さま ありがとうございます。 さっそく平均値や分散の意味を調べ、 検定の意味を調べたいと思います。 紹介もしていただきありがたく思います。
478 :
132人目の素数さん :04/04/24 07:40
なんつーかさー漏れから見るとさー 統計学ってどうもサイエンスじゃなくてさーエンジニアリング って感じがするわけよ だってさー100%じゃないじゃん? 例えば5%の確率でそうならないことも予想さるわけでさー 命をかけられないわけよ怖くて もっとこー漏れが風邪ひいてても鬱な気分になってても もの凄く幸せな気分でいるときもおかまいなしに信用できる 結果じゃないと落ち着かないしそれを使ってさらなる複雑でかつ信用に足る論理展開ができないわけよ この現象はこういう分布に従うとかってさー現象論につぐ現象論でしょ? なんでその分布に従うか厳密に証明できてないけどどうもなんべんやってもこういう分布だとかでしょ? 物理学のように現象論から帰納っつーの? 最初はどうもこうなる事しかわからなかったが 細分化して突き詰めていって原子だとか 電子だとか量子だとか元々の原因を明らかにするんじゃなくて演繹ばっかでしょ? そこに漏れはサイエンスをいまいち感じないわけよ もう誰か統計学はエンジニアリングだって認めてくれれば 漏れも真面目に勉強しようかと思ってるんだよ そうすれば2回も単位落とすことも無くなると思うんだよ
その通り 統計学は理学部数学科には入れてもらえない 確率は入ってるけど まじめに勉強しなはれ
480 :
132人目の素数さん :04/04/24 10:01
>>478 >なんでその分布に従うか厳密に証明できてないけどどうもなんべんやってもこういう分布だとかでしょ?
サイエンス全般に渡ってそう。
物理も例外ではなくそう。
サイエンスに厳密に証明できてることなど何も無い。
物理は世界中でなんべんやってもこういう実験結果だから
正しいというところが足場になってるわけで
そこが保てないと机上の空論になってしまう。
統計学はサイエンスの足場の重要な一部を成し、その意味では数学的である。
481 :
132人目の素数さん :04/04/24 18:41
>>477 分布に従うことを秩序や規則であると呼べるのでしょうか?
また逆に、統計における誤差の存在こそが秩序では?と思えるわけです・・。
>>480 そうですよね。どんな実証的科学でも
繰り返し実験で統計をとって有意水準にあるのなら
それは正しいと認めるわけですよね。
統計学が大事だということはわかった ナイチンゲールだかヘレンケラーだかが統計学を用いて 多くの人命を救ったというのもきいた あとは統計学が科学か工学かだ 科学だというのなら漏れはまた単位を落とす 工学だというのなら漏れは割り切って勉強できるから単位はAだ
483 :
132人目の素数さん :04/04/25 03:21
>>478 あなたは全くいいことをおっしゃる。
日本統計学会の評議員の先生方でも、よくあなたのような
ことをおっしゃいますよ。
統計学は実学ですから、数学科とはちょっと違った
ものかもしれません。
もちろん、統計学の基礎は数学や確率論ですけど・・・。
>>481 統計学では、「正しい」などとは言わないと思うなあ。
有意かどうかは、検定による結果だけど、有意水準の
決め方に論理性がない(5%とか1%とか)から、
そんなに厳密なものではないし、
正規分布に見える事象でも、データを多く集めると
正規性のテストにとおらないからデータ数を少なくして
テストして論文にしたりする。
結局、実際の統計処理ってあいまいなところもあるんだよね。
ただし、理論としての中心極限定理は美しいと思うよ。
484 :
132人目の素数さん :04/04/25 03:23
>>475 コイン投げを続けた結果は、経験的確率といいます。
理論的確率とは区別します。
天気予報の降水確率の理論をお教え下さい。
486 :
132人目の素数さん :04/04/25 17:05
>>485 天気図や、気圧配置を基にして行うのは、空間統計学の
手法を使ったりするし、過去のデータからだったら、
確率過程をつかったりするが、気象庁の使っている方法は、
いろんなデータを見て、最終的には人が判断しているらしいね。
細かいことは専門家でないからわからんけど・・・。
漏れが知りたいのは気象のパラメータを最終的に10段階に統合する手法です。 どのような統計処理を施しているのかということ。
ガウスの誤差関数の導出について詳しく書いてあるお勧めの参考書 ありませんか?
検定(片側は除く)でサンプル数をかなり大きくしていくと必ず有意にできる。 理由は、検出力がUPして、どんな小さな差でも検出してしまうから。 だから、最近の論文は、イフェクトサイズが小さいと通らないらしい
491 :
132人目の素数さん :04/04/28 08:33
混乱してきたので教えてください。 え〜〜っとサンプルとってその値が、1.1,1.2,1.3,1.05,1.07 だったとしますね。(実際、値はどうでもいい) で、1.09である信頼レベルってどれくらい? という問題です。よろしくおねがいします。
初学者ということで
>>434 で紹介していただいた「はじめての統計学」鳥居泰彦著を熟読しました。
次のステップに進みたいのですが、「統計学入門」東京大学出版会でよろしいでしょうか?
よろしい
>491 母分散がわからないので、不偏分散で代用して基準化。 すると、Student t分布に従う。 標本サイズ = 5 平均値 = 1.144 (1.144) 不偏分散 = 0.01093 (0.01093) 標準偏差 = 0.104547 (0.104546640309481) 1.09を基準化すると(1.09-1.144)/0.104547=-0.52 あとはt分布表を見ればp値が出てくる。正確にはソフトで計算。 1.09〜1.198は、だいたい40%くらいの信頼区間 ただし、区間推定では、p値の値自体はあまり意味がない 先に、有意水準を決めて、p値がそれより大きいか小さいか判断する。 つまり、先に、信頼区間を作ってから、標本がその区間に入っているかどうかを判断する。 信頼区間内外のどこらへんにあるかはあまり意味がない。
訂正。標本じゃなくて、標本点。 書き忘れたけど、母平均の信頼区間の話ね。
496 :
132人目の素数さん :04/05/02 13:09
こちらにということですので、よろしくお願いします。 (1)確率変数X,Yはそれぞれ0,1,2の値をとる確率変数で、 以下の同時確率分布関数を持つものとする。 fX,Y(x,y)=1/(5(3−|x+y−2|)) このとき、E(X),V(X)およびC0V(X,Y)を求めよ。 (2)確率変数XとYは独立でともに区間[0,1]上の一様分布をもつ。 このとき、確率変数ZをZ=X^2+Yと定義するとき、 確率変数の組X,Zの存在範囲と同時密度関数 fX,Z(x,z)を求めよ。またZの密度関数fz(z)を求めよ。 よろしくお願いします。
>496 (1)とりあえず、(X,Y)=(0,0),(0,1),....,(2,2)の確率をそれぞれ計算してみ? (2)ヤコビアン使う公式、教科書で探してみ?
498 :
132人目の素数さん :04/05/05 00:26
質問です。 全くの文系人間で、この質問がスレ違いであるか否かにも自信がありません。 気が向いたら教えていただけると嬉しいです。 データが正規分布をとらない場合、正規変換を行う必要があるということなので データを対数変換し、それでヒストグラムを作成してみました。 しかし元データのヒストグラムよりは正規分布の形に近づいてはいるのですが 凸凹していて、山のような形(分かりにくくてすみません)にはなりません。 しかも元データによるヒストグラムは「正の非対称が強い」状態であったのに 対数変換後のデータによるヒストグラムは、値が0の階級が多く「負の非対称」気味です。 最終的に正規分布をとるようにしたいのですが どのような作業を行えばいいのでしょうか?
499 :
132人目の素数さん :04/05/05 00:36
500 :
132人目の素数さん :04/05/06 07:51
数学、統計の素人です。教えてください。
URLと本文の一部を以下にコピーしました。
最後の行に拡張係数と言う表があります。過誤採択リスク1%のとき1.9というやつです。
過誤採択リスクから拡張係数を計算で導くにはどんな計算式になるんでしょうか?
計算式がそうなる理由も要約的でかまいませんので教えてください
http://home.att.ne.jp/sea/tkn/operations/Operations-Stats.htm#変数サンプリング (5)標本サイズの調整
仮定0%の誤表示率に基づく公式により標本サイズを決定しているので、誤表示発見の事実に基づいて標本サイズをは増加しなければなりません。
予期される誤表示がゼロではないときの修正されたサンプル数の公式は次の通りです。
AM = 予想誤表示
EF = 以下の表による拡張係数
過誤採択のリスク
1% 5% 10% 15% 20%
拡張係数 1.9 1.6 1.5 1.4 1.3
牧浦健二先生は、関西学院大学時代に何年かけても、 この科目(統計学)だけは単位が取れなかったらしい。
502 :
132人目の素数さん :04/05/06 23:36
質問です。 B ~B A 123456 223456 ~A 23 45 のような要因Aを持っているグループと持っていないグループのサイズが違う 分割表をX二乗検定やフィッシャーの正確な検定をしても不具合はないでしょうか?
いま、2つの互いに独立な正規母集団N(μ1、(σ1)^2)、N’(μ2、(σ2)^2)から大きさがそれぞれN1、N2の互いに独立なサンプルをとる。 (a)仮説H0:μ1=μ2を仮説H1:μ1≠μ2に対し有意水準αで検定する手続きを述べよ (b)N1+N2=Nのとき、この検定の検出力(H1が真のときH1と判定する確率)が最大となるようなN1,N2を求めよ。ただし、N1、N2は連続値をとるものとしてよい。 検出力の式の出し方がわかりません。お願いします。
504 :
132人目の素数さん :04/05/08 20:20
経験分布関数とはなんでしょうか?ベイズと関係があったりするのでしょうか・・・・
>502 同総数で同程度に割り振ってある場合と比べると、検出力が下がる ので、調べるときは、同程度に割り振ってある方が効率的 でも、総数が少ないよりはいい。効率は悪いが数で勝負みたいな
>503 多分、σ1、σ2が既知だとして、話をすると、 平均差の推定量δ^=X~-Y~ 帰無仮説の下で、δ^〜N(0,σ1^2/N1+σ2^2/N2) よって、棄却域は{|δ^|>δ(α)} 対立仮説の下で、δ^〜N(μ1-μ2,σ1^2/N1+σ2^2/N2) 検出力はPr{|δ^|>δ(α)} ということは、|μ1-μ2|がσ1^2/N1+σ2^2/N2に対して大きい方が検出力が高い てことは、σ1^2/N1+σ2^2/N2を最小にすればよい。あとは、相加相乗平均
>504 経験分布関数は、標本から作った分布関数 普通の分布関数は、理論から作った分布関数 コインを1000 回振って表は1裏は2を記録するという実験を行った結果 Xi 度数 相対度数 経験分布関数F(Xi) 1 457 457/1000 457/1000 2 543 543/1000 (457+543)/1000 Xi 確率 分布関数F(Xi) 1 1/2 1/2 2 1/2 1/2+1/2
丁寧なレスありがとうございました。
509 :
132人目の素数さん :04/05/13 00:59
主成分分析の欠点について論述せよという課題で困っています。 どなたかうまく説明できないでしょうか? 初めて統計を学び始めたばかりでよくわかりませんでした。 よろしくお願いします。
ランダムウォークの次の一歩って予測可能?
511 :
132人目の素数さん :04/05/13 03:25
>>510 あなたが言ってる予測可能の定義とは?
「ランダム」ウォークですよ。
>509 今、思いつくのは、 1、主成分分析の結果が既知の知見と整合性があるとは限らない 例えば、テストの点を解析して、主成分が、理系要素、文型要素、、、、 となってくれない場合、解釈に困る 2、主成分軸の回転は、解析者によって異なる 3、実態を把握するために必要な変数が抜け落ちている可能性 まぁ、3は主成分分析に限ったことではないが。
>>512 レスどうもありがとうございます。
3についてよくわからないことがあります。
追加で質問してもよろしいでしょうか?
3の実態を把握するために必要な変数が抜け落ちてしまう可能性があるというのは
どういう原因から起こりうることなのでしょうか?
3は、主成分分析するときに必要な変数が抜け落ちる、のではなくて、 最初から考慮に入れていなかったということ。 原因は、解析者の観察不足。 例えば、成績を分析するのに、 国語、算数、理科、社会で解析したが、 実は、体育も必要だったみたいな。
515 :
主成分分析の欠点 :04/05/15 14:02
線形性や、正規分布の仮定は?
516 :
132人目の素数さん :04/05/15 17:00
統計モデルを造るときにセグメント毎につくるときがありますよね? どうしてセグメント毎につくるのでよしょうか?
517 :
132人目の素数さん :04/05/15 22:50
既出の質問かもしれませんが、お願いします。 統計学を習ってて疑問に思ったのですが、例えば母集団が10万人だとすると、 いったいどのくらいの人数について調べれば、その集団の性質が分かるのでしょうか? どのくらい調べたら信用できるかってことを知りたいです。
518 :
132人目の素数さん :04/05/15 23:40
519 :
132人目の素数さん :04/05/15 23:51
>>518 ありがとうございます。
今度書店で見てみます。
>516 ひとつのモデルで作りたいけど、作れないから 仕方なく、セグメント毎に作る ひとつのモデルで表すことがでできるなら、ひとつのモデルで表したい。 ひとつのモデルで作るか、セグメント毎で作るかは、解析者の判断次第。
SPSSでウィルコクソンの符号付順位検定をすると、 代表値の上昇・低下に関らず、統計量の値が常に−になってしまうのですが、 これはあまり気にしなくてもいいんですか? 有意差が出たときに代表値が上昇したか悪化したかどうかを見るためには、 順位の出力(正の順位和、負の順位和のどちらが多いか)を見ればいいのですか?、
522 :
132人目の素数さん :04/05/16 21:35
質問です。 P個の正規母集団から互いに独立なn個ずつの観測値を得る。 母集団の分散は全て等しいが、P個の母集団の期待値u1...upは 1つのみが他より大きく、他は等しい。 この最大の期待値を持つ正規母集団からの標本平均の確率密度関数をf(x)、 分布関数をF(x)とし、他の正規母集団からの標本平均の確率密度関数をg(x), 分布関数をG(x)とする。 「第1母集団の標本平均m1が最大であった時、第1母集団の期待値u1が最大の期待値 である確率をf(x),F(x),g(x),G(x)を用いて表してください。」 という問題で次のように解きました。 @m1が最大になる確率=(1/p)f(m1)G(m1)^(p-1)+((p-1)/p)g(m1)F(m1)G(m1)^(p-2) Am1が最大になり、かつu1が最大の期待値になる確率=(1/p)f(m1)G(m1)^(p-1) 求める確率はA/@ これで合っているでしょうか?自信がありません。
ちくと質問なんですが、 回帰分析で最小二乗推定量の下での残差二乗和は 任意の推定量の下での残差二乗和よりも大きくないのは何故と聞かれて、 「そういう風に推定量をとったから」と答えたら、 数式で示せる?と聞かれまして、どうやってしめしたらいいんでしょうか?
524 :
132人目の素数さん :04/05/17 05:08
ペンシルベニアが米海軍で最後まで残存していた唯一の戦艦であり、 英海軍のキングジョージ五世などといっしょに水爆実験の標的艦と なったのはよく知られている。 しかし、戦後すぐ、自国の広大な農業地帯を自らの焦土作戦により 失った米国の、深刻な食糧難をしのぐ手段として捕鯨母船に使われた ことはあまり知られていない。 もっとも大きすぎて使いにくかったらしく、短期間の使用で捕鯨母船 のノウハウが得られたのちに、造船所で建造途中で放棄されていた クリーブランド級やアトランタ級の艦艇が捕鯨母船として完成してから はほとんど運用されなくなった。 もともとエスキモーなどをのぞいて鯨肉を食べる習慣のなかった米国 では、これを機にふたたび大規模な捕鯨が行われるようになり、 19世紀に北太平洋の鯨を絶滅寸前においやったのに続いて南太平洋や 南氷洋の鯨にも危機的な状況をもたらした。このため、現在では東西米国 に対する商業捕鯨の割り当ては停止されている。 わが国では庶民の味である鯨肉であるが、米国ではエスキモーにのみ 認められた生存捕鯨で得られた鯨肉が、高級食材として高価で取引されて いるという。
>523 教科書の求め方、そのまま。
入門統計学 共立出版 P63 問9 解答みても,全然分かりません 問 Xの分布を一様分布U[0,1]とするとき,Y=1/Xの分布関数G(x)と密度関数g(x) を求めよ. 解 G(x)=0(x≦1), G(x)=1-1/x(x≧1), g(x) = 1/(x^2)(x≧1), g(x) = 0(その他)
527 :
132人目の素数さん :04/05/17 21:00
528 :
132人目の素数さん :04/05/18 01:49
偏差の絶対値の和の平均の意味とは何でしょう? こんな課題を出されてもまるで分かりません。
分散
530 :
132人目の素数さん :04/05/18 18:52
教えてください。統計に触れるのがはじめてで・・・ 調査年 商店数(千店) 1972 259 1974 292 1976 340 1979 369 1982 429 1985 413 1988 436 1991 462 1994 429 1997 392 1999 426 2002 380 この表で1972年を100としたらその後の商店数がどうのびてるか を出したいとき、どうやって統計を出したらいいんですか?
531 :
132人目の素数さん :04/05/18 23:26
パネルデータ分析とはなんでしょう? Webで調べてもわかりやすい説明が見つかりません。 回帰分析の発展系みたいなイメージを持ったのですが・・・・
>526 G(Y)=Pr(Y<y)=P(1/X < y)=Pr(X > 1/y)=1-Pr(X < 1/y)=1-F(1/y)=1- 1/y 定義域と不等号の=は自分でヨロ
>522 f(x)は確率密度関数だから,連続な関数で、 P(x=m1)=0≠f(m1) だから、 m1が既知ならば、 P(m1最大,u1最大)=P(m1最大|u1最大)P(u1最大)=G(m1)^(p-1)*(1/p) 「第1母集団の標本平均が最大であったとき、 第1母集団の期待値u1が最大である確率」を求めるならば、 P(m1最大,u1最大)=P(m1最大|u1最大)P(u1最大)=int{f(x)G(x)^(p-1)}dx*(1/p) だと思うんだが。。。おれも、自信ないっす。 これってベイズだよね?苦手だ。
>>530 259を基準にすることを意味するから、259で割ればよい。
その後で100をかけることになる。つまり、
1972年以降の商店数に、100/259をかければいい。
535 :
132人目の素数さん :04/05/19 01:53
ありがとうございます!できました!
>521 その通り。 SPSSもってないけど。 正の順位和、負の順位和の小さいほうを統計量として取るから 正規近似すると統計量は負になって、下側を棄却。 大きいほうを統計量として取って正規近似して上側を棄却するのと同じ。
>528の答え、俺もわからん。 独立な確率変数(X11,X12,...,X1n),(X21,X22,...,X2n),...,(Xm1,Xm2,...,Xmn)があって、 偏差の和Σ|X1i-X1.~| それの平均1/m ΣΣ|Xji-Xj.~| これで合ってる? 偏差の絶対値の平均なら、絶対偏差という名前があるが。
538 :
X2でしょうか? :04/05/19 12:40
東京港区と江戸川区で、国産車と輸入車の占める割合のデータがあるとします。 仮説は「港区には江戸川区より輸入車が多い」であるとして、 検定方法はどうすれば良いでしょうか? 観測値から期待値がわかるので、カイ二乗を使おうかと思いますが、 この場合だと仮説は「観測値と期待値には有意の差がある(かどうか)」であって、 港区と江戸川区の実際の比率を比べているわけではないですよね・・・。 どなたか教えてください!!
>538 χ2乗分布による適合度検定と,独立性のχ2乗検定を混同してない?
540 :
132人目の素数さん :04/05/19 21:48
社会学方面の実務で検定なんて絶対にしねぇ。
541 :
132人目の素数さん :04/05/19 21:49
おまえら無駄なことしてるぞ。 製薬会社にでもいくつもりか?
| 〜〜〜〜〜〜〜〜|〜〜〜〜〜〜〜〜〜〜 | >( c´._ゝ`) | J >( c´,_ゝ`) >( c´,_ゝ`)
>>540 「社会学方面の実務」って何を指してる?
俺は社会学部出身のしがないサラリーマンだけど、
統計検定はしょっちゅう使ってるよ。
ちなみに、製薬会社ではない。
544 :
132人目の素数さん :04/05/19 22:19
>>543 は?自己満足のオナニーだろ?他人に検定の結果を公表しているか?
馬鹿学生が妄想してるよ・・・・
そういえば社会学部ってどこも(ry
>>532 何となく,わかりました.
どうもありがとうございます.
製薬に行く気満々ですが。 統計が使われてる分野って大きく分けてどれくらいある? 計量生物学,計量経済学,計量社会学,計量心理学 あと、どこ?補足よろ。 それから、社会学の中って、どんな風に分かれてるの?
548 :
132人目の素数さん :04/05/20 19:38
以下のような宿題が出たのですが、どのように 答えればよいでしょうか?(数字は全て変えてあります) ***************************************** Aくん…英語:50, 数学:62, 国語:61 Bくん…英語:80, 数学:70, 国語:55 ※平均点は全て50点とし、標準偏差は8とする。 2人の特徴について考察を述べよ。 ***************************************** 標準化して、偏差値を出して、それに関しする 意見を述べてみたのですが、「特徴について」という部分を どうやって答えていいのか分かりません。 何かアドバイスがあったら教えてください。
統計データの種類じゃなくて、 学問としてどう分かれてるのか知りたいのだが。 心理学って社会学に含まれてるよね?ちがったっけ?
>>544 残念ながら、クライアントに提出する報告書に使ってるよ。
カテゴリカル・データが中心だがね。
χ二乗検定や二項検定は数こなさなきゃなんないんでExcelで関数組んでやってる。
あとはt検定、分散分析、因子分析、重回帰、クラスタ分析(k-meansが多い)、
コレポン、決定木ぐらいかな。
今はSEMの勉強中。
半分趣味でRもいじってる。
……っと、ここまで書けば業種も分かるでしょ?
ほんと、学生時代にもっと勉強しておけば良かったと思ってるよ。
>>551 笑えるよ。
ずいぶん少ないサンプル扱ってるんだな。(w
夢と希望にあふれた1,2年目とみた。
しかもExcel(w
SASの使える会社に転職することからはじめような。
ついでにRは実践向きじゃねぇぞ。
言語使用は綺麗だが。
検定・・・・ぷ
質問側も回答側もいい姿勢でいい雰囲気のスレだと思ってたのに、 一人の粘着のおかげではいお終い。
554 :
132人目の素数さん :04/05/20 23:35
宿題はじぶんでやれ
555 :
132人目の素数さん :04/05/20 23:46
くだらない質問坊よりずっと為になる気がする。
>>552 サンプルサイズは数十から数百、多くても数千だね。
この業界(?)には入ってからは4年目だよ。
道具のために仕事をしてるんじゃなくて仕事のために道具を使っているので、
SASを使える会社に転職したいとは思わんなぁ。
Rが実践的じゃないってのはどこらへんを指してるの?
定型処理には使えそうかな、っと思って勉強してるんだけど。
聞かせて欲しいな。
あと、Wekaも面白いね。Rみたいに日本語で詳しく紹介してくれるサイトが
現れたりすると嬉しいのにな。
557 :
132人目の素数さん :04/05/22 01:37
excelで出来る仕事なんてたかが知れてる。
558 :
132人目の素数さん :04/05/22 12:27
重回帰変数の偏回帰係数を並べて何の意味があるのかと。 相関係数がゼロの変数群じゃないだろと。 そんなレポートに意味があるのかと。
559 :
132人目の素数さん :04/05/22 13:08
>>558 重相関係数が0に近かったのですか???
>>557 その通り。
Excelで出来る仕事なんてたかが知れてる。
逆に、「たかが知れてる」程度の仕事ならExcelで十分。
SAS入れてるのに、平均値しか使わないって会社もあったりするけど。
561 :
132人目の素数さん :04/05/22 17:43
>>560 まぁ数百万オブザベーションの平均を求めるのはExcelにはできんべ。
562 :
132人目の素数さん :04/05/22 22:37
すいません。野球板のものです。 下記の例でアウトカウント別の安打数(打率)に有意差があるか検定していただけないでしょうか? 統計学に無知ですみませんです。 打数 安打 無死 30 6 一死 34 18 二死 47 10
563 :
セフィラ ◆SephirRldQ :04/05/23 00:29
将棋板から来たものです。 質問させて下さい。 7人制の団体戦を行います。 7人同時に戦い4勝以上したチームが勝ちです。 チームの登録は14人でき、その中から7人を選びます。 選手には力の差があります。 通常なら強い7人を出すのが有効だと思います。 ただ、相手のチームのメンバーがある程度予想できる場合、 いわゆる「当て馬作戦」(強い人に弱い人を当てる)が 有効になるのはどんなときでしょうか。 それは確率的にある程度の目安が計算できるものでしょうか。
>>562 漏れも初学者なんでアレですが、
χ二乗検定(独立性の検定)だと p=0.0031、
Cramer の連関係数は 0.3218、っとゆーことで
「危険率5%で有意差あり(独立性が無いとはいえない)」って感じでいいのかな?
ツッコミよろすこ>識者
ここって質問板か? 明らかに宿題っぽいのは無視でいいよね?
>>562 ついでにライアンの方法で多重比較してみると、
無死 vs 一死 alpha'=0.017 P=0.004 で有意差あり
一死 vs 二死 alpha'=0.033 P=0.003 で有意差あり
無死 vs 二死 n.s. で有意差なし
って感じでよい? >識者
>>565 自分の勉強のつもりで答えてみました。
すんまそん。
567 :
132人目の素数さん :04/05/23 23:36
平均μ1, μ2, μ3, μ4, μ5 の5つの部品をランダムに継ぎ合わせて組み付ける工程がある。 この工程の仕上がり寸法の規格は,2.020±0.030mmである。各部品寸法の精度(標準偏差)σは同程度で製作できる。 仕上がり寸法が正規分布するものとして,規格を満足しないものが0.3%程度あってもよいとするならば, 各部品精度(σi)をどの程度にすればよいか検討しなさい。 考えてもわかりませんでした。どなたか回答を教えていただけないでしょうか
>>567 そのまんま、シックスシグマって奴じゃダメなの?
プラスマイナス3σ。
>563 まず、単純にモデル化してみるとして、 aチームbチーム3人ずつとして、実力は a1<b1<a2<b2<a3<b3とする。 bチームの出場順は、 確率1/3で b1,b2,b3 確率2/3で b3,b1,b2 とする aチームの出場順がa1,a2,a3ならば、 確率1/3で全敗->負け越し 確率2/3で2勝1敗->勝ち越し よって、出場順a1,a2,a3のとき勝ち越す確率は2/3 他の出場順も同様に計算していけば、評価できる。 相性や、a1対b1の勝率を設定しても応用できる。 まぁ、とりあえず、相手の出場順がしぼれる方が有利。 実際は、相手もコチラの出方を見るから複雑に。 ゲーム理論の話になるのではないかな?詳しくは知らね。
>>569 レスありがとうございます。
参考になりました。
なかなか難しいですね。
571 :
132人目の素数さん :04/05/25 14:58
相関係数、t検定、有意水準、共分散構造分析について、初心者でも分かるようにご教授願います。
本読んで自分で調べろ。あほが
>>571 相関係数→係数がどれぐらい相関するのかということ
t検定→studentのt、の検定のこと
有意水準→有意の水準かどうかということ
共分散構造分析→共に分散しているのかどうかを分析すること
574 :
132人目の素数さん :04/05/27 08:14
質問なんですが、表計算ソフトは無料で手に入りますか?
>>574 openoffice + 日本ユーザ会 でぐぐれ
使い心地はExcelとほとんど変わらん
576 :
132人目の素数さん :04/05/29 00:02
要因分析に回帰分析を用いるより 非説明変数と説明変数のクロス集計をした方が正確な分析が出来るのでしょうか?
すいません。スレ違いかもしれませんが、統計ってどういうところで勉強する もんなんですか?大学の理学部? それから、統計を勉強した人はどういう仕事で飯を食っていけるのですか? リサーチ会社とか? なんかこう、最近、サラリーマンではなく、黙々と働く職人っぽい仕事に就き たいなと思ってまして。
578 :
132人目の素数さん :04/05/29 09:08
おれは、文系だけど大学の一般教養にあったよ。いまは、現代統計実務講座でやってる。 リサーチ会社やマーケティング会社、視聴率調査会社みたいなところもあるが、 企業のマーケ部門や、バイオ、薬品、政府などでも、なんでも使うね。 職人ねえ。統計ソフトを作っている会社とかどう?コンピュータ会社のエンジニア になっちゃうけど。
579 :
132人目の素数さん :04/05/29 09:32
統計士の資格がとれるやつね。たまに新聞広告載ってる。 民間の資格だから有名じゃないけど、やったことが表現できるから いいね。> 現代統計実務講座
>>578 >>579 ありがとうございます。
なんでも使う、というのはそのとおりだと思いますが、普通の会社に入った場合、
何やらされるか分からないわけで、そうするとやはり、リサーチ・マーケに特化した
ところに行くのがよいのでしょうね。
既卒なんで転職するには大学or大学院に入りなおさねばかな。学生時代は法学
部だったので、統計には触れもしませんでした。
581 :
132人目の素数さん :04/05/29 12:11
582 :
132人目の素数さん :04/05/29 12:17
意志あれば道あり。
583 :
132人目の素数さん :04/05/29 12:24
間違えた。一番上は、公務員試験いるな。なんか、統計局でそんなの要らない なんか募集してた気がしたが。ちょっと探してみてくれ。わすれた。 バイトだったかなぁ。
夢を壊して悪いけど「現代統計実務講座」なんかを売り物にして転職を考えても 笑い者になるだけだよ。皆どんなものか知ってるから。 実務経験がないのなら計量経済学等の計量@@@を専攻したとかじゃないと難しい。 多分イメージしているような統計職につくのは無理。 下手したらエクセルを使った四則演算しかしない事になるよ。
585 :
132人目の素数さん :04/05/29 19:52
まあ、何かを出来る資格ってわけでもないからね。 いろはを知っているから再度基本的なことを教育しなおしてやる必要はないな、 ってことが分かるぐらいかな。 基本的なこと教えるのは案外めんどくさいからね。教える方も、「標準偏差?、 重回帰分析? そんなのどっかで勉強してきてくれよ」って感じだろうし。
586 :
132人目の素数さん :04/05/29 20:01
統計はあらゆるものの基本。何で勉強してもよし。 それを売りにして就職するのは、難しいかも。素養だから。 でも、がんばれ。
587 :
132人目の素数さん :04/05/29 22:34
今、582が良いこと言った。
いろいろとありがとうございます。気のせいかもしれませんが、文系スレより雰囲気が あたたかいですね。 >今の業務いってみろ。 ええと、なんとも微妙なのですが、無職です。卒業して地元の役所に勤めたのですが、 一年で辞めて、また今東京で公務員試験を受けているところです。 総務省の統計局ですか、国1数学職なのですね。センター数学120点だった私が通る かどうか。 イメージとしては、社会学、経営学、あるいは公共政策の大学院を経由してイ○テージ みたいな会社に行けたらうれしいななどと思っているのですが。
589 :
義務教育しか数学してない :04/05/30 01:57
ランダムウォークってどんな事か馬鹿でも分かるように教えて下さい。あと1にゅーとんは何の単位でしょうか?
>>589 > ランダムウォークってどんな事か馬鹿でも分かるように教えて下さい。
泥酔のおっさんが猥談する確率のことです
> あと1にゅーとんは何の単位でしょうか?
故竹内氏のメガネの数の単位です
591 :
132人目の素数さん :04/05/30 07:11
無職じゃ、ちょっとおれも思いつかねえなあ。でも公務員めざしているなら、 ちょうどいいじゃん。総務省じゃなくても、他の省庁でも、実は自治体でも 統計調査業務はあるぞ。募集はみてないが(と、いうか意識的に募集を調べ たことがない)。
回答有り難いですがそれじゃ抽象的すぎて理解できません。 出来れば具体的に教えて貰えませんか? ランダムウォークと1にゅーとん。
593 :
132人目の素数さん :04/05/30 13:13
>592 新橋で一杯ひっかけて終電に乗り遅れたおっさん達は 銀座方面に向かうもの、東京方面に向かうもの・・多数いる。 でも最終的に新橋に戻ってきたとさ。
ランダムウォークなんとなく分かりました。有難う。 でも酔っ払いにこだわる理由は分かりませんが。
595 :
132人目の素数さん :04/05/30 18:56
Q1.赤玉、黒玉、緑玉がそれぞれ1個ずつ入った箱から2個の玉を取り出す。 ただし、最初に取り出した玉を、元には戻さないで次の球を取り出すものとする。 この実験に対する標本空間を作れ。 Q2.黒玉が2個、白玉が1個入った箱から、同時に2個の玉を取り出す実験で、 (A)6個の標本点を用いる標本空間、(B)3個の標本点を用いる標本空間をつくれ。 数学自体がダメな初心者です。 答えはわかるんですが、その前の式がわかりません。 なるべく自分で求めたいので、初心者向きの統計学解説サイトがあったら教えてください。 無いのなら、誰か教えて・・・('A`)
こういうの無視でいいだろ。
>>596 っていうか、式無いじゃん・・・
すいませんでした。
もう質問しません('A`)
>>595 こういうの書くときは、自分でどこまで考えたか書かないと。
それがないと、1から10まで全部教えろと言ってるようにしか思えん。
>答えはわかるんです。 って巻末に答えが載ってるだけだと思われw
600 :
132人目の素数さん :04/05/30 22:08
確率のところなんですが、、以下の問題がわかりません。 (Ω、F、P)を確率空間として、 F1,F2,F3⊂FをそれぞれFの部分完全加法族とする。 FiとFj(i≠j)は独立だが F1,F2,F3は独立でない場合は具体的に言うと どのようなな場合でしょうか? 定義で「F1とF2をFの二つの部分完全加法族とする。このとき 任意のC1∈F1、C2∈F2について P(C1∩C2)=P(C1)・P(C2) が成立するとき、F1とF2が独立である」というものと 「F1,F2,......,Fnを完全加法族Fの部分完全加法族の有限族とする。 このとき任意のC1∈F1,C2∈F2,....,Cn∈Fnについて P(C1∩C2....∩Cn)=P(C1)P(C2)…P(Cn) が成立するとき、Fi(1≦i≦n)はお互いに独立である」という 二つのものがあります。 完全加法族の列は2つずつは独立であるけど、 全体としてはお互いに独立でないものがあるというのは定義 から解ります。 他スレで「C1∩C2....∩Cn = φではないか?」とも言われたんですが 理由が解りません。 この答えで合っているのでしょうか?またどういうとき方をすれば 良いのでしょうか?確率、統計に詳しい方、ご教授願えますでしょうか?
601 :
132人目の素数さん :04/05/30 22:20
>>594 ランダムウォークの日本語訳を調べてみよう!
602 :
1にゅーとんは? :04/05/30 23:07
調べるって?適当に歩くって意味じゃなくて? あ〜銭湯でのぼせました(*^@^*)頭も。
603 :
132人目の素数さん :04/05/30 23:20
ランダムウオーク=酔歩
ランダムウオーク=乱歩
>>591 遅レスですが、いろいろとありがとうございました。
とりあえず、行政官になることに全力を尽くします。
606 :
132人目の素数さん :04/05/31 03:33
>600 X,Y,Z 0 0 0 0 1 1 1 0 1 1 1 0 各々1/2の確率で起こるとする XとY、YとZ、ZとXは独立 XとYとZは独立でない これでどうかな?
607 :
132人目の素数さん :04/05/31 03:37
1/2じゃなくて1/4
608 :
1にゅーとんは? :04/05/31 09:57
親切にThanks。ランダムウォーク分かりました。 ブラウン運動について定義は在りますか? 統計学とか数学とかダメダメで非常に困ってるんです。
609 :
132人目の素数さん :04/05/31 11:16
>>600 Ω={1,2,3,4} P({・})=1/4 F1={1,2} F2={1,3} F3={1,4} とする。
P(F1∩F2)=P(F2∩F3)=P(F3∩F1)=P({1})=1/4 →独立
P(F1∩F2∩F3)=P({1})=1/4≠1/8=P(F1)*P(F2)*P(F3) →独立でない
で どうだ?
数学コースの統計学と 経営学科の統計学とでは どこが違うのですか ?
611 :
132人目の素数さん :04/05/31 12:43
>>600 >>完全加法族の列は2つずつは独立であるけど、
全体としてはお互いに独立でないものがあるというのは定義
から解ります。
はぁ?完全加法族ってσ加法族のことだろ?
どこをどう読めばそんなことがかいてあるんだ?
百歩譲って完全加法族のうえで定義された確率測度の条件である
「完全加法性」の話をしてるにしても
完全加法性の定義は独立性を「仮定」してるだけで
「独立である」なんてどこにも書いてないでしょうがww
>>他スレで「C1∩C2....∩Cn = φではないか?」とも言われたんですが
理由が解りません。
はぁ?
独立の定義はP(認[i])=捻(F[i])だぞ?
積集合が空集合なんてどこにも書いてないじゃないか!
つまり答えはこうだ!
「事象列が独立でない場合に609のようなことが起こる」
という至極当然のことしか言うことができん!
ん?事象列が独立って何かって?
「事象列から任意に複数個の集合を選んできたときにそれらが互いに独立」
つまり事象がn個あれば2^n通りの組み合わせすべてに対して
上のことが成り立つことが必要なわけだ。
ちなみにnが可算個なら冪集合が連続体濃度になるから少し吟味が
必要だがお兄さんは有限っぽいから、これでよし!
609,611がおかしいと思うのは俺だけ? >P(F1∩F2)=P(F2∩F3)=P(F3∩F1)=P({1})=1/4 任意のC1∈F1、C2∈F2について P(C1∩C2)=P(C1)・P(C2) が成り立つ必要がある あと、独立の定義は600の通りでいいと思うが。 >「完全加法性」の話をしてるにしても >完全加法性の定義は独立性を「仮定」してるだけで >「独立である」なんてどこにも書いてないでしょうがww 600は、完全加法族が2つずつ独立だなんて言ってなくて、 任意の2つが独立だと仮定した完全加法族の列が 全体としてお互いに独立でない場合があると 言いたいのだと思うが。
>>612 まず大訂正
誤P(認[i])=捻(F[i])⇒正P(∩F[i])=ΠP(F[i])
これは弁解の余地なく大間違い。つい加法定理書いちまった。
90分の講義中突っ込まれてないか
ずっと気になってた。とっとと講義抜け出したかった。すまそww
>600は、完全加法族が2つずつ独立だなんて言ってなくて、
>任意の2つが独立だと仮定した完全加法族の列が
>全体としてお互いに独立でない場合があると
>言いたいのだと思うが。
⇒そういうことならかまわんが。解答そのものは
>>611 の通りでいいだろ。
614 :
(・ω・)y−゜゜゜ :04/05/31 15:26
>>610 どうだろ?
きちんとした証明あたえるかどうかじゃないの?
615 :
132人目の素数さん :04/05/31 20:35
そうねえ。基本的には同じだけど数理統計の方が実務統計より、証明度合いが 高い気がするね。実際使うことがあるかどうか不明な定理も多くないか。
その通り。 おかしいと思ったのは、独立の定義と600の解釈。 600を馬鹿にしてるように感じたから、つい。 あと、609を修正すると、 Ω={(a0,b0,c0),(a0,b1,c1),(a1,b0,c1),(a1,b1,c0)},P{・}=1/4 F1={a0,a1},F2={b0,b1},F3={c0,c1} とすると、 F1とF2について P(a0∩φ)=P(a0)P(φ)=0 P(a0∩b0)=P(a0)P(b0)=1/4 P(a0∩b1)=P(a0)P(b1)=1/4 P(a0∩{b0,b1})=P(a0)P({b0,b1})=1/2 ....略 F1とF2は独立 同様に、F2とF3、F3とF1は独立 だけど、 P(a0∩b0∩c0)=1/4≠P(a0)P(b0)P(c0)=1/8 つまり、全体として独立でない これでどう?
数理統計は統計を使って何かすることより、 新しい手法やモデルを作ることを目的にしてる気がする。 だから、証明が大事。 新しい手法やモデルの妥当性を証明しなきゃいかん。
>>616 ああFnは事象じゃなくてその族って書いてあった。
なにを見てるんだ、おれはダメダメだなww
そりゃ、任意の事象に対する独立性の吟味はひつようだわなww
また先走ってしまったようだ。すまそww
>>613 のFは事象で書いてあるから 勘弁。
>>600 ちょっと言い過ぎた、すまそww
614以下・ いろいろと教えてくださり、ありがとうございました。
620 :
132人目の素数さん :04/06/01 10:33
>606、609、611 お答え有難う御座います。 >606 丁寧に書いてくださって有難うございます! ただ文系ゆえ基本的なところが理解できていなかったようです。 入門書の最初に戻って初歩の初歩から学びなおします。 >611 いえいえ、全く解ってないのは本当ですから。お気に留めて頂いていた ようで、有難う御座いました。
↑は600でした。すいません。
↑は600でした。すいません。
623 :
132人目の素数さん :04/06/01 11:57
ここは確率解析の話を書いちゃだめなんかな?
さぁ?確率だから駄目だというレスは見たことないけど。 駄目なら駄目だと思う人が誘導してくれるんでないかい。
625 :
132人目の素数さん :04/06/02 01:23
激しくスレ違い、お許しください。 血液型と人格は相関がないことをうまく説明する方法はないですかね・・・・。 「あなたは○型だから○○な性格ね」なんて決め付けられるとすごい嫌悪感を 感じます。
628 :
132人目の素数さん :04/06/03 00:09
どう考えても、重回帰分析の回帰係数及び偏回帰係数をみて相関関係を見るより、
629 :
132人目の素数さん :04/06/03 00:14
1:nの非説明変数と説明変数の相関関係を考えた時、 どう考えても、重回帰分析の回帰係数及び偏回帰係数を見て判断するより 1対1の相関係数をn組求めて、見比べることにより判断した方が 正しいと思うのですが間違っていますか?
目的に依る
統計とは話が逸れますが。 血液型で性格に傾向があると思ってる派です。 人間一人一人違うということをまず認めて、 男と女で性格に傾向があるんだから、 個人的には、血液型で傾向があってもおかしくないと思う。 証拠がないから、間違いだと決め付けるのは、どうかと。 昔、地球は水平だと決め付けてた感じで。 ただ、その人を、血液型だけで判断する奴はおかしいと思う。 平均値だけで判断してるのと同じ。 本人を見た方が、正しく性格を判断できるのに。 性格が当てはまってなかったら、俺だったら、俺は外れ値だと言ってやります。
632 :
132人目の素数さん :04/06/03 21:39
>>目的に依る とい、うことですが、偏回帰変数の方が1:1の相関係数より 優れている状況などありましたら教えて下さい。 考えましたが、前者が後者に勝ってる理由がわからないのです。 アドバイスよろしくお願いします。
>>632 重回帰の偏回帰係数が「他の変数の値を一定としたとき、ある変数の変化がもたらす効果」
を表すのに対し、単回帰の回帰係数は、他の変数は全て誤差項に含まれるものとして扱います。
数学的に言えば、多変数の偏微分係数と一変数の微分係数の違いになります。
例えば、パソコンの価格を分析するモデルで、価格を決める要素として、
CPUのクロック数・メモリ・ディスプレイの大きさ、の3つを考えます。
クロックに注目して分析するならば、重回帰の偏回帰係数が
「メモリ・ディスプレイのスペックが同じパソコンは、クロックが(1単位)変わるとどれだけ値段が変わるか」
を表すのに対し、単回帰の回帰係数は、クロックだけでパソコンの値段を分析することになります。
メモリやディスプレイのスペックが高いために値段が高くなっているパソコンでも、
クロックが劣っていれば、「クロックが下がる→値段が上がる」という判断すらなされ得ます。
それゆえ、重回帰の偏回帰係数のほうが、モデル説明にふさわしいと言えます。
630さんじゃないけど答えてみますた。
偏回帰係数でも、それは有り得る(多重共線性)のですが、 重回帰は、説明変数が独立であるという強い仮定の下に成り立っています。 多重共線性は、この仮定を満たしていないのが原因です。 重回帰は、この強い仮定の下で、全体的に相関を調べます。 多変量解析は多変量で考える必要があるから、多変量解析なのです。 個々の相関を見るだけなら、単回帰でいいが、 全体として見たいから多重回帰を使う。 そのために、強い過程という犠牲を払って、解析している。 例えば、 Y,X1,X2があったとして (Y,X1)の相関係数が2,(Y,X2)の相関係数が1だったとする。 ここで、もし、X1と同じデータX3があったとしたら、 (Y,X3)の相関係数も2 ぱっと見ると2,1と2,1,2じゃ、印象がずいぶん変わりませんか? 全体としてどう評価しますか? そのために、説明変数が独立だという仮定をおいて、 重回帰分析をするのです。 この場合、X1もしくはX3を捨てなければなりません。
>>630 氏
> 偏回帰係数でも、それは有り得る(多重共線性)のですが、
モデルが正しく特定されている限り,多重共線性の下でもOLSの推定量は
不偏性を失わないはずですが.
完全な線形従属性があれば,そもそも偏回帰係数を推定できない.
> 重回帰は、説明変数が独立であるという強い仮定の下に成り立っています。
OLSはそのような仮定をおかなくてもBLUEになります.
「独立である」の意味が「線形従属でない」の意味であれば(3段目の書き込み
からはそのように解釈できますが,通常は独立=共分散ゼロ,ですよね),
それは全然強い仮定ではないです.
そうですね。 重回帰の標準化偏回帰係数で評価したければ、説明変数が線形独立でなければならない、ですね。 推定量の不偏性には、そんな仮定はいりませんね。 「独立」と「線形独立(線形従属でない)」間違ってますね。 強い仮定というのは、仮定が存在するということを強調したかったのです。 すみません。
またもや、修正。 やっぱり、「独立」は、共分散ゼロの意味だ。説明変数を相関ゼロにしたいんだから。 だから、観察研究だと、標準化偏回帰係数で比較できない。 相関ゼロにできないから、共分散構造解析にいくと。 重回帰を推定量として使う場合と、標準化偏回帰係数を見る場合が ごちゃごちゃになってた。
レス遅れて申し訳ありません。 とても解りやすい説明をありがとうございました。 納得できました。
639 :
132人目の素数さん :04/06/08 23:24
教えてください。 調査年 商店数(千店) 従業者数(千人) 1972 1,496 5,141 1974 1,548 5,303 1976 1,614 5,580 1979 1,674 5,960 1982 1,721 6,369 1985 1,629 6,329 1988 1,620 6,851 1991 1,606 7,000 1994 1,500 7,384 1997 1,420 8,029 2002 1,300 8,006 この表で1972年を100として一店あたりの従業者数を 出したいとき、どのようにして統計を出したらいいん ですか?
641 :
132人目の素数さん :04/06/09 00:02
そうです。統計まったくわからなくて。
>>639 統計と言うより、下手すりゃ算数じゃないか?
せいぜい中学レベルだ。
どっちにしても、
>>534 を見て分からないようなら、
基礎からやり直した方がいいと思う。
643 :
132人目の素数さん :04/06/09 10:37
Xがガンマ分布Ga(r,1)に従うとします。 このとき,log(1+ax)の期待値がrが十分大きい範囲では log(1+ar)に近づくとある論文に書いてあります。 これはなぜなんでしょうか?よろしくお願いします。
644 :
132人目の素数さん :04/06/10 13:15
私立大学の過去のデータによると入学試験の合格者のうち入学を辞退する者が4%である。 1000人の定員を99%の確率で充足するためには、合格者を何名にするべきか。 という問題が出たのですが、この文章を見ると辞退する人数がわかっているので、定員を充足するのは確率も糞もないと思うのですが・・。 どうなんでしょうか? 確率・統計の所で出てきた問題ですので、そんなに単純ではないはずなんですが。 正規分布やら信頼区間を使うかもって友人が言っていたのですが、どう当てはめればいいかサッパリな状況です。 宜しければ誰か教えて頂けますか?
645 :
132人目の素数さん :04/06/11 00:08
よくある多期比較に関する対応のあるt検定(いわゆる輪切り検定)の問題の悩みなのですが? 独立した3群以上の有意差を比較するときにt検定を繰り返してはいけない ということは理解しているのですが、 (有意水準5%でt検定をn回繰り返すと、少なくとも1組のペアに有意差が出る 確率が1-(0.95)^nとなり、本来5%設定した有意水準を上げてしまい、 本来有意差のないペアの有意差を検出してしまう。) なので、独立したn群の有意差検定には、分散分析をして有意差ありならば多重比較 を行い、どの群間に有意差があるかを調べなければならない。 ここまではOKなんですが、 「3週間にわたり、降圧剤を投与し、投与開始前VS1週間後、投与開始前VS2週間後、投与開始前VS3週間後 の比較をそれぞれ"独立(個別)"に行い、【投与開始日と比較して血圧に有意差があるのはどの時点か?】を独立に検定をする」 のは大丈夫なのでしょうか? (この場合、比較対象が開始前で固定してあり、【1週間後VS2週間後】、【1週間後VS3週間後】、【2週間後VS3週間後】 の比較は行わないので) このようなケースの多期比較(比較時点は開始前に固定)でも多重性の問題に引っ掛かるのでしょうか? 臨床統計に詳しい方がいたら教えて下さい。
大事なことを書き忘れていました。 4行目から6行目は余事象に基づいた有意水準(あくまで""系全体""としての有意水準) を引き上げてしまうのがNGの理由であるので、 開始前のみを比較対照として個別に検定を行い、"開始前"と有意差があるのは "どの時期か"?を調べるのを目的とした検定ならこの検定方法でも大丈夫でしょうか? 結論の例:対応のあるt検定を行なったところ、開始前VS1週間後は有意差なしだが 開始前VS2週間後 開始前VS3週間後は有意差有り といった感じに結論する
>644 自信ないけど。 辞退する人の期待値がn*0.04だから 辞退するかどうかがp=0.04の二項分布に従うってことじゃないかな? あとは正規近似して。。。
>>648 なるほど、大分前進しました。
勉強が足りなかったみたいですね・・。
有難うございました。
しかし、ほとんどの二項分布の例題や問題が、
試行回数(ここでいうと合格者を何名にするかでしょうか?)を定めているのでそれがなかなか考えずらいものがありますね。
650 :
132人目の素数さん :04/06/15 21:56
デシジョンツリーとは単相関の組み合わせですよね? 2値予測でデシジョンツリーの方がロジスティック回帰より 優れた結果を出すということは、結局多変量解析が大きな意味を為さないということに ならないのでしょうか?
どの決定木?
652 :
132人目の素数さん :04/06/18 03:24
(X_n)を2乗平均の意味でXに収束する平均0の実数値Gauss型確率変数列とする。 XがGauss型確率変数となることを示せ。 これってどういう方針で示すのでしょうか?
653 :
132人目の素数さん :04/06/21 23:36
654 :
132人目の素数さん :04/06/21 23:42
>>653 数学の素人の論争に首を突っ込むとろくなことがありません。
どんなに正しいことを教えてあげても、彼らは納得しようとしません。
どうしようもありません。
俗に角の三等分屋と呼ばれる人種にはかかわらない方が吉。
655 :
132人目の素数さん :04/06/21 23:54
一応何か書いてよ
656 :
132人目の素数さん :04/06/21 23:58
>>654 は素人を騙そうとしてる当人なわけ
まぁ、2ちゃんにはよくいる人種ってことかな
657 :
132人目の素数さん :04/06/22 00:00
神はまだいないってことか
658 :
132人目の素数さん :04/06/22 00:05
そもそも検定のけの字も知らなそうな奴らに何を教えろと? あんなくだらない論争に加わるよりも、とりあえず、このスレを最初から 読んでから、質問してくれ。
659 :
132人目の素数さん :04/06/22 00:07
4000人分の調査で100人分の例ってのは統計学的には、 信憑性あるんでしょうかって事なんですけどね まぁ、素人の論争なわけでして
660 :
132人目の素数さん :04/06/22 00:11
>>659 どういう分布の時で、信頼係数はいくつに設定するの?
661 :
132人目の素数さん :04/06/22 00:20
視聴率って信用できるの?
エクセルで分散分析をしたいのですがどうすればいいのか分かりません! 教えて下さい。
663 :
132人目の素数さん :04/06/23 01:15
仮説検定や異なる母集団の比較の場合、 標本調査でなく、母集団全部を調査できる場合(全数調査)は 検定も何も必要ないということになるのでしょうか。
>>662 ツール → 分析ツール から 分散分析が選べる。
665 :
132人目の素数さん :04/06/23 23:53
666 :
132人目の素数さん :04/06/24 00:00
667 :
132人目の素数さん :04/06/24 00:16
>666 (s0) 行列pは、あるs0が存在して任意のi,jについてpij >0と なるときエルゴード的である・・・みたいな感じです。 エルゴイックならばs0段階で任意の初期状態x(i)から 任意のx(j)に正の確率でいけることを意味するそうです。
すいません。上の (s0) pij>0は (s0) pij >0 です。
669 :
132人目の素数さん :04/06/24 00:29
670 :
132人目の素数さん :04/06/24 00:46
よし、今日は寝よう。
>663 そういうこと。 母平均の差の検定の場合で言えば、 帰無仮説:母平均μ1-μ2=0、対立仮説μ1-μ2>0 母集団全部を調査してあるなら、 母平均の定義μ1=1/n ΣX1i, μ2=1/n ΣX2i 要するに、推定量で検定しなくても、 母平均そのものがわかってるってこと ただ、無限母集団だと不可能だし。 統計学ってのは、母集団全部を調べるのは無理だから、標本を抜き取って なんとかするときの学問だと、俺は思っている。
672 :
132人目の素数さん :04/06/24 12:54
663です。
>>671 ありがとうございます!
数式の意味はわからないのですが
お答えをきいて安心しました。
>統計学ってのは、母集団全部を調べるのは無理だから、標本を抜き取って
>なんとかするときの学問だと、俺は思っている。
そうですよね。
全数調査と標本調査は、考え方が違うんですよね。
674 :
132人目の素数さん :04/06/24 23:06
質問させてください。。 階級 階級値 度数 累積度数 がそれぞれ書いてある度数分布表があるのですが、これからどうやって標準偏差を求めればよいのでしょうか・・
675 :
132人目の素数さん :04/06/25 00:26
知らん
>>674 ある階級 i の度数が N_i のとき,階級 i に含まれるケースがすべて
階級 i の中央値 X_i を取るとして計算するとよい.
たとえば,あるテストの得点の分布が
80〜100 3人
60〜80 6人
40〜60 4人
のとき,13人の得点の分布が
{50,50,50,50,70,70,70,70,70,70,90,90,90}
になっているものとして計算する.
677 :
132人目の素数さん :04/06/25 11:00
>>676 すいませんありがとうございます。。
この度数分布をエクセルをつかって計算したいのです。
もう少し詳しくお願いできませんでしょうか。。
>>677 www.google.co.jp/search?sourceid=navclient&hl=ja&ie=UTF-8&oe=UTF-8&q=Excel+%E6%A8%99%E6%BA%96%E5%81%8F%E5%B7%AE
679 :
132人目の素数さん :04/06/25 18:55
>>678 ありがとうがとうございます。。でも実は階級 階級値 度数 累積度数 のどの部分をどうして標準偏差を求めればよいのかがわからないのです。。
重症ですね。。
680 :
132人目の素数さん :04/06/25 19:52
統計の初心者です。 検定の考え方について質問します。 検定した結果はサンプルのデータによって変わってくると思いますが、 ある実験で有意差が出なかったが、再度同じ条件で実験すると 有意差が出た場合、どういう結論になるのですか? 例えばこんな感じ。 薬剤が体重へ及ぼす影響を調べるのに、10匹のマウスをランダムに 選び薬剤使用前と後を比較した。体重の平均値をt検定すると有意差はなかった。 そこで、再度マウスを10匹ランダムに選びなおし、同じ実験すると今度は有意差 が出た。結論はどっちなのか? もし有意差があり、と結論して良いのなら、自分の予想どうりの結果が 得られるまで何度でも実験しても良いことになっておかしいような気がする。
>680 いい疑問。 有意差が出るまでやり直してたら、無作為とは言えない。 つまり、やり直しがマズイ。 まぁ、発表される方は、データを隠されたらわからないけどね。 やってる人はいるでしょう。。。 臨床試験とかだと、どんな試験をするかをプロトコールに明記して、 国に提出して、その通りにやらなければならない。
>>679 階級 階級値 度数 累積度数
0-10 5 1 1
11-19
すまん.書き込み中に送信してしまった. ということで,手元にあるデータは下のようなものでよろしいか? 階級 階級値 度数 累積度数 0-10 5 1 1 11-19 15 3 4
標準偏差(をはじめとする統計量)を計算するには, ある階級に含まれるケースは,すべてその階級の階級値を取る と見なせばよい. 上では中間値と書いたけど,階級値は通常中間値を取るから,同じことだ. で,上の例だと,4つのケースの値は{5,15,15,15}になる. このようにして,手元の度数分布表から全てのケースの値を書き出して, それをエクセルに1列に入力する. そうすれば,エクセルの関数で標準偏差を計算してくれる. エクセルの関数は検索して調べて頂戴.
685 :
132人目の素数さん :04/06/26 18:32
どなたか「空間的自己相関」について簡潔に説明あるいは、 それについてのいいサイトがあれば教えて頂けないでしょうか? (英語でもいいです) ぐぐってみたけど、良くわかりませんでした。 たとえば空間内の距離が大きくなるにつれて、 空間内の因子の説明変数の相関が大きくなったり小さくなたりということ だと思うのですが、「自己」という言葉の持つ意味が良くわからないのです。
686 :
132人目の素数さん :04/06/26 19:20
>>676 さん
本当に本っ当にありがとうございました。なんとかできました。感謝です。
>>687 神様ありがとうございます!
私も十分わかった気になれました
689 :
132人目の素数さん :04/06/26 23:01
反復測定(分散分析・多重比較)について詳しく書いてある本が欲しい…。 探しても詳しく書いてある本が見つからない_| ̄|○。
691 :
132人目の素数さん :04/06/27 20:13
文系で統計の初心者です。 授業で習ったんですが、先生の説明が良く分からないのでお聞きしたいのですが・・・。 単回帰モデルでYi=α+βXiってのを習いました。これの意味は分かります。 でも、多変数回帰になって、Yi=β1X1i+β2X2i+・・・+βnXniってのが良く 分かりません。Xの添え字が二つになってるんで・・・。 Yi=β1X1+β2X2+・・・+βnXnとは違うものなんですか? Xの添え字が2つになっている理由と、表している内容についてどなたか 教えていただけませんか? お願いします。
>>691 Y1=β1X1+β2X2+・・・+βnXn
・・・
Yi=β1X1+β2X2+・・・+βnXn
・・・
Yn=β1X1+β2X2+・・・+βnXn
これだと、Y1〜Yn 全部同じ式だよ。
単回帰モデルのデータ Y1 X1 Y2 X2 Y3 X3 : Yi=α+βXi 多変数回帰モデルのデータ Y1 X11 X21 X31 Y2 X12 X22 X32 Y3 X13 X23 X33 : Yi=β1X1i+β2X2i+β3X3i
あ、書いてる間に、かぶってしまった。
695 :
132人目の素数さん :04/06/27 21:55
>>692 >>693 ってことは、多変数回帰モデルのデータを
Y1 X1 Z1 W1
Y2 X2 Z2 W2
・
・
Yn Xn Zn Wn
と考えたら、この場合は
Yi=β1Xi+β2Zi+β3Wi
になるってことですか??
そういうこと。 単回帰だと 目的変数Y説明変数X 多変数回帰だと 目的変数Y説明変数X,Z,W 複数の説明変数で目的変数を予測しようというのが多変数回帰
697 :
132人目の素数さん :04/06/27 22:43
>>696 ありがとうございます。
やっと分かりました。
どーでもいいが、最近は重回帰分析を多変数回帰って言うのかな?
俺も初めて聞いたが、変えると話ややこしそうだったから、そのままにしといた。
700 :
132人目の素数さん :04/06/28 20:57
>>698 ,699
他はどうかしりませんが、今の授業では多変数回帰って言ってます。
教科書も多変数回帰ってことになってます。
でも、去年は重回帰分析って習いましたが・・・。
まぁ、multiple regression の訳語だから多変数回帰でもいいのかもな。 あんまり聞かないけど。
702 :
132人目の素数さん :04/06/28 23:39
>>690 マヂレスありがとうございます。
この本のタイトルは訊いたことありまつ。
(多重比較は仕事で最近使うことになり、
それまでは多重比較について無頓着ですた)
最近は多重比較に関しての様々な実例や問題点(欠測値が発生した時の対処方法)
を探すため、必死に本を調べる毎日です。
噂によると、薬効データの統計解析や前臨床統計解析の本に
反復測定の記述が充実しているという情報も…。
703 :
132人目の素数さん :04/07/01 14:32
19 名前:名無しさん@引く手あまた 投稿日:04/06/29 20:44 JDij3Lsz 百発百中と言っている弓の名手が 2回続けてはずした。 さてこいつは嘘を言ったことになるか、統計学を使って答えなさい。 誰かこれわかる?全然わかんねーよどういうことさ??
704 :
132人目の素数さん :04/07/01 15:02
>>703 どういう状況で2回続けてはずしたのか?
単発で2回だけ打たせて全てはずしたのか?
それとも「百発百中」を確かめるために100回打たせたところ
2回連続ではずしたことが1回以上あったのか?
判断するには条件不足だと思われ。
705 :
132人目の素数さん :04/07/01 16:32
そんなに難しく考えないで良いのでは? 仮に99%の確率で命中すると仮定する。 その時、2回連続ではずす確率は0.0001。 有意です。 じゃ駄目かw
706 :
132人目の素数さん :04/07/01 17:03
>>703-705 「百発百中」とは、百回打てば平均99.5回以上命中することを指すと考えられる。
よって命中率は99.75%近くであると考えられ、
二回連続ではずす確率は0.00000625まで下がる。
707 :
132人目の素数さん :04/07/01 18:02
705 : 80点 706 : 60点
初歩的な質問で大変申し訳ないのですが、ご教授頂ければ幸いです。 アンケートや経営事象に対して統計分析をしたいと考えている者なんですが、 統計ソフト(SPSS,Rなど)や統計入門書類のものを読んで、分析の方法は 多少は何となく分かってきたのですが、そのような表層的なものから発展して もう少し突っ込んで理論から勉強したいと思っています。 # 少し難しめの統計学書に出てくる数式がさっぱりなので。。。 高校までの数学の知識を前提に、統計学書のある程度理論が理解できるよう になるまで、具体的に何が必要ですか? # 大学教育は受けていないですが、高校時代の数学の参考書を引っ張り # 出して、何とか高校までの数学まではマスターしました。お恥ずかしながら。 大学1年で履修する微分積分と線形代数で足りますか? 微分方程式やフーリエ解析まで勉強する必要はあるでしょうか? 因みに、今特に興味を持っている分野は、項目応答理論、遺伝的アルゴリズム、 時系列分析です。
微分積分と線形台数はやっといて、 あとは出てきたときに勉強すればいいと思う。 最近、高校時代の参考書みたいな教科書が出てるから 1回生で習う微分積分と線形台数と確率統計は すぐマスターできると思うよ。
台数->代数 誤変換、かっこわる。。。。。。。。
712 :
132人目の素数さん :04/07/02 18:28
確率変数XとYが独立で、正規分布(μ、σ^2)に従うとき、 T=(X+Y)/2、U=(X−Y)/2の分布を求める、という問題が分かりません。 解説をお願いします。
713 :
UltraMagic ◆NzF7MCEOec :04/07/02 21:11
There are three kinds of lies: lies, damned lies, and statistics.
ねた? 「正規分布の加法性」でぐぐれ
715 :
132人目の素数さん :04/07/03 00:22
>>710 その言葉を信じて頑張ります。
どうしても分からなかったら、また投稿します。
そのときは宜しくです!
716 :
132人目の素数さん :04/07/03 09:28
統計パッケージ(自分のはR、他のも同じっぽい)で 定数項を含むモデルの回帰と、定数項を含まないモデルの回帰の R^2値の計算方法が異なる? 定数項を含むモデルは、目的変数の標本平均からの距離 定数項を含まないモデルは、0からの距離 を基準にしている、と思うのですが、どうでしょうか? 中身の計算式が見れないTーT
717 :
132人目の素数さん :04/07/04 00:02
>>716 たとえば、SPSSだと定数項を含む場合は相関行列をもとにして各種計算が行わ
れるが、含まない場合は標準化交差積をもとにして各種計算が行われる。
求めるものとしては 定数項ありのモデルの重回帰 Se=Σ(Yi-hat(Yi))^2, St=Σ(Yi-bar(Y))^2, Sr=St-Se R^2=Sr/St 定数項なしのモデルの重回帰 Yを標準化{bar(Y)=0}しておいて Se=Σ(Yi-hat(Yi)^2, St=ΣYi^2, Sr=St-Se R^2=Sr/St ということでしょうか? あと、定数項ありのモデルと定数項なしのモデルを R^2で比較できないですよね? まぁ、当てはまりは定数項ありの方がいいし、 比較の必要性を感じないけど。
平均がmで分散が不明な正規分布に従う数を5つずつのグループに分けて、 その5つの数の最大値-最小値(つまり、5つの数の範囲)の平均と偏差を調べると それぞれR、sでした。元の正規分布の分散はいくらですか? お願いします。
>>719 課題の解答は自分で考えよう!
中心極限定理
中心極限定理でできる?
722 :
132人目の素数さん :04/07/06 22:35
平均時速ってどうやって求めるのでしょうか?
723 :
132人目の素数さん :04/07/06 23:29
SPSSという統計ソフトに関する質問はこちらでよろしいでしょうか? 世論調査データをもとに政治学の統計解析をしたいんですが、統計の図表の見方や用語がよくわかりません。 回帰係数やkendallのタウbとかcという言葉が変数間の相関を示しているのはわかったのですが、 数値がどの程度の大きさだと相関が強いのかがわかりません。 スレ違いだったら流してください。よろしくお願いします。
724 :
132人目の素数さん :04/07/07 01:02
>722 統計の問題ですか? 単純な運動の問題なら測定する二時点の差の空間ベクトルを時間差で割って求めます。 差を計算する順序に気を付けましょう。
725 :
132人目の素数さん :04/07/07 12:10
分散の散らばりでどのようなことがわかりますか? 例えば店舗の売上の散らばりを調べたら何がわかりますか?
726 :
132人目の素数さん :04/07/07 17:15
統計学で前から疑問に思っていたんですが なぜ正規分布になる結果は正規分布になるのでしょう 統計学では無くそれを応用する側の問題かも知れませんが
727 :
132人目の素数さん :04/07/07 18:20
>>726 何が言いたいのかわからない・・
統計量に関する漸近正規性とかの話しか?
それとも仮定の殆どが正規性であるということか?
728 :
132人目の素数さん :04/07/07 19:44
統計学初心者で、こんな問題も解けないのか!!と叩かれるのは分かっていますが どうしても分からないので質問させてください!! 問題 女性1200人を対象に1日のカルシウム摂取量を調査したところ、 平均値512mg、標準偏差95mgという結果を得た。 調査したデータは正規分布に従うものとして次の問に答えよ。 (1)調査した1200人の中で、1日のカルシウム摂取量が400mg以上600mg以下である者は何人ぐらいいるか。 (2) 〃 、 〃 が700mg以上の者は何人ぐらいいるか。 お願いします!!
729 :
132人目の素数さん :04/07/07 20:13
>>728 正規分布において、平均値からどれくらい離れたらどのくらいの出現確率になるか、をしらべてみなよ。
>>723 それはSPSSの使い方以前の問題だよ。
何でもいいから統計学の本を一冊買って熟読すべし。
731 :
132人目の素数さん :04/07/08 00:02
多変量解析の問題点を二つほどあげると
なにを解析するかを考えずに解析しても、とりあえず結果だけは出てしまう。
733 :
132人目の素数さん :04/07/08 21:04
質問させてもらいます。 対象行列Aの2次形式の性質、応用方法が全く理解できません。 自分でも情けないです。 理解のきっかけでも頂ければと思い、質問させてもらいました。 よろしくお願いします。
734 :
132人目の素数さん :04/07/08 21:22
>>733 幾つかの数をセットで考える場合、ベクトルの形で合理的に取り扱いできる場合が
たくさん在ります。
そのベクトルの座標のある二次式が重要な意味を持つ場合が在ります。
此れを二次形式と言います。距離の二乗、エネルギー、共分散等色々在ります。
二次形式の係数全部を纏めて考えたのが対称行列(の代表)です。
二変数であれば平方の完成と云うことをすればグラフの頂点や方程式の解の公式が
作れましたが、これに相当する手続きが行列としての対角化です。
この辺りの簡単な応用例を探して弄ってみるのが、理解の最短コースです。
736 :
132人目の素数さん :04/07/10 01:14
こちらのスレに誘導されたので質問させてください。 3人が[0、1]上の値を独立にかつ、ランダムにコールしそれをX1,X2,X3とし X=max(X1,X2,X3) Y=min(X1,X2,X3) とする。 このとき同時確率分布は f(x,y)=6(x-y) (0≦y<x≦1の時) 0 (それ以外の時) となるらしいのですがどのように求めているのですか? できれば詳しく計算過程も教えてください。お願いします。
>>736 学期末の課題? 単なるコケオドシだから、自分で考えてみて。
ヒントを出しておくと、y = X1 ≦ X2 ≦ X3 = x となる確率は、
X2 がどの範囲にあるかを考えればすぐ出てくる。あとは、並べ方。
# 問題作った人よくない。一様分布ということで作ってるみたい
# だけど、問題文ではそう特定できない。
>>735 お陰様で解った気がします。
3*3行列で実際に色々確かめたのも良かった気がします。
ありがとうございました。
739 :
132人目の素数さん :04/07/10 18:30
統計学入門書のいい本紹介してくださいまし、ベイズ統計とかにも触れてあるのがいいです。 ここでついでに 「マグロウヒル大学演習」の「統計」は買わないほうがいいぞ、 氏家勝巳・土井誠、おめーら自分の書いた本一度でも読み直したことがあるか!! 日本語になってねーぞ マグロウヒル大学演習シリーズは「離散数学」でこれは良い本だと思い、 各種買い揃えたけど大体良い本が多かったです、 しかし、この本だけは最悪だ 5ページ進むのに、一週間、あとから見直して、文書の意味を理解するだけでその8割の時間を費やしていて 内容理解が2割だと思ったとき、ゴミ箱行きにしてやったよ。 と、ちょっと、ブチきれモードだすた。
740 :
132人目の素数さん :04/07/10 19:48
ベイズ統計の良い本がないね。 研究者が少なく、活気がないのが問題か?
741 :
132人目の素数さん :04/07/10 19:51
>ベイズ統計とかにも触れてあるのがいいです。 ついでにベイズ理論という本はないんでないの? 考え方が違うからね・・
742 :
132人目の素数さん :04/07/10 20:30
>>739 P.G.ホーエルの「初等統計学」がお勧め。
3章でベイズ理論をわかりやすく、丁寧に解説している。
これ以上易しい本はないといわれているから、これを
何度か読んで、いろんな問題をベイズの定理を使って
解いてみるとよいでしょう。
ベイズ統計の本もある。
「ベイズ統計学入門」渡部 洋
「ベイズ統計入門」繁桝 算男
渡部のほうが易しいが、統計学の基礎知識がなければ
途中でひっかかるかもしれない。
743 :
132人目の素数さん :04/07/10 23:27
ベイズは実用に向かないのも事実だよね
744 :
132人目の素数さん :04/07/10 23:33
遺伝子関係ではベイジアンネットワークを多用しているぞ
745 :
132人目の素数さん :04/07/10 23:54
素朴な質問ですが 身長や成績が正規分布になるのは ポアソン分布の近似解として現れているに過ぎないと考えてよいですか?
746 :
132人目の素数さん :04/07/11 00:43
>739 ソフトカバーとハードカバーがありますがどっちがいいですか?
>>737 レスありがとうございます。
考えたんですけど。いまいちつかめません。。
もうすこしヒントをいただけないですか?
>>747 y = X1 ≦ X2 ≦ X3 = x となる確率を出すには、まず、紙
と鉛筆を用意して、適当な長さの線分を引く。つぎに左端に 0、
右端に 1 と書く。それから、好きなところに、y, x と書き込む。
で、X2 がどこにあればいいか考える。
あとは、並び方考えて、3!倍。
>>746 どうもです。助かります。
ちなみに、安いほうがいいです(笑)
750 :
名無しさん@そうだ選挙に行こう :04/07/11 18:12
差の有意差でnsって何を意味するのですか? かこいいおにいさまぁおせーてください!
751 :
132人目の素数さん :04/07/11 21:31
統計学の立場からして、選挙の出口調査って信用出来るの?
752 :
132人目の素数さん :04/07/11 21:48
信頼区間の中に入れば信用できる
753 :
132人目の素数さん :04/07/11 22:01
σ^2x これは何を表していますか? 分散でいいですか?
754 :
132人目の素数さん :04/07/11 22:27
xは何? σ^2は一般的に分散
755 :
132人目の素数さん :04/07/11 22:37
xはなんていったらいいんでしょう…年数って書いてます。 ありがとうございました!
関連する部分をまるごと書かないと通じないのよ。
757 :
132人目の素数さん :04/07/11 23:47
凄く初歩的な事なんですが、 「代表的標本」と「無作為抽出」の 意味を教えてください。
758 :
132人目の素数さん :04/07/12 00:41
age
759 :
132人目の素数さん :04/07/12 01:12
760 :
132人目の素数さん :04/07/12 16:59
名目成長率からGDPデフレーターと実質成長率の和を引いたもので 引き算を使わないで表す方法ってありますか?
762 :
132人目の素数さん :04/07/12 19:57
ヒストグラムの分割数を作るときにスタージェスの公式というのが目安にできるらしいですが この式の根拠っていうか、どうしてこんな式を作ったのかというか 式の意図みたいなものを知っている人いますか? あっちこっち見て回ったんですが、式しか書いてない・・・
763 :
132人目の素数さん :04/07/12 21:26
こんばんは! 統計学の資格みたいなものは、無いのですか?
>>748 レス遅れてすいません。なんとなくつかめましたがレポートとして提出なのでちょっと自信がありません。
もしよければ不備な点をご指摘お願いしたいです。
まずy = X1 ≦ X2 ≦ X3 = x となる場合を考える。X2はX1とX3の間に来ればよいので(x-y)となりX1X2X3の並び方は3!=6通りより
6(x-y)となる。 ←ここまではなんとなくわかったのですがこれがなぜ密度関数になるのか?一様分布というのはどこにからんでいるのか?
ここらへんが自分のなかであいまいですっきりしません。
今春から確率統計の勉強を始めたばかりの素人なのでヒントをお願いします。
765 :
132人目の素数さん :04/07/12 22:18
統計に関してわからないことがあり,投稿しました. どなたか統計に詳しい方,ご教授ください. ある測定法に関して,旧法と新法があり,下記のデータより,両者に差がないことを証明する場合, どのような統計解析をすればよいのでしょうか? まず私が取りかかったのは,分散の検定後,t検定による平均値の差の検定をしました. 3ロットとも差がなければ,旧法と新法に差がないと判断しても良いと思ったからです. でも,このやり方は下記のようなデータでは使えないような気がして質問した次第です. 【データ】 ロットAの結果 旧法で得た結果:11 新法で得た結果:10 ロットBの結果 旧法で得た結果:48 新法で得た結果:53 ロットCの結果 旧法で得た結果:84 新法で得た結果:78 ※各結果はn=3の平均値です. よろしくお願い致します.
>765 よくみなさん誤用されるのですが、 統計では、”差がない”ことは結論できません。”差がみつからない”と結論します。 ロットA、ロットB、ロットCのどれでも差がみつからないことを言いたければ、 各ロットでの信頼水準を1-α’とすれば、全体の信頼水準は(1-α’)^3になります。 全体の有意水準をαとして α=1-(1-α’)^3 からα’を逆算して検定すれば大丈夫。
768 :
132人目の素数さん :04/07/13 17:23
標本削除平均について調べているのですが 全く手掛かりがつかめません・・・ 参考文献(『初等統計学1』/バタチャリヤ=ジョンソン著)は絶版、 図書館でも既に貸出中とのことorz 標本削除平均とはどのようなものなのか、定義や例などあれば教えてください。
769 :
132人目の素数さん :04/07/13 23:54
>>768 trimed mean のことだと思います。
データの大きい方と小さい方から、
同数ずつデータを取り除いた残りのデータの
算術平均値のことだと思います。
「思います」というのは、使ったことが
なくて、以前、本で読んだだけだからです。
結果としては、中央値と同じように、
はずれ値の影響を受けにくい平均値と
いうことが言えると思います。
標本数に対して分散値から削除するデータ数を
決めるなどありそうだと想像できますが、
詳しいことは覚えていませんので、
理論的妥当性なども含めて、図書館から本を
借りられるようになったら、確かめてください。
>769 trimmed mean・・ってことは刈り込み平均と同義ですかね もうちょっと調べてみます。 ご回答ありがとうございました。
Z^dの単純ランダムウォークで d=3 だとする。 n段階で空間的なひろがりはどうなるか?(n時間後に、例えば 数直線若しくは座標でどのあたりにいるのがメジャーな状態か?) 解らない問題スレでスルーされました。どなたかお願いします。
772 :
132人目の素数さん :04/07/15 07:14
あれ>
>>742 どもです、
「P.G.ホーエル」が見つからなかったので、
「ベイズ統計入門」繁桝 算男
を買いました、これいいですね、すごくスッキリしている。
知識的に足りない部分は「東京大学出版会」の「統計学入門」で補う事にしました。
>>767 どもどもです、助かります。
774 :
132人目の素数さん :04/07/15 22:40
>>766 その方法でよいの?
標本が3以上の時はt検定は使えず、分散分析を使わないといけない
と習ったんですが・・・
>774 多重性に気を取られて、分散分析を忘れていた。 有意水準の調整をするより、統計量作れた方がいいに決まってる罠 ああ、はずかしぃ。
777 :
132人目の素数さん :04/07/17 12:18
社会学方面の論文なんか見ていると、正しく回帰分析類を使えてるのは10%に満たないような気がしています。 全く意味をなさない数字を出して話を進めているのですが、咎める人はいないのでしょうか?
>>777 どんなの?
90%の方にどんなのがあるか晒してみそ。
もしくは、どのような誤用があるか問題点を指摘されたし。
779 :
FeaturesOfTheGod ◆UdoWOLrsDM :04/07/17 16:14
Re:>777 咎める人が少ないのは、論文を細部に亘って読む人が少ないからだろう。
780 :
132人目の素数さん :04/07/17 17:23
>>777 10%という数値がどこから出てきたかわからないが、
データに語らせる、という実証分野の研究においては、
データによって考慮しなければならない事が違っている。
学士論文ぐらいじゃ、「ま、適当に回帰分析でもやってみるか」
ぐらいの論文しかないのは、しかたないと思うな。
修士論文は、ほとんど無茶苦茶に思えるし、
博士論文やジャーナル掲載論文でさえも、ごく一部を除いては、
「いい加減だなあ」と思ってしまう。
だから、実証なんてやると、苦しいだけで、評価を受けるのは
至難のこと。
おれ、実証研究はやめて、理論だけやろうかと思っているぐらいだ。
金融時系列のフラクタル分析(P10〜11) 全期間にわたって取引が行われない確率aが一定であると仮定する。 取引が行われたかどうかを表す指標関数Stを 1 取引なし a St≡{ 0 取引あり 1-a とすると、取引のない期間の長さktを kt≡“∞Σk=1”(“kΠj=1”St-j) ※ここでは、Σの上に∞、下にk=1と言う表記を“∞Σk=1” Πも同じく“∞Πk=1”と表記させてください St-jはStからjを引いてるのではなくtからjをひいてます。 ここまでほぼ本のとおりです。 “∞Σk=1”(“kΠj=1”St-j)を解いてみると =“1Πj=1”St-j+“2Πj=1”St-j+“3Πj=1”St-j+・・・+“∞Πj=1”St-j =St-1+St-1×St-2+St-1×St-2×St-3+・・・+St-1×St-2×St-3×・・・×St-∞ となると思うのですが、途中までといてみても 確率から期間が出てきたように感じてしまい kt≡“∞Σk=1”(“kΠj=1”St-j) 何故この式がでてくるのかさっぱり分かりません。 解説おねがいします。
782 :
132人目の素数さん :04/07/18 02:41
質問スレでスルーされてしまいました・・・ XとYが正規分布(μ、σ^2)に従う独立な事象の確立関数であり、 A=(X+Y)/2,B=(X−Y)/2とおくと、 AとBが独立であることを示すには、どうすればいいですか? 教えてエロい人
> 教えてエロい人 古すぎ。おもしろくもない
>781 t=1のとき取引があったとすると、 ...., S_0=1, S_1=0, S_2=1, S_3=1 k_3=S_2 + S_2*S_1 + S_2*S_1*S_0 + ... =1+1*0+1*0*1+... =1 k_4=S_3 + S_3*S_2 + S_3*S_2*S_1 + S_3*S_2*S_1*S_0 + .... =1+1*1+1*1*0+1*1*0*1+.... =2 ということでは?
>782 A,Bが独立⇔Pr(A<a,B<b)=Pr(A<a)Pr(B<b)
786 :
132人目の素数さん :04/07/18 23:46
SARSは、これまでに累積患者数が8100人に対して死亡者数は770人 (死亡率0.095) である。SARSの死亡率は10%であるという仮説H0:P=0.10に対してそれ よりも低いという対立仮説H1:P<0.10を設定し片方検定しなさい。ただし、 検定のサイズはα=0.05とする。 お願いします。説き方おしえてください
H0 p=0.1 有意水準を0.01とすると、n=8100,p=Po=0.1、両側検定なんで、公式を使い Po-2.576*√{Po*(1-Po)/n}<p'<Po+2.576*√{Po*(1-Po)/n} p'(=770/8100)がこの範囲内にあれば棄却できない、範囲外だと棄却できる。
ごめん。よく読んでなかった… H0 p=0.1 H1 p<0.1 有意水準を0.05とすると、n=8100,Po=0.1、片側検定なんで、公式を使い p'<Po-1.645*√{Po*(1-Po)/n} の場合H0は棄却。それ以外は棄却できない。 p'=770/8100ね。
>>784 ありがとうございます。
式の意味をきちんと理解できました。
ある地点での車のスピードを調べたところ、ほぼ正規分布にしたがっており、 平均60km、標準偏差は20kmであった。制限速度が40kmのとき何%の車 が違反をしているか?これってどうやってとけばいいんですか?お願いします。
791 :
132人目の素数さん :04/07/19 23:59
>>788 たすかりました
あとでメシおごりますよ
時間順に観測した(たぶん自然ではない人工的な)データ列に関して モデル生成とか、予測について論じた 代表的な研究や最新の研究を教えてください。
793 :
132人目の素数さん :04/07/20 17:15
>>793 標準正規分布表使って、どうやって解けばいいんですかね?
レベル低くくて申し訳ないんですが、教えて頂けませんか。
よろしくお願いします。
795 :
132人目の素数さん :04/07/21 01:54
>>794 おいおい…(;´Д`)
平均60km/h、標準偏差20km/h、制限速度40km/hから、
平均から20km/h以上「遅い」車しか制限を守っていないことになる。
よってz=20km/h。
z=σとなるので、表のz=1.00σの部分を見ると0.158655
全体を1としたとき0.158655の車しか制限を守っていないということになる。
よって、答えは1−0.158655=0.841345より
約83%。
ぶっそうな道路だ。
796 :
132人目の素数さん :04/07/21 01:55
わあ間違いw 約84%だね。
798 :
132人目の素数さん :04/07/21 02:03
しかし6〜7台に1台は制限速度を守っているのに、 同じぐらいの数だけ倍の速度で突き抜けていく車が存在するということだ。 100台に1台は100キロ越えだ。 いくらなんでも設定に無理があるのでは…。
799 :
132人目の素数さん :04/07/21 12:24
Y=α+βX+γZ+εという回帰式において、帰無仮説:α+β+γ=1、対立仮説: α+β+γ≠1を検定するために、回帰式の変形をするってのはいいのですが、 どのように変形して、どの係数についてt値を見ればよいのでしょうか? どなたか教えてください。
800 :
132人目の素数さん :04/07/21 20:58
多変量解析についての質問です。頭がモヤモヤして仕方ないので質問させてください。 重回帰分析は 1.説明変数間は独立でなければならない 2.交絡因子を調整した結果をアウトプット の2点を満たすと思うのですが、1と2が矛盾しているような気がして仕方がないのです。 (1)説明変数間に相関関係があるから交絡因子と言うのですよね? (2)説明変数間に相関関係があるとマルチコが生じるのですよね・・・? 統計初心者ゆえ、用語などもでたらめかもしれませんがアドバイスお願いします。
801 :
132人目の素数さん :04/07/22 01:17
自分の考えですが。 重回帰分析について 偏回帰係数を見たい場合は、 説明変数間が独立であることが必要 推定量として用いる場合は、 説明変数間が独立でなくても、不偏性は保持される、が、 独立変数間に非常に強い相関があったり,一次従属な変数関係がある場合には、 解析が不可能であったり,たとえ結果が求まったとしてもその信頼性は低い。 よって、説明変数間に高い相関があるものを含めない方がよい。 と解釈してるんですが、どうでしょうか?
ちょっと調べなければならなくなったんですが この分野の人間ではないので質問しました。 多変量時系列分析というか 多次元な時系列データに関する観測法とか、モデル推定だとか、予測するとか 効率的にやる方法など 特に最新の研究というと有名なものでは どんなものがあるんでしょうか?
803 :
132人目の素数さん :04/07/25 22:47
↑おれは最近、時系列関係はやってないから、 最近の状況はなかなかわからないんだけど、 時系列で新しい分析方法が発表されたとか、 そういうのは、最近聞いてないなあ。 時系列の学習書として定評があるのは、 "Time Series Analysys" , Hamilton かなあ。 すごく詳しいんだけど、分厚くて重量あるから 持って歩くのは大変だけどね。
すみません。系統誤差など、計算上の誤差について 詳しく書かれた文献もしくはウェブサイトをご存知のかたいらっしゃいますか? もしいらしたら教えていただきたいのですが・・・
805 :
132人目の素数さん :04/07/27 11:59
あげ
806 :
132人目の素数さん :04/07/27 14:44
統計学まで萌えに汚染されとる… しかもオーム社…
807 :
132人目の素数さん :04/07/27 17:38
>>804 「計算上の誤差」をどういう意味で使われているか
不明ですが、桁数不足によるもの、浮動小数点の内部表現形式に
起因することなら、精度保証計算などの論文を見られるとよいでしょう。
ただ、それらの「誤差」が系統誤差になるかどうかというと
本質的に違うと思いますよ。
系統誤差に関しては、おれは詳しくないですが、
観測値が何らかの理由によって「傾く」という
ことですから、これは言葉で説明することは
可能かと思いますが、理論的に扱うことは困難とされている
と思いましたが・・・。
808 :
132人目の素数さん :04/07/27 19:07
>>807 レスありがとうございます。
実は実験解析を扱っている者ですが、あまり統計学については詳しくなく、
そこで専門的なことを知っている人が居たらと思ってカキコしました。
私が知りたいのはまさに後者の系統誤差とか統計誤差とか言われるところです。
確かに測っている定規そのものが間違っているみたいな感じなので、
理論的に扱うのは困難でしょうね。
811 :
132人目の素数さん :04/07/31 13:33
■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■ ベイズ統計学も知らずに量子力学を勘違いしている馬鹿物理学者へ。 量子力学は観測が振る舞いに影響を与えてしまう超ミクロ世界を論じている。 量子は観測できない。よって、確率(事後確率)を論じることができない。 だから事後確率の代わりに、観測者の思い込みを確率であるかのように扱う(尤度)。 それが波動関数と呼ばれるわけだ。 さて、観測によって事後確率が得られると、尤度はその瞬間に意味を為さなくなる。(波動関数の収束) 観測者の思い込みが壊れるんだから、これは当然だ。しかし、馬鹿物理学者はこれを「決定」と呼ぶ。 お前らは真性の馬鹿か? これは「判明」であって、「決定」ではない。小学生でも分かることだ。 「観測前に『決定』は起こっておらず、観測時に『決定』が起こる」 だと? 馬鹿も休み休み言えよ。それは尤度(思い込み)と事後確率(観測結果)を 同一時間軸に並べる愚行の結果に生み出される妄想なんだよ。 それが許されるのは量子の振る舞いを記述するときだけ。妄想を現実世界に持ち込むな!!! 実際は、観測前に「決定」は起こっている。それを観測できていないだけだ。 現象を直接観測することが不能であるが故に、やむなく波動関数=尤度を使って 量子力学は記述されているのに、「世界は波動関数なんだ!観測されなければ決定は起こらない! 人間の主観こそが世界を決定しているんだ!」 なんて叫んでいる物理馬鹿の、多いこと多いこと。 迷惑だから馬鹿物理学者はベイズ統計学を学んで考えを改めて学会に反省文でも提出してろ。 ■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
813 :
FeaturesOfTheGod ◆UdoWOLrsDM :04/07/31 14:01
実際のところ、波動関数自身の物理的意味は明らかになっていないとか。 (ドブロイ波とかいうのがあるけど、あれもどうなんだろうねえ?)
>>812 いやだ。
ボロを出せば叩かれるからな。
私は数学も物理も専門じゃない。
私はただの本好きのいちプログラマに過ぎない。
私は論理学と数学と物理学の間に見出した新しい関連を君に伝えた。
そして数式を構築して実験で観測するのは学者の仕事だ。
私の仕事は既に終わっている。
815 :
132人目の素数さん :04/07/31 14:40
・観測前に確率(事後確率)は存在しない。 ・観測前に存在するように思われる確率のようなもの =尤度 =観測者の思い込みを広義の確率として扱えるように定義したもの ・観測前の量子は、波動関数で確率的に表現される。 ・観測前の量子は、尤度で表現される。 ・波動関数から得られる確率は尤度である ・波動関数の収束は、尤度(思い込み)が事後確率(観測結果)に転化する状況を意味している ・波動関数の収束は、「決定」を意味しない。 ・波動関数の収束は、「判明」を意味している。 ・観測時に「決定」が起こるという考えは、誤りである。 ・観測時に起こるのは「判明」である。 ・間違い 「シュレディンガーの猫の生死は、観測者によって観測されるまで『決定』されない。」 ・正解 「シュレディンガーの猫の生死は、観測者によって観測されるまで『判明』されない。」
>>814 まぁ、そう固くなるな。確率解釈を否定する立場(俺)から、見て新鮮な議論だよ。
波動函数の理解が半端に見えるが。
817 :
132人目の素数さん :04/07/31 17:29
818 :
132人目の素数さん :04/07/31 18:08
Mantel's test ができるフリーソフトで、 シンプルなやつをどなたかご存知の方いませんでしょうか?
819 :
132人目の素数さん :04/08/01 18:56
820 :
132人目の素数さん :04/08/01 22:40
>>820 なるほど、理解しました。
でも、それって結婚した人のうちどれだけ離婚したのかが分からないから、
全然参考にならないですよね('〜')
>>781 僕もその本が気になって読み始めました、たしかにその部分わかりにくいですよね。
まず、多銘柄に対して説明していないのに、多銘柄に対応するべくiを入れてあるけど
誤解を招くから、取り除いて欲しいと思った。
連続した非観測日も、あれは解説がないとかなりトリッキーだよね。
休みの日={1,1,1,0,1,1,1,1,0,0}
とすると
1
1*1
1*1*1
1*1*1*0
1*1*1*0*1
以下もう0が出てきたので、以下全部0
1は幾つ掛けても1だから、合計すると日数になると。
これで関数kができたから、この期待値・分散を計算してみようと・・・
なるほど面白いけど説明無しだと何が起こっているのか意味不明。
>>811 私は物理学者ではないが、代わりに返事しよう。
>■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
>
>ベイズ統計学も知らずに量子力学を勘違いしている馬鹿物理学者へ。
>
>量子力学は観測が振る舞いに影響を与えてしまう超ミクロ世界を論じている。
>量子は観測できない。よって、確率(事後確率)を論じることができない。
>だから事後確率の代わりに、観測者の思い込みを確率であるかのように扱う(尤度)。
>それが波動関数と呼ばれるわけだ。
>
>さて、観測によって事後確率が得られると、尤度はその瞬間に意味を為さなくなる。(>波動関数の収束)
>観測者の思い込みが壊れるんだから、これは当然だ。しかし、馬鹿物理学者はこれを「>決定」と呼ぶ。
>お前らは真性の馬鹿か? これは「判明」であって、「決定」ではない。小学生でも分>かることだ。
>
>「観測前に『決定』は起こっておらず、観測時に『決定』が起こる」 だと?
>馬鹿も休み休み言えよ。それは尤度(思い込み)と事後確率(観測結果)を
>同一時間軸に並べる愚行の結果に生み出される妄想なんだよ。
>それが許されるのは量子の振る舞いを記述するときだけ。妄想を現実世界に持ち込むな>!!!
> >実際は、観測前に「決定」は起こっている。それを観測できていないだけだ。 >現象を直接観測することが不能であるが故に、やむなく波動関数=尤度を使って これは全て的はずれ。物理世界がエルゴーディックなら、完全に正当化されうる。 君が言うべき事は、「物理学的世界がエルゴーディックであるという証明などない ではないか」ということであるべき。 しかし、エルゴーディックという仮定は自然なものであり、単に疑問を述べるだけ では >迷惑だから馬鹿物理学者はベイズ統計学を学んで考えを改めて学会に反省文でも提出してろ。 > >■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■ こんな偉そうなことは言えない。 エルゴーディックでないと言う証明をオマエがまずやれ。
他と無関係に(?!)、唯一意味を持っている箇所は >量子力学は記述されているのに、「世界は波動関数なんだ!観測されなければ決定は起こらない! >人間の主観こそが世界を決定しているんだ!」 なんて叫んでいる物理馬鹿の、多いこと多いこと。 ここだけ。そしてここの部分は、「判明」だの「決定」だのは無関係。 (なんのこっちゃそれは?) >「世界は波動関数なんだ!観測されなければ決定は起こらない! これは正しい。問題は、このことと >人間の主観こそが世界を決定しているんだ!」 とがつながらないことに気づいていない人間が一部いるということ。 例を挙げてもう少し分かりやすく説明しよう。 例えば手にサイコロをもって、振る。振ると目がでる。振らなければ目は出ない。 その意味で手はサイコロの目が出るという事実を「決定」している。 しかし、何の目がでるかを決定はしない。 波動関数は観測しなければ収束しない。観測すれば収束する。 だからこの意味で観測(人間の主観?)が決定している。 しかし、どういう収束をするかを決定しているのでは断じてない。 だから「人間の主観こそが世界を決定している」という言い分は成立しない。 それはサイコロを振るかどうかの決定権を人間がもっているという事実を根拠として、 なんの目が出るかを決める権利まで人間がもっていると主張しているのと同じだ。 無論ナンセンスだ。
827 :
132人目の素数さん :04/08/02 00:20
>>822 えーとですね、おれは人口とか世帯の調査が
専門ではないのですが、おおざっぱに説明しますと、
年が経過するにつれて現在の夫婦も年をとり、今の子供たちが
結婚する年になって、またその子供が・・・、というのを
考えなければならないのです。
そうすると、現在の出生率が一定であると仮定して、寿命が75才
と仮定して、30才までには9割が結婚するとして、(全部仮定になります)
そして人口構成比から、順次推定を繰り返していかなければならない
と思います。
そういうふうに仮定をおいて、推定を繰り返せば、例えば
今後40年間に一度結婚した人が、生涯に離婚をする確率は、
推定値として、だいたい20%から25%となる、というふうに
なるのだと思います。
かなりこみいった計算が必要になると思いますから、
論文を検索して、その結果を引用するほうがいいと思います。
ただ、論文によって仮定が異なりますから、結論も多少異なると
思いますけど・・・。
>>825 エルゴード性などとはどこにも書いていないのに、いきなり何を言い出すんだい?
まずは、どうしてエルゴード性の話を持ち出したのか説明するところから始めたまえ。
でなければ君以外にとって、君のレスは煽りと見分けがつくまい。
ちなみに私は、物理法則にエルゴード性があるという仮定の下での話しているんだが。
>>826 あらゆる粒子は他の粒子を観測対象に持つと同時に、
他の粒子によって観測されている。それが「干渉」ということでは?
観測→
(A) (B)
←観測
ならばあらゆる決定は人間不在の場所で進行し続けているはずだ。
すなわち 「観測されなければ決定は起こらない!」 という命題は、
「(観測者の立場に立ち得る他の粒子によって)観測(干渉)されなければ決定は起こらない!」
であるときだけ、正しいということなのでは?
故に、シュレディンガーの猫の生死は、蓋を開ける前に蓋の中の粒子によって観測(干渉)されることで、
既に完全に決定されている。人間の観測者は過去に起きた決定を観測し、
結果が「判明」するだけだ。決して、蓋を開けることで「決定」が起こるわけではないのだ。
物理板でなく数学板で必死になる理由がワカンネ。 むこうの板でやるとまずい話なのか? なんなら物理板にスレ立てるけど。
エルゴーディック云々は、もしかしたらオレが外したのかも。。。
物理板に行くのがいいと思うけど、おそらく「判明」と「決定」とを区別する理由が
分からないと言われるだろうね。(物理学的に同じことだから)
あと、
>>826 に書いたことにちゃんと反応してない。
君は実は何も言っていない。物理学者が言っていることは
「人間の主観は世界の一部だ」ということなのであって、
「人間の主観こそが世界を決定しているんだ!」などとは言っていないハズ。
(一部のトンデモは知らないよ。)
だから、そもそも君の主張はズレていると思う。
ちょっと補足。 >(物理学的に同じことだから) というのは「判明」と「決定」とを混同しても、 物理学的になんの矛盾も生じない、という意味だよ。 だから君が言うべきは、「いいや、こうこうこう言う矛盾が生ずる」 でなくてはならないよ。「なんか変な気がする」みたいなことを 言っているだけで、 >迷惑だから馬鹿物理学者はベイズ統計学を学んで考えを改めて学会に >反省文でも提出してろ。 こんなことを言ったら、バカは君のほうだからね。
さらに補足(つーかいいわけ)
>>826 の
>波動関数は観測しなければ収束しない。観測すれば収束する。
は間違いだね。人間が観測すれば収束するが、人間が観測しなくても収束するね。
オレもオレで理解が浅いから、どうもレスが混乱している。
やっぱ、物理板に行くのがいいっすね。
834 :
132人目の素数さん :04/08/03 20:47
835 :
132人目の素数さん :04/08/03 22:32
今モーメント母関数について勉強しているのですが、ちょっと気になる事があって質問します。 確率密度関数からモーメント母関数への変換ができるのなら、 その逆、モーメント母関数から確率密度関数は作れないのでしょうか? 離散型なら、鶴亀算で解いてしまえば良いというのは判りました。 連続型でも解けそうな気がするのですが、解き方がどうしても判りません。
836 :
132人目の素数さん :04/08/05 00:38
検定結果の表記についての質問です。 検定を行なった論文や報告書について 0.01≦P<0.05 なら* 0.001≦P<0.01なら** P<0.001なら***と P値の階層ごとに星の数を増やす表記はあまりイクナイ。 統計解析の結果は、帰無仮説に基づいた統計量(T値やF値等)とP値を 「そのまま」記載するべきである。 という警鐘をよく聞くのですが、このような思想が起こったのは、 「P値が小さいほど、差が大きくなる」という勘違いを蔓延させないためですか? しかし、世の中には、このような*を沢山ちりばめたグラフや表がイパーイ。 難しいところですね。
837 :
132人目の素数さん :04/08/05 09:01
>>836 昔はさぁ、α=.05 (など)における統計量と、データから算出される統計量
を比較して「有意であるか否か」を判定してたんだよ。だから、三段階くらい
の荒い判断しかできなかった。
しかし、ソフトウェアの発展と普及にともなって、観察データから算出される
統計量の p 値が直接求められるようになった。
> 「P値が小さいほど、差が大きくなる」という勘違いを蔓延させないためですか?
別に p値をそのまま出しても勘違いはなくならないと思う。
要は、三段階程度の「荒い」基準ではなく、より詳しい p 値を提示した方が
情報量がおおかろう、ということではないのか?
>>835 (面倒くさい議論は全部おいておくとして、)
モーメント母関数
M(t) = ∫f(x)exp(tx)dx
t = iω を代入すれば、M(iω) は f(x) のフーリエ変換になるから、
これのフーリエ逆変換を考えて
f(x) = ∫M(iω)exp(-iωx)dω
という風にモーメント母関数から確率密度関数を求められる。
検定ってなんか論理が転倒してるよな
840 :
132人目の素数さん :04/08/05 15:05
ある分布をエクセルを使用して対数正規分布に近似する方法を教えていただけませんか? (1/((SQRT(2*3.1415))*σ*x))*EXP(-((LN(x)-μ)^2)/(2*σ^2)) μ:平均値,σ:標準偏差 ↑の対数正規分布の式でμ、σをソルバーを使って変化させ、元の分布にもっとも近い形になるような値を求めてみましたが、 どうもうまく行きません。 正しい近似法などがありましたら教えていただけないでしょうか? 一応、自分でも検索してみましたがなかなか見つからないのでここでお訊きしようと思いました。
ありがとうございま なかなかよさそうなスレッドですね。 そこで訊いてみます。
>>838 どうもです、しかし不思議です僕は離散でのモーメントを計算した時、
実数の範囲で、それも一次方程式の範囲でグリグリと解いていたので、
どんどん方程式を増やしていって連続になるときも、当然実数の範囲になりそうな気がしました。
ところが、二次方程式があるわけでもないのに複素数を使うと解けるとは…
844 :
132人目の素数さん :04/08/06 22:07
チェビシェフの不等式というのがありますが、 これは平均と分散から確率の最大・最少を計算することができます もしも、平均・分散以外にもっと高次のモーメントが求まっていると もっと細かく確率が計算できそうな気がするのですが、そういうのってあるんでしょうか?
845 :
132人目の素数さん :04/08/07 00:00
>>844 確率変数Xの平均をE(X), 分散をV(X)とするとき, チェビシェフの不等式は
∀ε>0, P(|X-E(X)|>ε)≦V(X)/(ε^2)
と書かれることが多いが、もっと一般にnを自然数とするとき,
∀ε>0, P(|X-E(X)|>ε)≦E(|X-E(X)|^n)/(ε^n)
が成り立つ。V(X)による評価はn=2の場合。これが高次モーメントによる評価といえないか?
さらに一般に、f(x)を[0,∞)上の非負単調増加関数とするとき,
∀ε>0, P(X>ε)≦E(f(max{X,0}))/f(ε)
が成り立つ。Xとして|X-E(X)|を代入し,f(x)としてx^nをとれば上の式になる。
これらもチェビシェフの不等式と呼ばれる。
846 :
132人目の素数さん :04/08/07 09:15
シンプレックス法を利用した非線形最小二乗法の方法について解説してある 本かサイトを教えてもらえませんか?
847 :
132人目の素数さん :04/08/07 14:16
買っちまったよ。オーム社。 買うまいと思ったんだけどなあ。
>>847 感想どぞー
もえたんは絵は可愛いけど英語はダメダメだからな。どうせオーム社のもそんなんだろ?
849 :
132人目の素数さん :04/08/11 08:50
これが意外にちゃんとしてる。 独立性の検定を出来るようになるまでやってくれる。 もえたんよりはずっとまともな本でした。
『n面体のサイコロを、すべての目が1回ずつ出るまで振り続けた場合の平均の回数』 を求めるには、どんな式を立てれば良いのでしょう? 最低の回数はnですが、最高は上限なさそう(いくら振っても目当ての目が出ないこともありそう) なので、平均の求めようはない様な気もするんですが…詳しい方ご教授願います。
>>850 Xを全ての目が出たときの回数とすると
P(X=k)=(n-1/n)^(k-1)(1/n)
じゃないかなあだめだだめだまあそれが求められたとして
E(X)=sum kP(X=k)
となりますこれ無限和です
852 :
132人目の素数さん :04/08/11 22:11
質問させていただきます。 今、あるものの変化する速度を測定したデータがありまして、 そのデータから、その速度の極大値を推定したいという 要望がありました。そこで、極値統計解析という手法で 推定すればよい、という風に言われたのですが。 極値統計解析に関する本は、本屋さんに行けばすぐに 見つかりますか?ぐぐってもあまり出てこなかった のですが・・・できれば、その概要なんかを教えて いただけると助かります。よろしくお願いします。 (なお、当方統計のことはほとんど理解しておりません ので、頓珍漢な書き込みであった場合は、平にご容赦)
854 :
132人目の素数さん :04/08/15 14:23
2群比較の輪切り検定に関する質問です。 経時的に3回(試験前、1ヵ月後、終了時)測定されたデータについて、 対応の無い2群間(実薬群 VS プラセボ群)の検定を 行なう場合は、輪切り検定による多重性問題が生じてしまいます。 このような場合は、対応のないt検定あるいはウィルコクソンの順位和検定(U検定) を複数回行い、ボンフェローニ補正による有意水準の調整 (例えば、2回検定を行なう場合は、P値が0.05/2=0.25を下回った場合に 有意差ありとする)を行なえば大丈夫でしょうか? このタイプの多重性問題について記載のある参考書が見当たらないので どなたかご教授お願いしまつ。
>>851 ありがとうございます!返答遅くなってしまってすみませんでした。
やっぱり正確な平均は求められなさそうですね。
857 :
132人目の素数さん :04/08/24 02:00
232
858 :
132人目の素数さん :04/08/24 03:14
>>851 まず、必要な試行の回数をXとし、その確率分布を考えてみてください。
そうすると「結果的に」それが「成功の確率を1/nとする負の二項分布」
に従うことが分かります。ですから、その平均は
n×1/(1/n)=n^2
となります。非常に直感的な結果ですね。何故直感的かというと、ある
一つの目が出るまでにサイをふらなければならない回数の平均は直感的
に考えてn回なわけです。すべての目が出るまでの平均回数は当然この
n倍、つまりn^2となります。
859 :
132人目の素数さん :04/08/24 03:16
(正)つまりn^2となることをこの結果は示唆しているわけです。 最後の行訂正。
860 :
132人目の素数さん :04/08/24 03:24
一つの目が出るまでにサイをふるという作業をn回繰り返しているのと同じなんだから そのままn倍になるってことか。 じゃあ一つの目が出るまでの平均がn回であることを説明すればいいんだな。
861 :
132人目の素数さん :04/08/24 03:32
その通りです。統計学の世界では、ある一つの目が初めて出るまでの 試行回数の確率分布を「幾何分布」と呼んでいます。 直感的には1回当たり1/nの確率でしかでないのだから、n回やったらいいだろう ってことですね。普通のサイコロで1の目を出すのに、直感的には6回振ったら いいじゃんと思うのと同じ理屈です。
撹乱項って英語でなんていうか知っている人いたら教えてくださいです。
http://love3.2ch.net/test/read.cgi/kageki/1093825381/ 上記のurlは過激な恋愛板の『同誕生日の人に中出しするスレ』
ってやつなんですが、ここで参加人数をx人、男女比をr(r<1)
と仮定した場合、カップルが成立する確率は何%になるんでしょう。
1. 全体の中で少なくとも1組以上成立する確率
2. ある人(個人)が相手に巡り会える確率
この2つを求めてみたいなと思ってます。
同じトリップが1組以上成立する確率は、誕生日パラドックスの話と
ほぼ同じなんですぐ分かるんですが(参加人数130人でだいたい9割)
男女比を考慮した場合、自分の力不足のせいで少々苦戦してます。
男女カップルであり、かつトリップが同じ場合の
同時分布で解けそうな気配はあるんですが…よくわかりません。
詳細はリンク先のスレで確認お願いします。
男女比以外の条件は皆同等の確率と断定して考えてます。
初歩的な質問ですみませんがご教授よろしくお願いします。
864 :
132人目の素数さん :04/08/31 07:56
ダイエット法にホットサンド法(H法)とオートミール法(O法)がある。 それぞれの方法に挑戦した人の中から10人をランダムに選び、減少した体重を測定 して偏差平方和を計算したところ、H法の偏差平方和=88、O法の偏差平方和=44が得られた。 2つのダイエット法の分散は等しいと言えるか否か検討しなさい。 ただし、F表より F(9,9;0.025)=4.026 F(9,9;0.05)=3.179である。
865 :
132人目の素数さん :04/09/06 15:41
850
867
>854 ボンフェローニの調整では検出力で損をしてしまいます。 この場合、時点毎の検定統計量間に相関が出てきますので、その相関を考慮した、 解析が考えられます。手順としては、混合モデルで相関を割り出し、多変量t分布を 積分してp値を算出することになります。
統計学を独学で勉強しようと思ってるんですが数学の知識はどれくらい必要ですか? 数学の知識ゼロです
869 :
FeaturesOfTheGod ◆UdoWOLrsDM :04/09/06 23:00
Re:>868 積分は確実に要る。
FeaturesOfTheGod ◆UdoWOLrsDMは、ウザイよ。 引っ込め。
>868 どの程度の統計学を勉強しようとしているのか分からないので一概には言えませんが、 簡単な多変量解析などであれば高校数学(理系)の知識があれば、 統計ソフトを使うのには申し分ないと思います。 より高度な統計を理解するには微積や行列の深い知識が欲しくなってきますが、 必要になったときに勉強すればいいと思います。 がんばってください。
872 :
132人目の素数さん :04/09/07 21:53
>>871 本当にそう思ってる?
100歩譲ってSPSSは使えてもSASは実用的には使えないだろうな。
873 :
132人目の素数さん :04/09/07 22:09
>>872 SASは使ったことないんで知らないけど、SPSSやJMPやRなら高校数学程度の知識で
十分実用的に使えるでしょ。
というか、事前の知識よりも新たな知識を身に付けようとする努力の方が重要。
875 :
とおりがかりの統計人 :04/09/08 00:04
うー、今年の統計学会(連合大会)は南国育ちのおれにしては ちょっと寒かったなあ。 生まれて初めて岩手県にいったよ。 でも、昼食の混雑はどうにかして欲しかったなあ・・・。 ま、なんとか発表を終えてほっとしようかと思った 矢先に地震と台風だもんねー。 あー、忙しい忙しい。 あ、それとね、お願いだから統計スレッドでは初心者の 方にはやさしくしてあげましょうね。 でないと統計やってる人が嫌な人に思われると困るしね。 よろしこ!
>872 SPSSは日常的に使用(主に多次元尺度法と重回帰分析で)。 SASは使ったことないです。他には構造方程式関連のソフトを使ったり。 僕自身、高校数学の知識があれば統計ソフトを使うのに申し分ないというのは本当にそう信じてますよ。 向学心さえあればなんとでもなりますし。
877 :
132人目の素数さん :04/09/09 00:23
質問です。 marginal anova,marginal meanというのは何でしょうか? そのまま訳すと周辺分散分析?よくわかりませんでいた。 手持ちの統計本には載ってなかったので困っています。 また,ネットで検索してもHitしませんでした。 英語のページが3件ほどヒットしましたが,具体的な説明は載っていないみたいでした。 これらはいったいどのようなものなのでしょうか。。 日本語訳だけでもご教授いただけないでしょうか。お願いします。
>>874 残念ながら、毎日のように業務で統計を使ってます。
SPSSメインでJMPも併用。
AMOS、R、Wekaは時々使うぐらいだね。
ちなみに、私自身は学生時代からずっと文系で来て、高校数学だって
怪しいぐらいの知識しかなかったけど、社会人になってから必要に迫ら
れて統計学を身につけた口です。
>878 うらやましいです。業種は何ですか?よろしければ教えてください。 共分散構造分析はどんな場合(業種)で使われているのですか?
僕の場合は共分散構造分析は認知心理学系のことで使ってます。 広く言えばマーケティングに利用できるかな、というかんじです。
程度が低いんだろうな。
882 :
132人目の素数さん :04/09/12 14:12:12
spssをメインで使ってる香具師に、873のようなタイプが多いね。 ま、色々な考えの分析者がいて良いのではないでしょうか? 時々笑わせてもらいますが。
>880 共分散構造分析は前から気になっていました。 ですが、パスの構成方法が恣意的になりがちではありませんか? 何かモデルの良さを表す指標はありますか?
884 :
132人目の素数さん :04/09/12 14:49:08
>873 手法の難易度と求められる完成度によりますね。 たとえば線形回帰でしたら数理的な部分がわかっていなくてもできるが、 最終成果物の普遍性を考えるとやはり奥深いところまで理解していたほうがいいですね。
885 :
132人目の素数さん :04/09/12 20:46:06
ふたつのものさし(ひとつは既製品、もうひとつは手作り)の精度を比較するため、ある長さを60回づつ測りました。 平均値はほぼ同じでその差0.2mmでした。SD値もやはりほぼ同じ。 これでふたつのものさしはおなじ精度だといいたいが、 そんなばあいは何検定をしたらいい?
>885 この場合に普通のt検定を使うと測定回数が多くなるとほとんど差が無いのに 有意になってしまう可能性が考えられます。 この場合はベイズ的アプローチによる仮説検定がよいでしょう。 あまり使われていないと思いますが、積極的に両軍が同じであると いいたいときには特に有効な手法です。
887 :
132人目の素数さん :04/09/12 21:28:57
>883 測定方程式と構造方程式をそれぞれ別々に評価しようとするとき、 同時に評価しようとするときなどで数多くの方法が提案されています。 ですが、これぞ決定版!というものがないのが現状っぽいです。
【社会】インターネット利用率ついに100%に−総務省の実態調査で判明 先月27日に実施された、インターネット利用に関するアンケートで インターネットの利用率が100%となっていたことが明らかになった。 麻生総務大臣は「これは政府主導によるIT政策の効果の現れと言っていいだろう」 とのコメントを発表した。 調査したのは、総務省統計局統計センターなど。今年四月に インターネット上でアンケートを実施し、約二万三千人から回答を得た。
891 :
132人目の素数さん :04/09/14 01:30:09
↑笑えるよね! インターネット上でアンケート取って、 インターネット利用率が100%とは! がっはっは!
言われて気付いた俺はかなり鈍くなっている様だ。笑った!
893 :
132人目の素数さん :04/09/14 02:14:14
パチスロの設定6で負ける確率を統計解析するオレはさすがですか?
894 :
132人目の素数さん :04/09/14 11:58:46
下記のデータは50人の生徒の評価の分布です。 数値は人数で、50人は1学期と2学期で同一です。 1学期 2学期 良い 3 5 やや良い 13 16 普通 21 17 やや悪い 7 7 悪い 6 5 「1学期から2学期にかけて改善したか」についての検定はいろいろあると 思いますが、このデータをカイ2乗検定をしても良いのでしょうか? 順序尺度だとカイ二乗はダメなのでしょうか。
895 :
132人目の素数さん :04/09/14 12:25:20
ANOVAについての質問です。 STATISTICAというソフトで計算したいのです。ANOVA自体は理解していると 思うのですが、STATISTICAでどういうふうにデータ入力すればいいのか判らないのです。実は判らないのはTWO−WAY ANOVA です(レベル4X4)。何方か、いいWEB SITEとか知ってたら教えてください。 簡潔な説明でも結構です。別のところに書いたんですが、ここを見つけたので、ここにも貼っておきます。
>>894 もし貴方のクラスにその50人しかいないのなら、検定は意味がありませんね。
その50人が母集団からのランダムサンプルなら、順位尺度以上で用いること
のできる検定をすべき。この場合U検定かな。
897 :
132人目の素数さん :04/09/15 01:21:10
> 894 >896 この場合は、生徒ごとに、たとえば2学期の成績から1学期の成績を引いて、 符号付順位和検定(確かこんな名前)をするべき。 もともと良い人は良く、もともと悪い人は悪くなりがちになる点を考慮したほうが よいでしょう。
898 :
132人目の素数さん :04/09/15 01:30:32
>890 アンケートを取る所が交絡要因になっているんですね。 アンケートを取る際に陥りやすい点ですね。
>>896 >>897 生徒ごとに差をとって中央値の検定することは決まっていたのですが、
50人分を集計して何かできないかと思い聞いた次第です。
やはり2人がご指摘の方法がベストのようですね。
ありがとうございました。
901 :
132人目の素数さん :04/09/16 09:39:17
質問です。当方高校の知識しかありません。
>>112-114 を読んで自分も常々疑問に感じてたことが書かれていて安心しました。
ところで標準偏差のかわりに絶対偏差をもちいた有用な理論とか公式はありますか?
>>901 金融工学の分野で、絶対偏差モデルみたいのはないこともない。
904 :
132人目の素数さん :04/09/19 14:46:00
過去ログ読んでも無いよう(自分がわからないだけ?)なので質問させていただきます。 例えば1/200の確率で当たり出ると言われているくじがあります。 しかし、当たりが本当に1/200で出るかはわかりません。 このくじの当たりが本当に1/200で出る検証をしたいときに、くじを引く回数をどの程度に設定したらその検証は信頼出来るものと言えるでしょうか? また、その検証の信頼度を確率と試行回数の式で表せるならそれを教えてください。 更にお願いで申し訳ありませんが、それらの説明が載っているHPや参考文型等がありましたら教えてください。 お願いします。
905 :
132人目の素数さん :04/09/19 19:22:43
↑そのくじってn本なの、それとも無限にあるの? それによってちょっと違うから。
906 :
904 :04/09/19 20:04:08
>>905 すいません、くじの本数は無限です。
ただ、無限に引くって事は無理ですし、出来るだけ少ない数で検証をしたい
って事です。
あたりが出る確率が1.0000000000001/200である(1/200ではない)、 というような可能性も考慮しないといけないのなら、検証は事実上不可能。 あたりが出る可能性が実は0/200あるいは2/200、3/200、・・・である、 という可能性だけ考えればよいのなら、なんとかなる。どちら?
908 :
904 :04/09/19 20:30:56
なんどもすいません。 実際の確率の方は1/210や1/250、1/300の可能性があるかもしれません。 10001/2000000 このような確率にもなるかもしれません。 言葉足らずで申し訳ありませんが、「また」以降の「確率」とは1/200の事です。 実際の確率はわからないですが、確率を1/200と仮定してくじを引き、 その時に必要であろう試行回数との関係式があれば・・・ って事です。
909 :
FeaturesOfTheGod ◆UdoWOLrsDM :04/09/19 20:33:37
Re:>908 統計的確率が何に近づいているか、それが問題だ。
910 :
904 :04/09/19 21:04:42
>>907 すいません、今意味がわかりました。
ちょっとの違いなら検証する事が出来ないって事ですね
FeaturesOfTheGod ウザイ
>>904 n回ふったときに、x回当たりが出る確率は二項分布
nCx (1/200)^x (199/200)^(n-x)
期待される当たり数(二項分布の平均) n*(1/200)
また二項分布の分散はn*(1/200)*(199/200)
nが十分大なら正規近似できると考えて、推定される95%区間は
平均±1.96*標準偏差
= n*(1/200) ± 1.96*√n*(199/200^2)
この区間になければ1/200ではない(と断言して間違っている確率は5%以下)
20000回くじをひく場合、当たりの回数が80〜120
10000 36〜64
5000 15〜35
逆におおよその当たりの回数が推定できるなら、
逆算すれば何回くらいかはわかるんでないかい
>>858-861 「まだ出ていない目が出る」確率と考えると
・最初はどの目でもOK = 確率はn/n (=1)
・以降出ていない目が出るたびに (n-1)/1、(n-2)/n となっていく
ので、全部で
n/n * (n-1)/n * (n-2)/n * ... * 1/n = n!/n^n
となって、
平均は n^n/n! 回になるなのでは?
(この辺は861にある「1/nの確率は、n回やればいいだろう」とい考えと
同じ、つまり単純に確率の逆数で求めてます)
あーだめだ、自信ないわ
914 :
132人日の素数さん :04/09/20 13:27:53
>>912 回数が少なければ少ないほど標準偏差が大きくなります。
信頼区間内であることをもって、割合が同じとする考え方では、回数が少なければ
成立してしまうので、適切ではありません。
割合が同じかどうかの検証だけが目的でしたら、ベイズ流の仮説検定が考えられる
でしょう。
915 :
132人目の素数さん :04/09/20 19:25:17
分散分析を生物統計学で独学してます 記号の意味が分からないので教えて下さい 測定値 y(I,J) = U + A(I) + e(I,J) U 全体の平均 A(I) 因子Aの水準Iの効果 e(I,J) 測定値Y(i,j)の誤差 この後、母数U,a(I)を推定する、と話が進んで上に^がついた U,a(I)が出てくるのですが、これはどういう意味でしょうか? また上に−のついたy..は全測定値の平均という意味でしょうか
すみません a(I)はA(I)です
917 :
132ん日の素数さ人 :04/09/20 20:35:04
>>915 ^の付いていないものは母集団の真の値、付いているものは標本による推定値。
y..は全測定値の平均値。上にマイナスが付いていたり付いていなかったりする。
>>904 問題を、
「母比率の検定(帰無仮説:p=1/200、対立仮説:p≠1/200、有為水準1%)において、真の比率が1/200から〜以上異なるときに、仮説を採択する確率を1%以下にしたい。標本はいくつ以上取ればよいか?」
みたいにすれば答えは出るよ。
919 :
132人目の素数さん :04/09/22 14:30:49
初心者質問ですみません。 回帰係数と単相関で符号が違うのはどっちを見ればいいんですか?
920 :
132人目の素数さん :04/09/23 02:07:25
>>918 なるほど、そういう考え方があったのか!
918さん、あなたの職種(学生?)は何ですか?
921 :
132人目の素数さん :04/09/25 13:09:25
株とかで、適当な時点で購入、過去に付いた最大の価格より a円 だけ下がったら売却 という規則で売買したときの利益の分布を調べたいのですが良い計算方法っていうのはあるんでしょうか。 もう少し具体的に説明すると、 正規分布(似ていれば特にこれである必要はないです)で 0 から開始してランダムウオークする 数列があって、過去につけた最大値より a だけ小さい値になったときの価格を x とすると 分布関数 f(x) = 過去最大値よりaだけ小さくなったなった時の x の確率 となるような関数を計算してみたいです。 ちなみにパソコンで力ずくで計算してみると、a が小さい時は正規分布に近づいて a が大きい時は 指数分布の裾の広い感じの印象を受けます。(aが小さいときは数列を作る乱数の分布そのもののような気がします)
922 :
132人目の素数さん :04/09/27 01:14:20
P1,Q1を(Ω1,B1) 上の確率測度.L1をQ1のP1に対する導関数. P2,Q2を(Ω2,B2) 上の確率測度.L2をQ2のP2に対する導関数. PをP1とP2の直積測度.QをQ1とQ2の直積測度.LをQのPに対する導関数. (LをQのPに対する導関数⇔ あるNが存在して,P(N)=0 かつ Q(A)=∫_A LdP+Q(N∩A) (任意のAに対して) かつ L≧0) 命題:LとL1×L2はほとんどいたる所 P で一致する. 上の命題が正しいかどうか自信がありません. Q1がP1に対して絶対連続,Q2がP2に対して絶対連続のときに成立することは証明できました (文献にものってました)が一般の場合はどうなるのか…? どなたかご存知の方がいらっしゃったらお教え下さい。 当方統計専攻の院生です。
923 :
132人目の素数さん :04/09/27 07:02:38
平均=普通は成り立つの?
メディアンのほうが「普通」には近いかも。 平均は極端なものに引っ張られちゃうから。
925 :
132人目の素数さん :04/09/27 20:58:53
926 :
132人目の素数さん :04/09/27 21:42:02
メディアン=中央値 です。 でも、それ以前に「普通」ってどういう定義なんでしょうねぇ。 しゃべり場10代みたいなテーマですが。
「普通とは何か」となれば、それは統計学の範疇を超えますね。
929 :
132人目の素数さん :04/09/28 01:53:22
例えば平均身長は普通の身長っていうことになる?
子供が0.97人いる家庭は平均的だが異常だぞ
普通と平均がほぼ同じ意味で使われる場合と、そうでない場合がある。
>>929 実際に1000人分くらいサンプルをとってみて、
全員の身長から算出された平均値が
ちょうど170cmだったとする。
171以上が499人、169以下が500人だった。
んで、ちょうど170cmが一人だけいた。
170の人の身長は平均的だと言えても、普通だと言える?
普通って言葉の意味は、多義的すぎておぼつかないんじゃないかな。
933 :
132人目の素数さん :04/09/28 23:27:41
>>932 でも身長の場合そんなにばらつきがないんじゃないかな?平均身長が170だとするとやっぱり170前後が一番多いんじゃないの?
母数の平均が普通といえるんじゃないだろうか
935 :
132人目の素数さん :04/09/29 21:26:12
母平均
937 :
132人目の素数さん :04/09/30 00:01:00
日本のサラリーマンの賃金構造を調べるために、20才から30才の会社員40人を対象に調査を行なった。質問内容は次のとおりである。 基本給、性別、勤続年数、企業規模、学歴 そこで、基本給がどう決定されるかを見るために、回帰モデル、 を考える。ただし、各変数は次のとおりである。 WAGE: 基本給。単位は円。 SEX: 性別。男ならSEX=1、女ならSEX=0である。 CAREER: 勤続年数。 SMALL: 企業規模。中小企業ならSMALL=1、大企業ならSMALL=0である。 EUDC: 学歴。大卒ならEUDC=1、高卒ならEUDC=0である。 次の問いに答えよ。 (1) パラメータ ~ の値をデータより推定しなさい。
938 :
132人目の素数さん :04/09/30 00:03:08
WAGESEXCAREERSMALLEDUC 215,7001411 242,1001611 253,7001711 162,9001011 185,5001211 135,5001010 292,50011110 ・・・・・ エクセルでどうやら求めるようなんですが、 どうやったらでるんでしょうか? 自分で計算していたんですが、数字が合わなくなって挫折しました。 推定しろって書いてあったので、自分で計算じゃだめなようです。
939 :
132人目の素数さん :04/09/30 00:07:50
あ、大事なところがでてませんでした。 回帰モデル WAGE=B0+B1×SEX+B2×CAREER+B3×SMALL+B4×EDUC WAGE SEX CAREER SMALL EDUC 215,700 1 4 1 1 242,100 1 6 1 1 253,700 1 7 1 1 162,900 1 0 1 1 185,500 1 2 1 1 135,500 1 0 1 0
宿題は自分でやりましょう
941 :
132人目の素数さん :04/09/30 12:19:03
分析ツールの回帰分析でやればいいじゃん
942 :
132人目の素数さん :04/09/30 12:22:40
ツール→分析ツール→回帰分析 「入力Y範囲」にwageのデータ 「入力X範囲」に説明変数のデータ →OK
>>942 そんなツールがあったんですか・・
どうやってやるかわからず、
今日締め切りだったのであきらめますたorz
まずググれよ・・・
945 :
132人目の素数さん :04/10/01 02:36:55
たまに25,75パーセンタイル値に利用される Tukeyのヒンジについて訊きたいのですが、 イメージ的には、 ・中央値と最小値の「中間の順位の値」が Tukeyのヒンジによる25パーセント点 ・中央値と最大値の「中間の順位の値」が Tukeyのヒンジによる75パーセント点という感じでしょうか? だれかノンパラ統計量に詳しい人の解説キボン。
946 :
132人目の素数さん :04/10/01 17:27:30
N面体のサイコロがあって、それを最大K回投げる。 1の目が出たら、S回投げる回数から減算する。 投げれなくなったら終了する。 1の目がx回でる確率f(x)を求めよ。 という問題なのですが、 N=300 K=3000 S=100で1万回シミュレート実験はしてみたのですが、 実際にf(x)はどのような式になるのでしょうか? 近似できる分布はないでしょうか? ご指導お願いいたします。
>>946 問題設定がよくわからないのだが。
N,K,Sは固定だよね。
とりあえずN面体のサイコロ投げて、1が出たら何か減らすのはわかった。
Kは終了条件で、
サイコロの目が1出るたびにマイナスSしていって、
現在の試行数(仮にt)がt>Ktのときに終了するってこと?
(Ktは試行数tのときの終了回数)
>>946 分布は難しいな…。
とりあえず、S=1のときの1が出る回数の期待値は、
(1/(N+1)^2)(1-(-1/N)^K)+K/(N+1)
となった。
ブルー・バックスに豊田秀樹なる人物が何冊か書いてるが、どうなの? 偶然開いたページに「連続だから微分可能」とあって、のけぞったんだが。
950 :
132人目の素数さん :04/10/03 22:42:04
951 :
132人目の素数さん :04/10/04 08:17:13
豊田秀樹は早稲田の文学部の先生 心理学の視点からマーケティングのデータ分析とかしているような希ガス
952 :
132人目の素数さん :04/10/05 22:13:10
分散分析と等分散の検定ってどう違うの? いま、2つの群のバラツキが異なると言えるかどうか調べたいんだけど、どちらの検定方法を使えばいいのか教えてください。
>>952 2つの群のばらつきが異なるかどうかは、等分散の検定(F検定)で調べられます。
分散分析は2つ以上の群の平均値が同じであるかどうかを調べる検定です。
954 :
132人目の素数さん :04/10/05 22:31:25
>>953 平均値が同じかどうか調べるのにt検定ってありますよね。
分散分析は、言葉どおり「分散」=「ばらつき」も調べるってことでは、ないのでしょうか?
>>954 t検定は2群の平均値が同じかどうかを調べる検定です。
もしもt検定が両側検定だったら、2群の場合の分散分析と同じ結果(p値)をはじき出します。
確か、t統計量の2乗が分散分析のF統計量になたはず。
因みに、2群以上のばらつきが同じかどうかを調べる検定にはバートレットの検定というものがあります。
自己レスです。 > t検定は2群の平均値が同じかどうかを調べる検定です。 すみません、これはもうご存知ですね。
957 :
132人目の素数さん :04/10/05 22:52:57
>>955 なるほど、t検定と分散分析の関係、よくわかりました。ありがとうございます。
どうも、「分散」分析ということばに惑わされていたみたいです。
>>957 統計学ではまぎらわしい名前が多いようです。
共分散分析はべつに共分散を分析しているわけでもないし、
共分散構造分析なんていう似たようなものもあるし。
959 :
132人目の素数さん :04/10/08 12:09:36
言語学の研究と統計に関して、質問があります。 どなたかわかる方、教えてください。 たとえば、現在の若者を対象にして、 ある状況ごとに、若者言葉「XX]を使用するかしないかを質問し、 状況ごとの有為差の有無を見たい場合って、 統計は、パラメトリックなのでしょうか? それとも、ノンパラメトリックでしょうか? 言語使用の場合、文法ルールや、社会的習慣(社会言語学的ルール) などによって、ある程度、規制されると思うので、 はたして、正規分布を前提に考えていいものかどうか 迷ってしまいます。 はたして、文法に規制される言語使用は、 歪度や尖度に特徴のある正規分布と考えていいのでしょうか?
>>959 まず、考えられる一番単純な解析方法は「言語使用の有無」と、2水準の「状況」を用いた
カイ2乗検定。カイ2乗検定がパラメトリックか、ノンパラメトリックかは、あまり聞いたことがありません。
これはパラメトリックかな?分布には、「標準正規分布に従う確率変数」を2乗した変数の分布(カイ2乗分布)が使われています。
そして、「社会的習慣」が言語使用に影響を与えていると考えられる場合には、、色々と考えられるのですが、
「社会的習慣」を共変量としたロジスティック回帰分析。もう一つ挙げるとすると、
(こっちのほうが理論的にはきれいかな?)「社会的習慣」を変量効果とした、ロジスティック変量効果モデル。
961 :
959 :04/10/09 01:04:11
>960 早速のお返事をどうもありがとうございました。 自力で、統計を勉強しているので、大変助かります。 カイ二乗は、使ったことがあるので、何とかなりそうです。 ロジスティック回帰分析 & ロジスティック変量効果モデルは、 正直言って、何のことだかさっぱりわからないので、統計の本を読んで、 頑張って勉強します。 あと、すみません、もう少しお伺いしたいことがあるのですが、 実は、言語使用状況が3つあるのですが、カイ二乗を 3回繰り返す形でも大丈夫でしょうか? ちなみに、データは対応のある形です。
962 :
959 :04/10/09 01:11:00
連続の質問で、すみません。 できれば、もう一つお伺いしたいことがあります。 言語使用の有無と、その言語を使用した場合のイメージ を関連付けたい場合は、どのような手法がいいのでしょうか? 具体的には、XXという若者言葉を使うか否かを質問し、 同時に、その言葉を使った場合のイメージも聞いて、 言語を使用する子はどういうイメージで話し、 使わない子は、その言葉にどういうイメージを持っているかというのを 調べたいのです。 どの統計手法が適切なのか、ご享受いただけると、 大変ありがたいです。
>>959 ちょっと違うかもしれないけど、
chaidという手法を調べてみてはどうでしょう。
964 :
132人目の素数さん :04/10/09 02:30:53
>>961 帰無仮説の設定によってはカイ二乗検定を3回繰り返すという方法も考えられると思います。
ですが、もしもそれらの検定の内、「1回でも有意ならば有意」とするのでしたら「検定の多重性」という問題が起きてきます。
959さんは次のどちらを主張したいですか?それによって検定手法は変わってきます。
1.「状況Aと状況B、状況Cにおける言葉の使用率」は、「全て同じ使用率」ではない。
2.「状況AとB」、「BとC」、「CとA」の内、いずれかの使用率が異なる。
>>962 それぞれの状況において、イメージAは○%、イメージBは×%、イメージCは△%と考えていく方法が考えられます。
>>963 その方法は、それぞれの状況での割合を把握するときには使えると思いますが、検定は行っていませんね。
965 :
959 (961& 962) :04/10/09 15:40:49
> 963 早速のレスをいただき、どうもありがとうございました。 chaidですね。検定をするかどうかは、まだ決めていませんので、 (データと、私の理解力次第になると思いますが、) 勉強してみます。
966 :
959 (961& 962) :04/10/09 15:41:39
> 964 早速、レスをいただき、どうもありがとうございました。 主張したいのは、2.の各2水準間での検定です。 (全ての言語使用状況間において有意差がでなくてもいいので。。) ということは、カイ二乗を3回繰り返しても大丈夫ということですよね。 それから、言語使用の有無とイメージの関係の分析を 難しく考えていたので、コレスポンド分析など 使ったこともない手法が必要なのかと思っていたのですが、 おかげさまで、すっきり&安心しました。 いろいろとご享受いただき、 大変助かりました。 どうもありがとうございました。
967 :
132人目の素数さん :04/10/09 16:22:15
>>951 ふーん。使い方はともかく細部は信用しない方が良さそう。
>>966 もしもカイ二乗検定を3回繰り返すのでしたら964にも書いた、「検定の多重性」という問題が起こってきます。
帰無仮説(A)、(B)、(C)の内、一つでも有意ならば有意とするとなると、実際にはあらかじめ決めた有意水準よりも大きい値で検定を行っていることになってしまいます。
つまり、有意ではないのに有意だといってしまう可能性が出てくるのです。
これを防ぐために色々な方法が考えられます。一番単純な方法は「ボンフェローニの調整」。
それぞれの検定から出てきたP値をそれぞれ3倍して、それから有意水準で検定を行うという方法です。
でも、この「ボンフェローニの調整」は検定の数が多くなればなるほど有意であるのに有意ではないといってしまう傾向があるので注意が必要です。
今回のように検定の数が3つぐらいだったら使用に耐えうるでしょう。
969 :
132人目の素数さん :04/10/09 17:23:07
統計は解析くらいの知識しか使ってないのにマジ難しいと思う。 数学的にある程度わかっても調査とか経験しないとよくは わからない模様。
3群の比較を3回の対比較で行うなら、各々の検定の有意水準は 全体の有意水準の1/2にしてもよい(1/3にする必要は無い)、はず。