1 :
132人目の素数さん :
2011/02/11(金) 01:51:36
2 :
132人目の素数さん :2011/02/11(金) 01:55:20
3 :
132人目の素数さん :2011/02/11(金) 02:07:28
4 :
132人目の素数さん :2011/02/11(金) 02:09:34
5 :
132人目の素数さん :2011/02/11(金) 02:11:49
テンプレ1 ●学校の宿題の丸投げはやめましょう。 ●質問者は質問の前に相当程度調べるなり、考えるなりしましょう。 ●荒らしは基本的にスルーでお願いします。
>>1 前スレのログから察するに、前スレは2010/09/07(火)の午後に20番レスまでで、
消失全損したようです。
7 :
132人目の素数さん :2011/02/12(土) 08:31:22
>>987 >最近はデータ数がバカみたいに多く集まることが多いので、統計的検定は無意味だと聞いたんですがホント?
>たしかにnが万単位あれば僅かな平均値差でもバリバリ有意になっちまいますね・・・・・
n=10000ケのデータに対し、統計的検定を行うことってあるのかな?
10000ケの抜取標本平均や標本不偏標準偏差の記述統計で、十分なのでは?
8 :
132人目の素数さん :2011/02/12(土) 22:16:31
>>987 >>7 目的がわからないので、検定は無意味か?と聞かれても
応えられないと思いますよ。
>>7 消失スレに書いたけど円周率が乱数かという検定ならデータが多くても行う。
>>8 が言うように目的次第。
10 :
132人目の素数さん :2011/02/13(日) 02:37:49
フリードマン検定は1要因の対応ある条件の比較のみに用いられるのですか? 2要因について用いられることはありませんか?
質問です。とあるサイトからの引用なんですが、 >あたりくじが1つ、ハズレくじが9つのくじびきを10人で引く場合、 >数学でいえば、何番目にくじを引いても当たりくじを引ける確率は同じだが、 >統計学でいえば、実際に2千回、5千回、1万回試行をすると実は6番目が一番当たりくじを引きやすいという結果が得られる。 2行目の当りくじの確率は理解できるんですが、 3行目の6番目云々が良く理解できません。 実際の試行回数と偏差とかのデータは出してないんで、主張が正しいかどうかはわからないんですが、ありえるんですかね? 一応自分で考えたところでは、仮に1万回試行として、 10分の1の1万回試行、9分の1の(1万ー10分の1の当り回数)試行、・・・・(1万ー10分の1の当り回数ー9分の1の当り回数ー・・・・2分の1の当り回数) の当り数の分布の比較ということになると思うのですが、 回数が安定するかどうかに違いはあっても、くじの引ける確率自体は同じである以上、統計上6番目が一番出やすいということは無いと思うのですが。 どうなんでしょう?
>>11 1から10であたりがでるので、期待値は5.5。
そのことを、誰があたりを引くかと間違えて、6と書いてるのかな。
シミュレーションするなら、一様分布を前提に、毎回10人に順に引かせて誰が当たったかの結果をだして、その分布を確認だね。
13 :
132人目の素数さん :2011/02/14(月) 13:38:02
回帰統計 重相関 R 0.152278611 重決定 R2 0.023188775 補正 R2 -0.116355685 標準誤差 2.206272678 観測数 17 分散分析表 自由度 変動 分散 観測された分散比 有意 F 回帰 2 1.617758084 0.808879042 0.166174817 0.848544242 残差 14 68.1469478 4.867639128 合計 16 69.76470588 係数 標準誤差 t P-値 下限 95% 上限 95% 下限 95.0% 上限 95.0% 切片 10.4845444 6.609867644 1.586195816 0.135017062 -3.692211688 24.66130049 -3.692211688 24.66130049 52 -0.051129843 0.095080104 -0.537755434 0.599190715 -0.255056384 0.152796698 -0.255056384 0.152796698 31 -0.000651974 0.111476851 -0.00584851 0.995416112 -0.239746038 0.238442091 -0.239746038 0.238442091 重回帰分析なんだけど これって有意差はなしってことでおk?
>>11 >>12 だけど、1000回のシミュレーションを5回してみた。
念のため分散分析もしてみたけど、結論としては6が出やすい
ということはないです。
まあ、以下の結果を見ると、6が多めに出てる場合があるので、
それを見て、統計学的に6が出ると判断しちゃったのでしょう。
シミュレーション結果(試行10,000回)
非復元抽出で当たりの位置を記録
01____989___1001___1027___1038___1026
02___1046____991___1016____994___1006
03____934____980___1020____999____966
04___1015___1001____978____996___1004
05___1010___1016____969____985___1001
06___1001___1053___1000___1065____955
07____993___1011____979____935___1058
08____949___1002____981___1031___1007
09___1034____950____975____978____969
10___1029____995___1055____979___1008
sum_10000__10000__10000__10000__10000
16 :
132人目の素数さん :2011/02/14(月) 21:07:47
>>16 考えられるのは、ダミーとかを使って、係数が有意に影響するかを確かめてる可能性。
まあ、EXCELの結果をそのまま貼ってるのを見ても、ほうっておくのがいいんじゃないかな。
19 :
132人目の素数さん :2011/02/16(水) 01:27:55
aとbがCに及ぼす影響を調べるためにはどの分析方法が最も適切でしょうか t検定も分散分析も違うような気がするのですが… ちなみにaとbは不変と可変、のように対になる変数です よろしくお願いします
20 :
132人目の素数さん :2011/02/16(水) 10:35:21
不変と可変って何?
>>19 Cが量的変数なら、重回帰分析か数量化T類か実験計画法を使うのが普通だが。
「aとbは不変と可変」って、定数と変数ということですか?
22 :
11 :2011/02/16(水) 22:53:01
>>14 レスありがとうございます。
わざわざ時間かけてもらってすいません。
結果を見ても、差は誤差と考えるのが妥当ですね。
すっきりしました。
23 :
132人目の素数さん :2011/02/17(木) 11:25:01
以下の四つのジャーナルの内、最もレスポンスが早いのはどれでしょうか? また、ジャーナルの評価も聞かせて下さい。 ・日本統計学会誌(英文) ・Communications in statistics ・Statistica Sinica ・Annals of institute of statistical mathematics
24 :
132人目の素数さん :2011/02/17(木) 23:13:28
全データが与えられてるのを度数分布標作って平均値などを求めたんですが間違いになりますか?
25 :
132人目の素数さん :2011/02/18(金) 16:33:21
>>23 投稿の内容とか、そのとき選ばれたレフェリーによっても全然違うから、
基本的には、レスポンスが早いかどうか全くわからないと言っていい。
聞いた話とか、おれやおれの友人が投稿した感じでは以下のように思う。
(おれは一度、日本統計学会誌で3ヶ月放置されたことがあるけどね)
・日本統計学会誌(英文)=二ヶ月以内ぐらいには返事があるはず。
・Communications in statistics=まあまあ早い。一ヶ月ぐらい?
・Statistica Sinica =早い。リジェクトの場合4,5日で返事が来ることも。
・Annals of institute of statistical mathematics =むちゃ遅いらしい。半年?
26 :
132人目の素数さん :2011/02/18(金) 19:11:13
>>24 その「全データ」というのは母集団のこと?
つまり分析したい対象ということ?
それとも何かの標本?
統計学では高校数学のどの知識が必要ですか?
28 :
132人目の素数さん :2011/02/19(土) 20:54:07.72
>>27 高校の教科書を見直してみた。
どこまでやりたいかによるけど、
初等幾何以外はほとんど必要だと思う。
29 :
132人目の素数さん :2011/02/19(土) 22:13:05.42
>>27 ある程度きちんとやるなら、微積分の知識がいる。
統計的に分析する時に確率の知識が必要で、確率は面積なので積分がいる。
統計的分析をするためには微分もいる。
複数の変数を分析するには、線形代数(行列)の知識がいる。
ただ、EXCELとかで結果だけだせればよくて、手法はそれほど細かく
わからなくても、とりあえず分析したいだけなら、数学というよりも
常識があればOK。
30 :
132人目の素数さん :2011/02/20(日) 00:00:50.89
統計なんてバカのやること 高校生レベルで十分
| | ∩___∩ | | ノ _, ,_ ヽ (( | プラプラ / ● ● | (=) | ( _●_) ミ _ (⌒) J )) 彡、 |∪| ノ ⊂⌒ヽ / ヽノ ヽ /⌒つ \ ヽ / ヽ / \_,,ノ |、_ノ
32 :
132人目の素数さん :2011/02/20(日) 04:10:26.79
実務で統計やってる人って何やってるかはわかんなくてただブラックボックス的にやってんの?
33 :
132人目の素数さん :2011/02/20(日) 04:50:53.96
実務家で統計やってる人は、 ほとんどブラックボックスだね。 アフォばっかり。 学者は狭い範囲でいろいろやって喜んでいるだけ。 広く深く、しかも実践的なことが出来る人は ごく少数しかいない。 おれからしたら日本には30人ぐらいしかいない。
34 :
132人目の素数さん :2011/02/20(日) 20:44:28.90
複数の映像を見せて「どちらが迫力があったか」「どちらが爽快感があったか」などの質問に5段階で回答してもらったのですが 標本数が少なくp<0.1でも差が出ません 何とかどちらかが良いという結果を出したいのですが このようなアンケート調査の場合どの程度まで有意水準をあげてもよいのでしょうか?
どこまででも行けばいい 信じる人が減るだけかな
>>34 どんな検定したのか分からないけど0.1より上げるのはないな。
本当には差があると思ってるんだったら検定法を変えると差が出るかもしれん。
37 :
132人目の素数さん :2011/02/22(火) 16:13:03.01
45点満点のテストで平均点22点標準偏差6のとき 36点とった場合、偏差値はいくつになるのか、出現率(1000人中での順位)という のはどれぐらいになるのでしょうか?
偏差値:50+10*(36-22)/6=73.333... 出現率の定義はよくわからないが、1000中での順位というのであれば、 正規分布で、x>2.333...の面積は、0.009815...。1000倍して切り上げし、10位と言うのが妥当だろう。
39 :
132人目の素数さん :2011/02/22(火) 23:17:30.51
ありがとうございます。 偏差値73の成績と偏差値65の成績の二つの試験の合計での 出現率や総合偏差値というのは推計できるのでしょうか?
>>39 >>38 ではないが、複数の変数(複数の試験の結果)を合わせた分布を
計算するのには、
>>39 の情報だけではできない。
試験Aの成績がいい人が、試験Bの成績もいいという関係があるのか、
逆の関係があるのか、その関係はどれくらいなのか、両方の試験の結果
にはあまり関係が無いのか、といった情報がないと、分布の形が特定
できないので計算もできない。
単純に二つの点数を足したもので、総合の偏差値を計算することは可能
なので、それが簡単かもしれないけど、二つの試験の総合点の標準偏差
の数値なんて持ってないよね。
ちなみに、偏差値73と65における順位と、合計したものの順位は異なる。
偏差値73と65の順位というのは、73よりも成績がよく、65よりもいいと
いう両方の条件を満たす人。
総合した場合には、どちらかが下回っている人が総合点で上に来ることが
あるので結果が違ってくる。
>>39 >>40 の書いていることは、
数学と英語の試験があって、
1)片方の成績がいいともう片方の成績もいいとすると、英語で高得点を
取った人は数学でも高得点を取ることになる。
2)英語と数学の成績にはマイナスの相関があると、英語の成績がいい人で
数学の成績のいい人は少なくなる。
つまり、1)と2)を比べると零点から200点の間に、1)の方が広く分布
してて、2)の方が平均点の所に多く分布していることになる。
そのため、1)と2)では1)の方が分散が大きくなる。
あと、3)として、両方の試験にまったく相関が無い場合。
これは、英語で10点取ってる人たちと、90点取ってる人たちを比べると、
数学の成績の分布が一緒だってこと。
どちらにも、数学で10点の人とか90点の人が、同じようにいる状況。
二つの試験の点数の関係で結果が変わるので、その情報が無いと、計算が
できない。
43 :
132人目の素数さん :2011/02/23(水) 10:59:51.24
39です。>4041ありがとうございます。 正規分布の面積で順位を算出することがわかりました。二つの試験の 場合は相関関係がわからないとだめなようですね。ありがとうございます。
44 :
132人目の素数さん :2011/02/25(金) 18:17:46.83
質問します。 glmを使い,説明変数の数を変えて複数のモデルを作りました。 複数モデルの中から最もあてはまりの良いものを知りたいので AICを比較しようと考えたのですが,AICがInfとなり,表示してくれませんでした。 使っているソフトはRです。 AICが非常に小さいくて(おそらく2以下?)表示されないと考えているのですが, これでは比較できません。 対処法をご存じの方がいらっしゃいましたら,教えていただきたく存じます。
>>44 小さいから表示されないということはありません。
Infですから無限大なのでしょう。
glm後の出力で係数は表示されているのにAICのところのみInfと
なるということですね?他のモデルではAICが表示されるのなら
少なくともそのモデルはだめという結論でよいように思います。
AICを小さくするモデルを探索しているのですから。
46 :
132人目の素数さん :2011/02/27(日) 23:33:43.39
ARモデルで共分散定常性が成り立たないときはOLSで推計をするのは 妥当ではないと本に書いてありましたが理由は書かれていませんでした。 どなたか理由を教えていただけないでしょうか。
>>46 定常でない時系列でARモデルを当てはめるってそもそもどういう仮定で
どうやって解くのだろう?その本にはそもそもそういうときにどうすれば
いいのかも書かれていないんですよね?それならば理由は仮定を満たして
いないからということでは。
48 :
132人目の素数さん :2011/03/06(日) 18:40:50.90
証明問題をやってて 具体的にiが1〜nまでみたいに決まってなくて 集合Aの範囲内のものを全て足し合わせるってことを書きたいんだけど ΣAf(x) (Aは下に小さく書く) って書き方でいいのかな? それとも何か正しい書き方ってある?
49 :
132人目の素数さん :2011/03/06(日) 23:01:08.91
統計学会春季大会(立教大学)乙! 会場がちょいと寒かった。 暖房いれるとみんな寝ちゃうから?
>>48 なんでここで訊いてるのか分からないが、TeXで書くと
\sum_{x \in A} f(x)
となるのでは?(\inは集合の含まれるの記号)
52 :
132人目の素数さん :2011/03/18(金) 07:53:20.20
質問します。 教科書に、大標本と小標本なる用語があるのですが、定義が載って おりません。標本数何ケが境目なのですか?
明確な境目はないですよ。 10だと確かに少ないし、100だと多い方ですが、 どんな分析をどんな精度でするのかにも依存しますし。
54 :
132人目の素数さん :2011/03/29(火) 15:50:34.70
偏差値って正規分布専用の指標?
56 :
132人目の素数さん :2011/03/29(火) 23:34:19.30
日本統計学会、・・・・プッ
すみません 試行A 成功 29 5 試行B 成功 36 9 の二つの試行は違うと言えるのかどうかの検定ってどういう検定でできますか?
58 :
52 :2011/04/02(土) 03:27:09.67
>>53 応答ありがとうございます。
精度に依存するというのは、設定する許容誤差に連動するということですね。
許容誤差をαとすると、境目の標本数はどのような式で計算するのでしょうか?
59 :
57 :2011/04/02(土) 11:02:17.11
誰か教えてくれ・・・
60 :
132人目の素数さん :2011/04/02(土) 14:22:25.84
極限の問題だと思います。 このような問題をやったことが無いので、出来るだけ詳しい説明をしていただけると嬉しいです。 @lim(θ→0) sin5θ/sin2θ Alim(u→0) u・log{1+(3/u)} Blim(x→-∞) x+1/{√(x^2+x+1)-x} 宜しくお願いします。
61 :
132人目の素数さん :2011/04/02(土) 14:24:01.03
↑数学何でもスレッドと勘違いしました。 申し訳ないです><。
>>58 無いよ。
例えば、標準正規分布を用いた検定と、t分布を用いた検定を考える。
この時、サンプルが30くらいあれば、どちらの方法でも目的としてる精度で分析できるなら、簡単な方を使う。
それと同じように考えればいい。
ただし、検定によっては、大標本の特性は数学的にもとまっていても、小標本の特性はわかってない時がある。
そんなときは、シミュレーションでサンプルサイズによる特性を調べて、それを使う。それが無理なら、とりあえず大標本の結果を利用する。
>>62 挙げている例が説明と合ってないよ。
正規分布を用いた検定とt分布を用いた検定ではt分布の方が常に精度がよい。
しかし、たとえば標本の大きさが100ぐらいになるとその差は大してないので
正規分布を用いた検定でよいと考えたりする。
この場合明確に精度の差を考えたら切り替え基準も作れなくはない。
ただ精度の差は応用で違うし、主観的にもなるのでそういう議論をすることは
ほとんどない。
一般的にはこういうように説明できる方が珍しく小標本の方法の特性が
分かっていなかったり単純に比べられなかったりする場合が多いことは確か。
>>63 ありがとうございます
たいして違いないみたいですね。
もし、真剣にロト6を統計したら一番期待が持てるのってどれなんだろうか? 過去30回分とかで計算したことある人は結構いそうだけど過去全部で計算したことある人っているか?
どれとは?一番期待値が高くなる組み合わせってこと? 過去全部でもすべての組み合わせが出ているわけではないので 一番は決められないのでは?
さらに言うと第138回から使う玉が変更されました さらに言うとA〜Jセットまでがあって 頻度調整の為に恣意的に使われるセットが替わります 僕はデータベースにできる限りの情報を記録しています
それってどのセットを使うのが事前には公表されないでしょ? どのセットを使うかも予測するってこと? セットを変えるのは本当に頻度調整のためなの? (頻度調整となると出る玉に偏りがあることになるが、 それを立証できるの?)
1レスに質問は一つにして下さい
皆は学部どこ? 俺は経済学部なんだけど理学部数学科ばっかりか?
73 :
132人目の素数さん :2011/04/09(土) 14:30:26.09
統計解析についての質問。 企業がエクセルを導入したことによって、どのような統計解析が可能になったのか? 質問が雑であまりうまくまとめられてないので、すいません。 友人から「この質問を解答してくれ」と頼まれたので、宜しくお願いします。
74 :
132人目の素数さん :2011/04/09(土) 17:34:27.66
お断りします。
>>73 エクセルを導入せずとも、実行可能な統計解析の存在を考えて、non-unique argumentで検討することにする。
1) 例えば、オープンソースのRが導入済みまたは導入可能であると仮定する。
2) エクセルにできて、Rにできない統計解析はない。
3) 従って、企業がエクセルを導入したとしても、新しく実行可能になる統計解析はない。
以上。
1)が偽だったら何の意味もない議論だなw
78 :
132人目の素数さん :2011/04/16(土) 22:29:22.99
79 :
132人目の素数さん :2011/04/16(土) 22:36:56.43
非線形回帰モデル y = a*x1 + a*b*x2 + u において、y、x1、x2のデータがあるときにaとbの推定を考えます。 その方法として残差平方和u^2を最小にするようなaとbを直接求める方法と、 u^2をaとbに関して微分して0とおいた一階の条件を非線型方程式とみなして 求める方法はどちらがいいのでしょうか?
80 :
132人目の素数さん :2011/04/17(日) 00:31:45.15
>>79 それ非線形なの?
線型にしか見えないけど?
81 :
132人目の素数さん :2011/04/17(日) 02:11:01.55
>>80 パラメータaとbについては非線形だと思います。
パラメータaとbをデータの線形関数としてexplicitに表現できないと思いますので。
もちろん「変数」に関しては線形ですが。
82 :
132人目の素数さん :2011/04/17(日) 03:41:54.70
>>81 両辺をaで割れば、
y/a = x1 + b * x2 + u/a
となるんじゃないの?
83 :
132人目の素数さん :2011/04/17(日) 03:59:01.87
>>82 でもa自体が未知なので変換は不可能じゃない?
84 :
132人目の素数さん :2011/04/17(日) 15:07:32.72
y = a*x1 + a*b*x2 + u のa*b = cとおいて、 y = a*x1 + c*x2 + u とすれば普通の回帰分析と同じ。 そして、aとcを求めてから、 cをaで割るとbが求まります。 よって線型と同じです。
85 :
79 :2011/04/17(日) 15:51:49.81
すみません、前に書いたモデルは一つの例で、あまり適切ではなかったようです。 実際は変数に関しては線形で、パラメータに関しては非線形なモデルで84が指摘しているような 簡単な方法では扱えないモデルです。 問題は目的関数を直接最小化するのと一階の条件を使うのとどちらが良いのかということです。
>>84 そのように置いたらaとcは独立ではないよね。
87 :
132人目の素数さん :2011/04/17(日) 18:51:01.98
通常用いられている統計学とは別にベイズ統計学とかいうのがあると知りました。 ベイズ統計学はどういうところで使われているんですか? 普通の統計学にたいして利点と欠点とかってあるんでしょうか?
89 :
79 :2011/04/17(日) 20:12:17.21
具体的に言うと y = (a+b_1+...+b_k)*x_0 + a*b_1*x_1 + ... + a*b_k*x_k + u という回帰モデルでa,b_1,...b_kの推定を考えています。
90 :
132人目の素数さん :2011/04/17(日) 23:02:45.42
>>88 ベイズの公式を利用するものをベイズ統計学という。
どんな問題でも、常にベイズの公式を使う人のことを
ベイジアンといいます。
ベイズの公式は単純ですけど、奥が深いらしいです。
利点はベイズの公式を利用できることですかね?
欠点はないです。
だってベイジアンでないかぎり、ベイズの公式を使っても
使わなくてもいいんですから。
>>90 >欠点はないです。
ベイズは概して計算量が増えます。
92 :
132人目の素数さん :2011/04/17(日) 23:37:54.83
>>89 y = (a+b_1+...+b_k)*x_0 + a*b_1*x_1 + ... + a*b_k*x_k + u
これを書き換えると
y=a*x_0 + (1+a)*b_1*(x_0 + x_1) + ... + (1+a)*b_k*(x_0 + x_k) + u
x_0、x_0 + x_1、...、x_0 + x_k って変数を作って、重回帰分析をして、
もとまった係数から、順番にb_1からb_kまでを決めていけばいい。
93 :
132人目の素数さん :2011/04/17(日) 23:40:48.41
あ、ごめん、見間違ってた。
94 :
132人目の素数さん :2011/04/18(月) 02:18:12.99
計量経済で言うコクランオーカット法の推定と同じような問題かな?
CRFってわざわざ名前つけるほど特別な方法でもないじゃん なんで騒がれてんのか不明だわ
>>87 aとa*bはそりゃあ独立じゃないですよ。
aとbを別に求めたいから非線形ということですよね。
97 :
132人目の素数さん :2011/04/22(金) 09:25:33.58
データが「正規分布に従う」と言うためには何をすれば(何を示せば)いいですか?
99 :
97 :2011/04/22(金) 19:36:59.20
論文なのにこんなところで聞くのかw 参考文献に2chと書くのか?w
胸が熱くなるな…
102 :
97 :2011/04/22(金) 20:37:35.46
>>100 ここで概要を聞いた後に文献を引いて詳細を調べようと思います。
>>102 データの分布について、正規分布かどうかの検定をする。
あたりまえすぎて、答えになるかな…
104 :
97 :2011/04/22(金) 23:16:49.37
>>103 正規性検定の方法を調べてみたらいろいろ出てきましたが、
よく使われるものや使わない方がよいものはございますか?
- Anderson–Darling test
- Kolmogorov–Smirnov test
- Shapiro–Wilk test
- Smirnov–Cramér–von-Mises test
>>104 概要を聞いたら、詳細に調べるんじゃなかったっけ。
106 :
97 :2011/04/23(土) 01:20:54.07
>>105 はい、それぞれの手法の詳細は現在調べているところです。
最初に質問したときは「正規性の検定と言えばこれ」という
手法があると思っていましたが、いくつもの手法が出てきた
ため、定石があれば教えていただきたいと思い質問しました。
>>106 統計の手法は、データの特性によって手法が違うので、自分のデータにあった手法を選ぶしかないね。
それは、各手法を調べればわかること。
108 :
97 :2011/04/23(土) 10:11:01.86
>>107 ありがとうございます。
各手法の詳細を学んだ上で、自分のデータに最適な手法を選択します。
>>98 , 103
お礼が遅くなりましたが、ありがとうございます。
>>107 と同じ方かも
しれませんが、違う方でしたらいろいろな方々にお世話になりました。
109 :
132人目の素数さん :2011/04/24(日) 21:20:58.83
110 :
132人目の素数さん :2011/04/24(日) 22:09:22.10
>>108 データ数が多いほど、正規性の検定で棄却されるから、
泣かないようにね。
もし、正規性の検定が研究の中心テーマでないなら、
検定なんかしなくて、ヒストグラムのみ示しておいて、
「正規分布と仮定して、、、」と進めればよいと思います。
棄却されないために、わざと検定しない奴多いんですよ。(爆
また、実験などでデータ数を調整できるような研究なら、
データは少なめにしたほうがいいかも?
111 :
132人目の素数さん :2011/04/27(水) 13:01:13.59
小説に歴史上の数学者を登場させたくて、 確率論、特に正規分布などの歴史について調べています。 Wikipedia以外で、ここが詳しい、というサイトがあったら教えてください。
物書きに掲示板の情報をもとにネットで調べて済まそうという態度が見えて驚いた
>>112 ニートなので出費はちょっと……。
最寄りの図書館にも数学史無かったし……まあ諦めます。
>>113 ちょっと登場させるぐらいならWikipediaの情報で十分な気がするが。
正規分布はガウスが発見したが、Wikipedeiaのガウスのところは相当詳しいよ。
>>114 おおっ。良くまとまっていますね!thanks!
この問題はカイ二乗分布の表を使って解くのでしょうか? どなたか詳しい解き方を教えて頂けたら嬉しいです。 なんかいまいち参考書を読んでも解き方がわからない... 正規分布に従う母集団から次の標本が存在する 66.303、15.102、84.942、53.234、93.443、63.132、45.295 この時、母集団の平均と分散を信頼係数95%で区間推定せよ。 (解答は小数点以下第4位まで求めよ)
>>116 サンプルが与えられてて、サンプルサイズがわかってれば、信頼区間の式に入れるだけ。
118 :
132人目の素数さん :2011/05/05(木) 06:36:06.04
>>118 pdfは見ないで書くけど、ないなら他から探して持ってくる。
>>116 平均の推定はt分布
分散の推定はχ二乗分布
>>118 表の中に38698校とあるやつではないわけ?
122 :
132人目の素数さん :2011/05/05(木) 16:58:23.57
>>121 でも、(2ー1)では総数40285校なんですよね。
こういう調査って総数は一致しないものなのですね.
123 :
132人目の素数さん :2011/05/06(金) 19:58:32.59
>>122 >>119 だけど、なんか適当なこと書いてるのでpdfを読んでみた。
とりあえず、統計資料使う時は「注」を読もうね。
私の学生が「こういう調査って総数は一致しないものなのですね」って
言ったら叱ってるw
まず、「(1−1)暴力行為の発生状況」と「(2−1)いじめの認知
学校数・認知件数」をみると(1−1)には特別支援学校が含まれていない
のでその分(2−1)が多い。
(2−1)の注を見ると「注3)学校総数のうち、高等学校の全定併置校は
全日制、定時制をそれぞれ1校(計2校)として計上しているため、学校基
本調査の数値と一致しない。」と一致しない理由が書いてある。
(1−1)では国立170、公立36242、私立2286で、(2−1)の数字から
特別支援学校を除くと、国立が170(=215-45)、公立36775(=37741-966)、
私立2314(=2329-15)となっていて、国立以外は(2−1)の数字が大きい
ので、その部分が全日制と定時制を両方やってる学校で、そういのは別の学校と
してデータを処理してるのがわかる。
また、(2−1)の注を見ると「(注4)休校等の学校があるため、認知した
学校数と認知していない学校数の合計は、学校総数と一致しない。」とあり、
学校総数40285に比べ、表の認知した学校及び認知していない学校の計は40082
と小さくなっているので、(1−1)を見るときも休校などが考慮されていない
と予想できる。
124 :
れが :2011/05/06(金) 21:56:57.84
問題: 三角形Ωから無作為に一点を抽出するという試行を考える。この試行に対する標本空間はΩそのものであるが、確率変数X,Y:Ω→Rをそれぞれω∈Ωに対して、X(ω)=ωのx座標、Y(ω)=ωのy座標で定義するとき、 1) P(Y>=1)=□、P(X^2+Y^2>=1)=□、 2) Xの確率密度関数f(X)はf(X)=□、E[X]=□、 Yの確率密度関数g(y)はg(y)=□、E[Y]=□、 □を求める問題です。 図がなくて申し訳ありません。X座標が1、Y座標が2の三角形Ωです。 分かるかた教えてください。 よろしくお願いします。
>>124 すぐに答える気はないんだけど
とりあえず、三角形の頂点の座標が
(0,0)、(1,0)、(0,2)
ってことかな?
126 :
れが :2011/05/06(金) 22:10:37.07
>>124 携帯だし詳しく書けないし、文系だしまちがっててもよければ。三角形の面積が1だから、面積がそのまま全確率になる。
1→三角形のうち、Pの中の式を満たす面積が答え。図を書けばいいと思う。
2→三角形の斜辺をxの式で書く。その式が答え。
でも、解答欄の□がでかいなら解答として「0≦x≦1のとき」としたほうがいい。
正確には「0>x,x>1のとき」はf(x)=0と場合分けする。次に∫x×f(x)dxを三角形がある範囲でする。
小さい解答欄にそれかくと空気読めてないと思われるかも。
同様にyの式で書く、∫y×f(y)dyを三角形がある範囲でする。
>>127 >>125 だけど、三角形なんだから、積分しなくても期待値はでるでしょ。高さに当たる方を半分にすればいい。
>>117 >>120 ありがとうございます。
この問題の分散は、カイ二乗分布を使って標準偏差を出してそれを二乗すれば出る、
という認識で正しいでしょうか?
どうしてそんな認識になるのか僕にはわけがわからないよ。
>>130 多分、信頼区間ってものが全然わかってないんだと思う。
こりゃ毎回生徒をいびりにくる先生から説教してもらわなな
>>130 >>131 >>132 カイ二乗分布の母標準偏差の二乗が、カイ二乗分布の分散であるという記述を見たので、先ほどの問題で分散を求める際はこれに従えば良いと思っていました。
これはやはり誤りでしょうか?
教科書を読んでもこの程度しか理解できませんでした・・・
どなたかアドバイス頂けませんでしょうか。よろしくお願い致します。
>>133 ある分布があって、その標準偏差は分散をルートしたものだから、標準偏差を2乗すれば分散になる。
でも君のデータはχ二乗分布なの?
平均値についての信頼区間は、データの平均を中心に信頼区間の式で区間を決めるよね。その時にt分布か標準正規分布を使う。
分散も同じように考えて、データからの分散を基準に分散についてぬ信頼区間の式で区間を求める。
その時に、信頼区間の設定(90%とか95%とか)に対応したχ二乗分布の値を使う。
ついでに書くと、平均値についてはマイナスを取ることもあるから、データの平均値の両側にプラスマイナスで範囲を取ってもいいけど、分散はマイナスにならないから比で評価して、データの分散の何分の一とか何倍までという方法で信頼区間を決めてる。 とりあえず、分散の信頼区間の式をよく見るんだ!
>>133 ストーリーがわかってないような気がした
分かっていたらすまん
数学的な話を抜きにして、発想の話
例えば、池の中の魚の身長の平均や分散を知りたい
→全部調べるのむり
→とりあえず10匹捕まえた(標本)、10匹の身長平均は10センチだった
→ひょっとして、池の魚の平均身長は10センチ?(点推定)
→でも、よくよく考えたら、次に10匹とってまた身長平均が10センチとはかぎらないよな
→でかいのが10匹とれたり、小さいのが10匹とれたりするかも
→サンプル平均は大小さまざまな値をとるな
→池全体の平均を10センチとドンピシャでよそうするのは怖い
→平均は8センチ〜12センチにあるとか幅もたせて予想するか
→これが区間推定
サンプル平均やサンプル分散はどのような大小さまざまな値をとる
しかし、実はそれぞれ工夫をすれば特徴的な分布に従う
そして、その分布を見ながら95%の確率まであたるように予想範囲を広げる
大数の法則のおかげでこんだけサンプルとれば 信頼に足る母集団の情報が得られますよって判るのか!
区間推定の信頼率って、本来は極限とった先での値だよね 有限の場合で考えても、極限にどれだけ近いか(オーダーじゃなくて、正確に数値で)わからないと、 95%なんて具体的な値を引き合いに出しても意味なくね?
訂正 "(オーダーじゃなくて、正確に数値で)"は削除
>>139 小標本特性についてはわかっていない場合が多いが、例えはt分布については特性が数学的にわかってる。
その代わり、母集団の分布に制限がある。
中心極限定理は、母集団に制限がないから凄いわけ。(特殊な分布を除く)
で、小標本特性がわかって無いのが多いので、シミュレーションでサンプルサイズが小さい時の特性を求めるか、仕方ないので極限を取って利用してる。
ということで、全く意味がないわけではない。
142 :
132人目の素数さん :2011/05/11(水) 22:50:42.61
>>139 まず、
>>141 に追加
>中心極限定理は、母集団に制限がないから凄いわけ。(特殊な分布を除く)
その代り、サンプル数が大きくないといけない。
ただし、実際には無限のサンプルサイズは取れないし、30とか50のサンプル
があれば実用上はそれほど問題がないこともわかっている。
t分布表と標準分布の表を比べてみるとわかるよ。
次にちょっと補足しておくと、小標本の場合は数学的(解析的)にサンプル
の分布の状態が求まらない。これは式で表せないということであって、少ない
サンプル数での分布は存在する。
なので、例えばサンプルサイズが10しか取れないなら、ある分布の母集団から
10個をサンプルサイズとして取った場合にどうなるかをたくさん試すことで、
10個の時の信頼区間がシミュレーションにより求まるから、それを使えばいい。
143 :
132人目の素数さん :2011/05/12(木) 13:22:18.88
(平均,分散)=(0,1)から10個取り出した10個の平均値は、 0±10なら、確率100% 、 0±3程度なら、ヤマカンなのだけど、確率68.3%だろう。 ところで、その逆(のようなこと)である、 10個の平均値が、zeroの場合の 元の分布(これが正規分布で分散1であると仮定し) 元の分布の平均(つまり母平均)の確率分布を求めたい。 どうもなんだか、すっきりしないから。
144 :
132人目の素数さん :2011/05/14(土) 09:55:16.63
>>144 距離が近い分だけ放射能が高いが、すでに米ソの核実験が頻発していた
時代ぐらいまで下がったわけだ。このまま原発が安定してくれればね。
146 :
132人目の素数さん :2011/05/15(日) 10:52:52.19
147 :
132人目の素数さん :2011/05/16(月) 23:18:20.94
すいません。下記のような実験を行った場合、平均値や分散の有意差の有無を調査するにはどのような統計処理が普通なのでしょうか(実験誤差は正規分布に従うと仮定) (1)条件A B Cで各条件10サンプルを並行して行いデータを取った。 (2)上記の実験を三回繰り返した(各条件10*3のデータ数) 二元配置で三回の繰り返し数を各水準にするのも変な感じがしました。ご教示お願いします。
148 :
132人目の素数さん :2011/05/17(火) 10:31:45.76
>>147 ABCで10サンプルx3なら
それぞれ30サンプルということでいいじゃん?
30サンプルのが3つある、ということで
ABCを比較すればいい。
条件は同じなんでしょ?
>148 レスありがとうございます。はい。条件は同じです。
質問があるのですが、どなたかご回答をお願いします。 平均点が58、分散16のとき、得点が65の人の偏差値はいくであるか? 自分の考えでは、10・(65-58)/16+50=54.357になりました。 分散と標準偏差値を同じように扱ってしまっています。 どなたかご教授お願いします。
>>150 分散は標準偏差の二乗。
標準偏差は分散をルートしたもの。
>>150 分散ちゅうのはテスト受けたやつらの点数のバラツキの指標や。
バラツキ知りたかったら、平均からAさん、Bさん、Cさん…がいくら離れてるかしらべる。
で平均から離れてた点数を合計して人数(もしくは人数−1)で割ったら大体のバラツキが分かりそうやろ。
でも、この計算には問題がある。平均よりマイナスのやつとプラスのやつそのまま足したら打ち消してまうやん。
2人しかおらんと仮定して、0点と100点、49点と51点のテスト結果のバラツキ指標が同じになってまう。
前者のほうが、実力バラついてるやろ。
だから平均から離れてた点数を2乗して合計してから人数(もしくは人数−1)で割るんや。それが分散。
でも2乗したまんまやと気持ち悪いやろ。単位が点の2乗とか意味不明やし。だから最後にルートしたくなる。それが標準偏差。
2乗したやつをルートして点ベースに戻してるから、大体平均から±○点くらいバラついてんやなって分かる。
さらに言えば、Aさん、Bさん、Cさん…の全員の点数から平均点をひいてみる。
当たり前やけど、引かれた点数をもとに平均点を出すと0点になるやろ。
さらに、Aさん、Bさん、Cさん…の点数を標準偏差で割ると、標準偏差が1になる。あんまりばらつかんようになる。
(100点満点のテストを10点満点にした感じ)
この発想が
(点数−平均)/標準偏差
みんなの点数をこの式にいれて、これを点数にしたら平均0で大体±1に収まるのではないかと発想したくなる。
その発想をもとに、偏差値はどういう指標なのかを考えてみては。
平均点とれば偏差値50とかの意味もわかると思う。
その関西弁イラつくからやめて下さい
154 :
132人目の素数さん :2011/05/20(金) 08:33:36.99
というか、10・(65-58)/16+50=54.357 の式を書いてる段階でそれなりに
勉強はしてる。
>>152 の説明だとかえってわからない、混乱させるよ。w
>>152 自分は納得できました。
たまにくる教員の方?より分かりやすいです。
>>155 みたいに教科書を読んでも理解できないのが、
「マンガでわかる統計学」の購買層なんだろうなw
>>154 あなたも理解が足りてませんね。
基準化するのに分散で割ってる人を学習が進んでると判断するあたり。
似てる式ですが意味が全く違いますよ。単位が違いますから。
標準正規分布を利用した検定推定。特に区間推定と基準化の関係。
さらには標準正規分布から派生するカイ二乗分布などでの式変換の意味がわかっていないということです。
式を丸暗記したり、似てるものを書ければ学習が進んでるとはいいませんよ。
156は教員で悔しかったのかなw ひさびさにワロタ
いや、たまにくる教員は俺(
>>154 )だ。w
>>157 当人が、分散と標準偏差を同じに使ってると書いてるので、違いを教えておけばいい。
宿題や試験をそのまま聞くのがいるので、先ずはヒューリスティックな説明をして、わからなくてまた聞くようなら、追加で説明してるので、分かりづらいと思われるのは想定内。
先生! 宿題ききにきて挙げ句ケンカする大学生をなんとかしてください! ここはもはや動物園です でも好きです
私も好きなので、止める気はありません。 授業評価もないので、静かにさせなくても問題ないし。w
すんません。 X〜x^2(n)のとき a*X〜a*x^2(n) になりますか?
x^2(n) って何?
カイ二乗じゃないかな
>>162 です
そうですカイ二乗分布です
説明不足ですいません
>>165 ならない。
χ二乗分布の確率密度関数と変数変換の公式で計算してみるといいよ。
綺麗な形にならないと思う。
a*x^2(n)って何?カイ二乗分布のa倍?
分布関数を考えて、それが元の型のa倍になるかを聞いてるんだと思う。
xがn(μ,σ^2)の正規分布の時、y=(x-μ)/σ^2とすると、yはn(0,1^2)で、標準正規分布になるみたいなことを聞きたいんだと思う。
>>169 y=(x-μ)/σ^2 じゃなくて、y=(x-μ)/σ に修正。
>>168 それってa倍したものが再生性があるとか考えなくてよいなら
どんな分布でもそうなんじゃない?
>>169 は再生性の話だよね。
>>168 a倍した変数が従う分布「〜a*x^2(n)」と書いてるので、
a倍した新しい変数の確率を考えるとこれはおかしい。
全ての確率が1になってない。
全ての確率が1になるような分布関数の形状の話ではなく、
対応関係だけを考えているなら、
>>171 のコメントもありかな。
Y=aX ってのは、新しい変数Yの分布を考えた時に、その値が
aXと等しければ、元の分布のXの時の確率が与えられる。
例えば、X=1の確率が0.5、X=2の確率が0.7だとして、Y=2Xで
新しい変数Yが与えられたら、Y=0.5で確率が0.5、Y=1で0.7。
(ここまでならあり)
ただ、普通は変数変換して、y=φ(x)という変換をした場合、
元の密度関数がf(x)ならば、yについての密度関数は、x=ξ(y)
として、g(y)=f(ξ(y))|dξ(y)/dy| となる。
χ二乗分布の場合、f(x)の中のガンマ関数部分は無視するとしても
X^(m/2-1)*e^(-X/2) という項があって、ここのXをY/aに置き換え
た物が出てくるので、積分して分布を考えても元のa倍にはならない。
>>171 あ、肝心なことを答えてなかった。
>>168 、169で書いたのは、再生性というよりも、変数変換した後の
分布の形状の話で、それは元の分布にaを掛けたものにはならない
ってことです。
回答的には 確率変数 X が自由度 n のカイ自乗分布にしたがう時、 確率変数 Y = aX ( a > 0 ) の確率密度関数のグラフは 自由度 n のカイ自乗分布のグラフの横軸を a 倍、縦軸を 1/a 倍 したものになる。 でOK?
>>174 正規分布ならそれでいいけど、χ二乗分布だとそうは言えない。
>>172 に書いたΓ分布以外の項があるので綺麗にならない。
例えは、自由度2のχ二乗分布の累積密度関数で、0の値(高さ)を計算すると、0.5になる。
これは、y=axで変換しても、y=0で高さが0.5になるってこと。
まあ、χ二乗分布は自由度が高くなれば、漸近的に正規分布に近づくので、そういう意味では、だいたい1/aの高さになると考えてもいいけどね。
あ、例えで、嘘書いたかも。w
例えだけでなく一般論的にも嘘というか勘違いだけど
0の値の高さは半分になるよね。
また、変数変換ではy=axならx=y/aでg(y)=f(y/a)/aだよね。
だから変換後の分布はカイ二乗分布にはならないけど
密度関数でいえば
>>174 で正解だね。
>>178 g(y)=f(y/a)/a の処理で、悩んでたんだけど、χ二乗分布か
どうかって話を別にすれば、分布の形は高さが1/a になった
ものだね。
χ二乗分布にこだわりすぎて、単純なところで勘違いしました。
ありがとうございます。
多頻度飽和アイテム集合と多頻度アイテム集合との違いがいまいち 分からないのですがご教授下さい。 聞く場所が分からないのでスレチかもですが。。
データマイニングの用語のようだね。 ここで反応あるかな?
182 :
132人目の素数さん :2011/06/01(水) 11:18:43.31
宿題でましたので教えて頂きたいです 問い→日本人の血液型A、B、O、ABの比率は4:3:2:1であることが知られている。 110人の学生の血液型を調べたところ、その比率は52人:35人:18人:5人であった。 この学生達の血液型比率は日本人の血液型比率に適合していると言って良いか? 有意水準5%でこれを検定せよ。 お願いします
>>182 適合度検定でググると、具体例も含んだ説明がたくさんあるよ。
184 :
132人目の素数さん :2011/06/02(木) 05:42:09.96
統計学会の一般講演申し込み締め切り間近です。 今年は申し込み少ないみたいです。 番号がまだ2桁だし。。。
185 :
132人目の素数さん :2011/06/02(木) 07:11:47.94
場所が九州大学の伊都キャンパスという、 鳥も通わぬド僻地なので、誰も行きたがらない? なぜ伊都のようなド僻地に移転したのか? 九州にありがちな賄賂と政治とヤクザと、(ry
鳥はたくさんいますが。
僻地といっても空港から1時間。 東京から京大に行くのと伊都キャンパスに行くのでは ほとんどかかる時間は変わらないのだ。
あんでぃ
189 :
132人目の素数さん :2011/06/02(木) 17:12:23.06
アンディ・フグのかかと落しは強烈だった。
190 :
132人目の素数さん :2011/06/04(土) 02:18:28.65
博多って一度もいったことないから全然わからない。 どこらへんに泊まるといいの?
LOTO6の出目の出る間隔を確率分布で表すと Χ二乗分布?
192 :
132人目の素数さん :2011/06/05(日) 12:44:21.92
統計士の講座の内容は、質どう?
193 :
132人目の素数さん :2011/06/05(日) 17:16:30.36
>>191 出目の出る間隔って、どこのこといってるの?
例えば、1と10がでたら差が9とか、そういう意味?
194 :
132人目の素数さん :2011/06/05(日) 22:36:51.98
教えてください お願いします ある東京都内のA医大病院は,収容される救急患者数Xがλ=2.5のポアソン分布Po(2.5)に従う.救急患者のために常時何床の空きベッドを確保すればよいか,ベッドが不足する確率を求めることで考察する.なお,エクセルの計算では関数「=EXP()」を用いよ. ( i )ある時点で,救急患者がちょうど一人もいない確率,救急患者によってベッドがちょうど1床埋まっている確率,ちょうど2床,ちょうど3床,ちょうど4床埋まっている確率,計5通りを求めよ. (ii )救急患者のために,2床の空きベッドを確保しているとき,3床の空きベッドを確保しているとき,4床の空きベッドを確保しているとき,それぞれにおいて,ベッドが不足する確率を求めよ 具体的な解き方を教えてください たぶん当てはめる式は同じだと思うので、 ( i )ある時点で,救急患者がちょうど一人もいない確率 (ii )救急患者のために,2床の空きベッドを確保しているとき の2通りについてのみの詳細な解き方をおしえてください
195 :
132人目の素数さん :2011/06/06(月) 00:00:38.06
>理由があるかどうかはともかく、痴漢で懲戒免職後に受け入れてくれる大学などないだろう。 >未練があろうが、日本の大学への復活は無理。 >最近の研究業績はいまいちなので、海外の大学で給料をもらうのも無理。 猫
197 :
132人目の素数さん :2011/06/06(月) 00:21:56.02
貼り付けただけで逃げようとする猫はウジ虫。 現実を直視できない悲しさ。
198 :
あんでぃ ◆AdkZFxa49I :2011/06/06(月) 00:22:28.33
あんでぃ
>>193 いえ
第n回が 1 4 10 18 22 40 43 (15)
第n+1回が 4 14 19 23 41 42 (11)
第n+2回が 1 12 13 27 37 38 (9)
としたら
1の間隔は2
4の間隔は1
とみなします
指数分布ですか?
負の二項分布じゃないすか?
マジすか?
統計士ってなに?アクチュアリー?
民間の講座だな。 講座を終了したらもらえるそうだからあまり意味がなさそうだな。
統計勉強してみたいと思ってるんですが、入門書でお薦めってありますか? 漫画で分かる!とか絵で見て分かる統計学!みたいな、全くゼロの状態からとりあえず取っつきに、って感じのがあれば是非お願いします。 あとついでにそれが終わってちゃんと始めるならこれ、みたいなのもお願いします。
205 :
191 :2011/06/16(木) 17:46:29.41
すいません誰か教えてください 肺炎患者 インフルエンザ A地区 3人 1人 B地区 8人 5人 C地区 6人 1人 D地区 12人 4人 E地区 7人 3人 F地区 10人 4人 この時地区によってインフルエンザの割合に偏りがあるかどうか 確認するにはどうしたらいいですか?
207 :
191 :2011/06/16(木) 20:56:11.80
ああ というか 幾何分布ですね
>>206 各地区の人口データを入手しろ。話はそれからだ。
210 :
206 :2011/06/17(金) 18:33:04.88
これだけじゃ無理ですかね・・・ もうちょっとデータ集めて考えてみます ありがとうございます
211 :
132人目の素数さん :2011/06/21(火) 10:01:54.00
ロジットモデルとロジスティック回帰モデルの違いを教えて下さい。
>>211 本質的には一緒。
関数の特定化の違い。
教えて下さい、お願いします ある化学工場において、製品の収率(%)に影響を及ぼすと考えられる反応温度と 原料を因子として取り上げ、二元配置の実験を行つた。実験結果について解析せよ。 (収率は高い(数字が大きい)ほどよい) A1(40°) A2(45°) A3(50°) A4(55°) Bl(精製品) 98.0 99.0 98.6 97.6 B2(普通品) 97.7 98.0 98.2 97.3 33(粗製品) 96.5 97.9 96.9 96.7 @構造模型に基づいて分解せよ(一般平均=総平均と仮定する) A分散分析表を作成せよ BAの母平均の点推定値及び95%信頼限界を求めよ CBの母平均の点推定値及び95%信頼限界を求めよ 実験計画法によって道母数を推測するんだと思うんですかが表の書き方等が いまいちよく分かりません……
表の書き方って教科書の例題にでも載ってるだろ…。
215 :
132人目の素数さん :2011/06/24(金) 15:59:48.11
x、Mをそれぞれ相関のある確率変数ベクトル、対称行列とします。 このとき、2次形式x'M^{-1}xの期待値を計算したいのですが、 この期待値はどういう仮定の下で存在すると言えるでしょうか? 問題は逆行列が含まれているので、そこをどうすればいいのかわかりません。 よろしくお願いします。
多変量正規分布の指数部分だよね
217 :
132人目の素数さん :2011/06/24(金) 16:49:21.93
215の補足です。 対称行列Mも確率変数です。
Mが正定値とかいうことが知りたい? 質問がよくわからん
219 :
132人目の素数さん :2011/06/24(金) 21:58:42.78
犬
条件って「確率1でMが正定値である」でいいんでないか?
221 :
132人目の素数さん :2011/06/25(土) 05:23:53.35
>>218 説明不足ですみません。
E(x'M^{-1}x)が存在するための条件を知りたいということです。
別の例で言うと、相関のある確率変数XとYの比X/Yの期待値E(X/Y)を
計算したいのですが、そもそもこの期待値が存在するための条件は何か?
ということです。例えばXとYが独立で標準正規分布ならX/Yはコーシー分布
になりますが、期待値は存在しません。X/Yの期待値が存在するための条件を
知りたいということです。
222 :
132人目の素数さん :2011/06/25(土) 06:07:43.80
22222222222222222222222222222222222222222222222222222222222222222222 22222222222222222222222222222222222222222222222222222222222222222222 22222222222222222222222222222222222222222222222222222222222222222222 22222222222222222222222222222222222222222222222222222222222222222222 22222222222222222222222222222222222222222222222222222222222222222222 22222222222222222222222222222222222222222222222222222222222222222222 22222222222222222222222222222222222222222222222222222222222222222222 22222222222222222222222222222222222222222222222222222222222222222222
223 :
132人目の素数さん :2011/06/25(土) 21:18:37.33
不偏分散はなぜn-1で割るのか理解しようとして、このページを見ていたんですが
http://home.a02.itscom.net/coffee/tako08Annex2.html 標本平均からの偏差平方和 = 真の平均からの偏差平方和 − 標本平均の分散*n
なので、1/nして分散にしようとすると、標本分散=真の分散−真の分散/n になるので
標本分散ではなく、標本分散*(n-1/n) = 標本平均からの偏差平方和/n-1
であることはわかりました。
ただこのWebページの説明の情報量という考え方については
Σ情報量 = Σ平均の情報量 + Σ偏差平方 は成立するけど
情報量 = 平均の情報量 +偏差平方 は成立しませんよね
この赤線ACで示す「実際に観測される測定値」って何のことなんでしょうか?
標本1つ1つの値を2乗して総和したものを√した辺の長さ(効果)って何か意味のある数値なんでしょうか?
赤線ACw 誤字脱字ないか?
225 :
132人目の素数さん :2011/06/25(土) 21:43:44.32
赤い線分ACでいいですか
新しくできた飲食店に初めて入っておいしくなかったとき サンプリング数N=1では判断できないと思ってもう一回入るんだが ほとんどの場合やはりおいしくないという事象は統計的にどう説明できるのですか
味のばらつきが小さいからN=1でも十分なんじゃない?
逆に女心はバラツキが大きいから試行回数を増やすことには意味がある
>>226 それ、考え方が間違ってる。
製品を検査してみたら壊れてた。
いま検査した製品を、もう一度検査してもやっぱり壊れてる。
これは当たり前。
確認が終わったものについては、すでに統計的推測は関係ない。
ある大学の平均身長を知りたいから、サンプルを10調べる。数が少ないので、20にしてみる。これは意味がある。
でも、ある人の身長を測ったら、その人については終わりだよね。
>>229 飲食店は、通常、複数の料理を扱うと思うが。
あるレストランでは、オムライスがまずかった。
次回に同じレストランに行って、ミートスパゲティをオーダーすると、
まずいだろうか、うまいだろうかという話かもしれない。
また、曜日によって調理するアルバイトが異なり、アルバイトの調理能力に
差がある場合もあるだろう。
さらに言えば、ある料理を1品食べたとしても、次に出される1品は、
同じ料理としても、同じ味とは限らない。
X,Y,Zの3つの値があったとき、Yが100になるように標準化するとは、どういった手順を踏めばよいのでしょうか?
そんなムツカシイ問題に回答できませんわ
>>230 そうだよね。この問題は色々考えられるよね。
ある料理に限定した場合、個人的経験からすると別の日に行ったらおいしく
感じたという経験はない。やはりばらつきは小さいのかな?
でもおいしさは個人差が大きいようでそれをおいしいという人もいる。
味の数量化は無理なのか…。
235 :
132人目の素数さん :2011/06/30(木) 05:05:35.86
パターン認識の話になると思うのですが、 特徴量選択でSFS、SBS、SFFSについてご存知の方いらっしゃらないでしょうか? これらのアルゴリズムについて簡単に説明してほしいのですが、、、
女性の男性に対する感情も第一印象で決まるN=1の世界
世の中に本当に正規分布しているものなど絶対存在しないから
確率統計には絶対はないから。 数学的に0%でも絶対にないかと聞けばあると答えるのが数学者。
今、統計学で流行ってるのってなんだろ?
FXシステムトレーディングじゃねえの
242 :
132人目の素数さん :2011/07/02(土) 10:42:09.63
すみませんが、考えてもどうにも分からないので教えてください 我が校の自宅外学生のうち無作為抽出により30人にアンケート調査したところ,家賃の平均は50000円,標本標準偏差は10000円であった. この標本平均による,我が校の自宅外学生家賃平均の95%信頼区間,および99%信頼区間を求めよ.(これは求まりました) ただし,我が校の自宅外学生の家賃は正規分布にしたがっているものとする. 上記のアンケートを,本統計学受講者の自宅外学生に対しておこなったとする.このとき,標本抽出に関する問題点を述べよ 問題点が分からないのです。
統計学受講者の家賃の分布をみるのが目的なら 妥当なサンプリング数とれば問題ないんじゃねえの
無作為抽出ではない。
245 :
132人目の素数さん :2011/07/02(土) 19:06:32.52
>>243 母集団を変えるということね。
>>244 「統計学受講者の自宅外学生」の家賃は、
正規分布かどうかはわからないってことね。
というか、前期の宿題かもしれないんだから、少しは放っておけ。
247 :
132人目の素数さん :2011/07/02(土) 20:03:55.60
宿題かもしれないけど、
このスレなかなか伸びないから。
何か書きたくなるわけ。
>>246 さんがいろんなこと書いてくれ。
確かに正規分布してるものなど存在しないが 統計学は正規分布してると思い込まないと成り立たない
余計なお世話かもしれないけど、 正規分布している という表現止めた方がいいよ。 正規分布に従っている の方がいいよ。 先日、frpのメーリングリストでも標本数という言葉が問題になったけど、 言葉は正しく使おうよ。 帰無仮説を採択する という表現のある教科書を排除しようと、図書館でうろついていたら、 あまりにも該当する本が多くて、頭が痛くなってきた。
>>242 その先生は統計学取ってる学生はビンボーだと思ってるんじゃないの。
断固抗議すべき
統計学受講者 そんなの全数調査しろよって言ってやれ
統計学の問題がわかりません。(確率密度関数、期待値など・・) 全くわからないんで教えてください。 あるバス亭での発車時刻は毎時5分、15分、35分、50分となっている このバス亭に発車時刻を知らずにきた人が発車まで待つ時間をX分とする (a)Xの確率密度変数を求めよ (b)Xが10以上となる確率を求めよ (c)Xの期待値を求めよ。。 おねがいいたします。。
>>254 教科書に書いてある、確率密度関数と期待値の定義を書いてください。
で、どこがわからないか聞いてください。
256 :
132人目の素数さん :2011/07/05(火) 19:40:00.31
257 :
132人目の素数さん :2011/07/05(火) 19:49:39.94
昭和3年1月関東州大連市生まれ。 昭和28年3月京都大学理学部植物学科卒業。 昭和32年9月大阪市立大学理工学部助手。
258 :
132人目の素数さん :2011/07/05(火) 19:57:59.30
あげとくわw
南部陽一郎先生、西島和彦先生や梅棹忠夫先生に嫉妬した当代きっての 馬鹿男ですね。もし嫉妬スルにしても相手が完全に違うと思いますけど。 まあお気の毒な事で。 猫
260 :
132人目の素数さん :2011/07/05(火) 20:47:44.70
増田芳雄さんは世界的な植物学者ですよ そんなことも知らないのか
>>260 そんなツマラナイ事は私は知りませんね。でも『もし世界的』というの
であれば客観的に認められる証拠を提出して下さいまし。何も知らない
ド素人が騙されて貴方の主張を鵜呑みにしたらとても困りますから。
猫
>>260 そもそもその人はどんな研究で業績を挙げた人なのでしょうか? 貴方
が『世界的である』という主張をスルのであれば、ソコは貴方がきちん
と責任を持って説明をしなければなりません。
お返事をお待ちします。
猫
263 :
132人目の素数さん :2011/07/05(火) 21:23:42.15
君に質問権はないよ
>>263 では今後は私は貴方に対して徹底的に喰い下がり、執拗に追跡を行います。
なお
>>260 に記述がアル主張を私が認める事は絶対にアリマセン。
猫
>>263 『何故私には質問権がないのか』を論理的に説明願います。お返事をお待
ちします。
猫
266 :
東大生 :2011/07/06(水) 07:57:14.12
昭和3年1月関東州大連市生まれ。 昭和28年3月京都大学理学部植物学科卒業。 昭和32年9月大阪市立大学理工学部助手。 この経歴の偉大な生物学者は誰ですか?
>>266 東大生サン、
現代数学の重要性とその展望に関する談話を迅速にお願いします。貴方
のその『豊富な知識と深い理解』が行かされる瞬間ですから、我々下々
に希望の光を貴方の知性で与えて下さいまし。
猫
>>266 経歴は偉大でも頭はカラッポ、知性は皆無。井の中の蛙。
猫
269 :
132人目の素数さん :2011/07/06(水) 12:53:58.45
>>266 ん、25歳で大学卒業?
芳雄さんは浪人とか留年してたの?
272 :
132人目の素数さん :2011/07/06(水) 13:37:01.04
へぇ、芳雄っちは苦労したんやな〜
幾ら苦労しても能力が無ければ馬鹿のまま。そういう人が息子の教育を スルのは誤り。そもそも「ああいう不見識」は子供を持つべきではない。 猫
274 :
132人目の素数さん :2011/07/06(水) 13:45:00.37
芳雄っちは京大卒業かすごいなぁ 息子は阪大らしいが…
ハハハ、京大は凄いんですか。ほんで阪大は何なんですかね〜 猫
276 :
132人目の素数さん :2011/07/06(水) 14:14:55.12
京大>阪大だから、芳雄さんのほうが優れていますね
>>276 その芳雄サンって誰や? アホの見本かァ?
猫
278 :
132人目の素数さん :2011/07/06(水) 14:20:12.81
>>276 その芳雄サンっちゅうんは誰や? 馬鹿の見本かァ?
猫
280 :
132人目の素数さん :2011/07/06(水) 14:45:56.69
>>279 人類史上例をみない天才かつ努力家の見本だよ
>>280 そうですか。何十年にも亘って身内からの攻撃に耐えて生き長らえた、
という様な事なんですかね。まあ頭が極端に悪くても、でも馬鹿な努力
だけは出来た、という様な事ですかね。猪突猛進の阿呆。
猫
282 :
東大生 :2011/07/06(水) 18:35:54.34
だからその努力家の息子は痴漢ということでいいんですね?
>>282 東大生サン、
現代数学の重要性とその展望に関する有難いお話しを賜わりたく存じます。
その溢れんばかりの知性と教養に裏打ちされた『豊富な知識と深い理解』
を是非ともこの場でご披露なさって下さいませ。
お返事をお待ち申し上げまする。
猫
>>282 東大生サン、
スマートでカッコイイお返事をお待ち申し上げます。是非とも頭がキレ
る所をこの場で我々下々にお見せ下さいませ。
猫
285 :
132人目の素数さん :2011/07/06(水) 20:38:20.54
なんで学部学生に粘着しているのか? 学部生に現代数学なぞ触れた事もないだろ?
>>286 まてまて。
当たり前の内容をテレビで話しただけで大学に差をつける根拠にしちゃだめでしょ。
サンプルはためしてガッテンだけですが何か。
290 :
132人目の素数さん :2011/07/09(土) 15:26:33.82
291 :
132人目の素数さん :2011/07/19(火) 22:17:27.68
統計学できる人、誰か居る?
なんかよう?
>>286 狩野裕教授の学科が、統計学の助教を公募中のようですね。
==大阪大学 大学院基礎工学研究科 助教公募(統計学)のお知らせ==
1. 公募人員: 助教1名
2. 勤務形態: 常勤 任期なし
3. 所 属: 大阪大学 大学院基礎工学研究科・システム創成専攻・数理科学領域・
統計数理講座(基礎工学部 情報科学科 数理科学コースを兼担)
4. 研究分野: 統計科学・数理統計学
5. 希望する人材: 熱意をもって教育・研究にあたり,統計数理・数理科学の発展に
貢献して下さる方を求めます.数学・統計学の演習科目と計算機を
使った実習科目等を担当して頂きます.
6. 応募資格: 博士の学位を有する方,または研究上の業績がこれと同等以上と認められる方
7. 着任時期: 平成23年10月1日以降のなるべく早い時期
9. 応募締切: 平成23年8月18日(木)必着
http://www.es.osaka-u.ac.jp/grad/announce/index.html#74
294 :
132人目の素数さん :2011/07/20(水) 00:32:46.10
>>213 >CBの母平均の点推定値及び95%信頼限界を・・・・・
この例題って、以下の2点が訝しいんだが。
A因子を4水準も採っているが、普通は3水準で十分だろ?
A,B各因子の母平均の推定値を求めよ...とあるが、求めるべきは、
特性値(収率)を最適値にする因子組合わせでの収率の点推定と区間推定値だろ?
この配置実験計画法例題は、何という科目で出題された問題なの?
295 :
132人目の素数さん :2011/07/20(水) 02:19:23.82
296 :
132人目の素数さん :2011/07/25(月) 12:51:46.80
統計ソフト、JMP 8使ってるんですが、Mac のOSをLionにアップしていいものか 分かる人いたら教えてください。
297 :
132人目の素数さん :2011/07/25(月) 13:19:23.53
統計ソフト、JMP 8使ってるんですが、Mac のOSをLionにアップしていいものか 分かる人いたら教えてください。
マイナーなOSだから、開発元に問い合わせたほうがいい。
299 :
132人目の素数さん :2011/07/25(月) 15:11:09.60
>298 296/297です。(すみません、ダブルで書き込んでました) 開発元は、JMP9しかサポートしてなくてJMP8はサポート外だとバッサリ切られました。 もし情報お持ちの方がいたら教えてください。
300 :
132人目の素数さん :2011/07/25(月) 15:11:37.55
>298 296/297です。(すみません、ダブルで書き込んでました) 開発元は、JMP9しかサポートしてなくてJMP8はサポート外だとバッサリ切られました。 もし情報お持ちの方がいたら教えてください。
JMP 9を購入するか、Rをインストールしろよ
302 :
132人目の素数さん :2011/07/25(月) 16:10:33.64
>301 自分のPCであればすぐにJMP9にするのですが、PC自体がラボの所有なのですぐには出来ないのです。
>>302 ラボのMacなら勝手にLionにしたらダメだろ
304 :
132人目の素数さん :2011/07/25(月) 17:59:49.07
>303 すみませんが、僕の質問とは論点がずれています。 どなたかOSX Lion + JMP 8 の動作確認していたら教えてください。
306 :
132人目の素数さん :2011/07/26(火) 13:27:58.02
マカーってほんと馬鹿だな。
悪いのはマカーじゃなくてMACなんだよ。 みんな騙されてるだけなんだ。 目を覚ましなよ!
MACで統計学とか統計学を馬鹿にしてるとしか思えない。
310 :
132人目の素数さん :2011/07/27(水) 10:03:01.77
内挿(interpolate)と外挿(extrapolate)の違いって何ですか?
補間と補外のとか?
>>309 SASのJohn Sallに同じこと言ってみろ!
313 :
蛙-かわづ- ◆NxYIfSaetA :2011/07/29(金) 14:45:25.73
あんでぃ、早く。
1000頭の牛がいたとして汚染牛が混じってないかチェックするには何頭検査すればいいの?
>>314 確率(どれくらい間違ってもいいか)を何%以下にしたいかで変わってくる
けど、ゼロにしたかったら全部調べるしかないよ。
抜き取り検査だと、検査した個体に汚染された牛がいても残りにはいない
可能性があるし、逆に検査した個体に汚染された牛がいなくても残りには
いる可能性がある。
この場合の確実な方法(絶対に流通する牛に汚染されたものがいない方法)
は、出荷しようと思う個体を全て調べて、汚染されていない個体を出荷する
こと。
>>315 統計学的にはそうだけど、実践的には、「検査は100%正しく結果を出す」という前提が間違いだから、
検査の感度と特異度を考慮しなくてはならない。
統計学でも検査のすり抜けはもちろん考えるよ。 ただがん検診とかと違って放射性物質汚染の方が 確度は高いだろう。そもそも315は全頭検査と言っているのだから がん検診のように2回以上検査しろっていうのか?
図書館のPCの利用率が @8:00〜9:30 79% A9:30〜11:00 81% B11:00〜12:30 84% C12:30〜2:00 63% D2:00〜3:30 78% のときCの時間帯は利用率が低い・有意差があるというには何検定を使うのが妥当ですか? 実際には@〜Dに分かれているのではなく、15分刻みの16個に分かれているのですが・・・
全利用者とサンプルはそれぞれ何人くらいいるんだ? 全数調査か?
利用者じゃなくてPCの台数ベースの全数調査じゃないの
321 :
132人目の素数さん :2011/08/02(火) 19:36:58.24
比率の差の検定で多重比較の検定はありますでしょうか。 成功か失敗かの実験で、n=30で、 条件A 成功率80%、条件B 成功率70%、条件C 成功率50% で α=0.05で多重比較を行いたいのです。
>>317 なるほど利用率てのはPCの稼働率のことなのか
324 :
132人目の素数さん :2011/08/03(水) 13:21:37.00
PCの台数は書かれてないけど、%出してるわけだから時間帯毎に全何台中 何台稼働ってデータがあるわけでしょ。要するに検定の必要なし。
>>326 JMPってわざわざMac向けに開発されたパッケージ。
どおりで旧バージョンのサポートをあっさり捨てるんだな。 アップルと同じだな。
>>328 ただし現在のユーザー人口は圧倒的にWindowsってSASの人がセミナーで言ってた。
Adobeと同じだな。
>>326 JMPの専用のスレがあるってことじゃなくて、MAC使いが少ない
ここで聞くよりもMAC使いに聞いた方が早いんじゃないかってこと。
>>327 そうかあ、JMPってマウス機能なんかが他のWindows用ビジネスアプリとは毛色が
違うなと感じていたんだが、元々はExcel同様にMAC用に開発されたアプリだった
のか。出生地がMAC環境だったんだね。
わかる人教えてください Aという細胞郡とBという細胞郡を用意します。 それに対して薬品CとDで処理をしてある値を3回ずつ計測します。 つまり AC1 AC2 AC3 BC1 BC2 BC3 AD1 AD2 AD3 BD1 BD2 BD3 という実験結果をえます。 それぞれ3回ずつの値の平均 μAC=(AC1+AC2+AC3)/3 として 平均のRatio RA=μAC/μAD RB=μBC/μBD と定義します。 この平均の比率 RAとRBについて優位差検定をしたいのですが、そのような検定方法はございますでしょうか? 教えてください。
335 :
334 :2011/08/06(土) 05:41:55.83
補足 薬品CとDは濃度が違うだけで同じ薬品です。 なので比を取っています。
336 :
132人目の素数さん :2011/08/06(土) 13:59:09.69
>>334 「フィッシャーの正確確率検定」
でググってみてください。
マウスを多用する解析が好ましいと感じる人がいるようだ。 MAC好きと同じだな。
339 :
132人目の素数さん :2011/08/07(日) 00:56:23.84
MAC好きって馬鹿が多いよね。 なぜだろう?
340 :
132人目の素数さん :2011/08/07(日) 01:15:09.39
>>339 自分の周囲を見てると分からないでもないが、p=0.1くらいの主張だな。
>>334 何か難しいこと考えるんだね
自分なら、細胞の種類(ダミー)と薬品の濃度、その交互作用を独立変数にして
「ある値」を従属変数にして回帰分析。
交互作用が有意なら細胞によって薬品に対する反応が異なる、つまり、あなたの言葉で言うRAとRBに差がある。
有意でないのなら差はない。
といくかな。
交互作用が「比」に相当するとしてよいように思うけど。
カイ2乗検定で 帰無仮説H0:〜と〜は独立だ 対立仮説H1:〜と〜は独立でない としてH0を棄却して独立でないことを示す例が多いけど、 逆はできないんだよね? つまり独立でないことを帰無仮説として、 カイ2乗統計量が小さいことを根拠に帰無仮説を棄却し、 独立であることを示すってことは無理だよね?
344 :
132人目の素数さん :2011/08/15(月) 10:26:41.77
独立でない、と仮定したときの貝2錠推計量をどうやって計算するつもりなんだ??
こういうことじゃないの。
http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/one-two.html の1.1の最後の方にある
もう一つ付け加えておく。比率の差をχ2 分布を用いて検定するときに,左側の例えば 0.05% は何を意味するであろうか。
それは,「偶然とは思えないほど差がない」ということである。これは比率の差の検定ではあまり取り上げられないが,
適合度の検定(これも比率の差の検定としても解釈できる)の場合には「データがねつ造された可能性」を示唆するものとして
取り上げられることがある。すなわち,χ2 分布の左側は「理論に一致しすぎる」,右側は「理論と乖離しすぎる」ということである。
中庸がもっともあり得るという立場から検定すれば,「χ2 検定の場合にも両側検定はあり得る」。
(適当に改行)
>>345 >中庸がもっともあり得るという立場から検定すれば,「χ2 検定の場合にも
>両側検定はあり得る」
って一般的な考え方かな?
347 :
132人目の素数さん :2011/08/15(月) 17:34:26.01
>>347 私の周りでもそうだからp値が小さくなるって言わなきゃいけないんじゃないの
>>346 一般的じゃない。
対立仮説として「データ捏造」をさらに加えた時の話だよね。
どんな検定基準を作っても、捏造者はそれをクリアーしてくる。
なので「データ捏造」は統計学の枠には入らない
基準を知られたら何でも無理なのは確か。 ただ過去の捏造話では簡単に見破れるほどひどいのが多いけどね。 (見破られていない完全犯罪的な捏造があるのかもしれんが)
ついでにχ^2検定について1つ質問 m*nの分割表の自由度は(m-1)(n-1)で計算になるというのは分かるのだけど、 7*2の表と4*3の表の自由度が6となって 推計量が同じ分布に従うことが納得いかない。 分かりやすい説明ない?
計算は理解しているのになぜ納得いかないかが分からない。
353 :
132人目の素数さん :2011/08/24(水) 13:44:37.19
>自由度は(m-1)(n-1)で計算になるというのは > 「 分 か る 」 >のだけど ↓ >7*2の表と4*3の表の自由度が6となって 同じが 納得いかない。 本当に 分かっているとは 思えない。 つまらん見栄、はるなよ。
自由度の「式は知ってる」と言いたかったんだろう。意味じゃなくてね
SBICが資料によっていろいろ違ってるような気がする
>>352-
>>354 そうです。
計算式は知ってるけど意味が分かりません
分割表は周辺固定。なんで1引くのか考えてみてよ。
ヒント:以下の2×2分割表の(1)(2)(3)欄を x の式で表しなさい。 計 x (1) 10 (2) (3) 40 計 20 30 50
知っている人がいたら教えて欲しいのですが シェッフェの一対比較法で -2から2の5点系や-3から3の7点系は見るんですが -1から1の3点系ってあるんですか?
>>360 だから、
>>358 をみると、2×2の場合には1個情報が与えられてしまえば
他の情報は決定されてしまう。つまり自由に決めれる自由度が1個。
その考え方を、
>>351 の7×2と4×3にも当てはめて見れば、自由になる数
の個数はどうなる?
>>361 その自由になる個数の数ってのは分かってるよ。
計算式の途中で7*2は14項、4*3は12項出てくるじゃん。
それが各項が独立ではないから自由度6のカイ2乗分布に従うんだろうってことは分かるけど、
直感的に違和感を感じるから詳しい人に説明してもらいたいんだよ。
363 :
132人目の素数さん :2011/08/26(金) 13:21:18.15
こんなことで、直感的に違和感を感じる人には 統計学は無理じゃないかな。。。 普通、直感的に理解できることなので…
具体的に数式を変形して (〜)^2 + (〜)^2 + (〜)^2 + (〜)^2 + (〜)^2 + (〜)^2 の形に変型して見せてよ。 違和感感じてるの項数だけなんだから。 あと、学問として統計学をやっていこうという気はないです。 ただのツールなので。
>>364 ただのツールなら、それこそ気にしなくていいよ。
それに、ただのツールと言う人のために時間を割いて書き込みしても無駄でしょう。
信用して使えるものなのか気になる
>>366 そういう点が気になるなら、「学問」として自分で勉強しましょうね。
2*2の場合、とてもきれいな公式があったので、 それより大きな表の場合を知りたかったのですけどね。 私の計算力では無理でした。 残念です。
369 :
132人目の素数さん :2011/08/27(土) 09:17:42.05
JUMPかRで、三群以上の実験データについて比率の差の検定の 多重測定はできますでしょうか
できます。
>>368 >>368 は
>>351 かな?
最初から、
「2*2で自由度についてこういう展開式があってわかりやすいんだけど、
3*4とか7*2みたいな場合はどうなるのかわかるひといるかな。
私の計算力では無理だった」
と書けば答えてくれた人もいると思う。
質問の仕方と受け答えを間違ったね。
あのう、立教明治スレからやってきた者です。 ぜひ皆さんのお力を借りたく参りました。 どうしても立教明治ダブル合格のデータの持つ意味に納得が行かないので 相談しています。 結果の数値は事実なので問題ではありません。 でもこの調査結果から明治より立教が秀逸とは言えないと思います。 なぜなら、そもそもの調査対象データに偏り、というよりデータの取り方に問題が あると思うからです。 皆さまには、この立教明治ダブル合格者のデータの信憑性について、あるいは適切な 参照方法についてご教授いただきたけないでしょうか?
少なくとも2×2分割表で納得できたのなら、もう気は済んだでしょう。 これは結構難しい問題で、最初はトップの専門家が皆間違えてた。 その誤りを指摘して、今日使われている自由度の式を導いたのが、R.A.Fisher。 これでデビュー後、次々と精密理論を作り上げて行った。 R.A.Fisher, "On the Interpretation of X2 from Contingency Tables, and the Calculation of P," Journal of the Royal Statistical Society, Vol.85, No 1(1922), pp 87-94.
>>372 立教と明治の両方に合格した人がどっちを選んだかという話?
データ例を挙げて、どんな偏りがありそうなのかを説明してみれば、
統計的な問題がありそうかどうかわかると思うけど
>>372 とりあえず、データ見せてよ。
君が持ってるデータをみんなが持っているわけじゃないし、
そんな聞き方じゃ、わざわざ探す気にもならないよ。
週刊誌の受験特集でダブル合格者の進学データがあります。 一例を挙げると以下のようなものです。 1 エリート街道さん 2009/02/18(水) 13:47:33 ID:BtFc0u57 読売ウィークリー08.8.3号「W合格者対決特集」 〜W合格時の進学先〜 [対明治] [対青学] ○立教法 42 - 27●明治法 ○立教法 11 - 0●青学法 ○立教法 7 - 4●明治政経 ○立教経済 7 - 1●青学経済 ○立教経済19 - 4●明治商 ○立教経済 4 - 0●青学国際政経 ○立教経済16 - 0●明治経営 ○立教経営 5 - 0●青学経営 ○立教経営34 - 3●明治経営 ○立教文 31 - 5●青学文 ○立教経済37 - 14●明治政経 ○立教理 8 - 1●青学理工 ○立教文 102 -28●明治文 ○立教理 48 - 5●明治理工 [対学習院] ○立教法 10 - 0●学習院法 ※[対中央][対法政]は問題外、掲載すらされず ○立教経済13 - 1●学習院経済 ○立教文 23 - 4●学習院文 ○立教心理 4 - 1●学習院文 ○立教理 14 - 2●学習院理 ■アエラ09.2.23号併願対決 〜○立教全体平均70-明治全体平均30●〜 ○立教経営85-15明治商● ○立教経営89-11明治経営● ○立教文68-32明治文● ○立教心理55-明治文46● ※立教心理は新座、明治文は御茶ノ水 ●立教法10-中央法90○ ●明治法4-中央法96○
この表ではマーチ各校の勝敗をダブル合格者の進学数によって決めています。 この調査で明らかなのはダブル合格者の進学者の数であって、その大小を示した に過ぎません。 多くのスレッドではあたかもWinnerの大学の方が人気があり、優れていることの 裏付けのように扱っています。たしかにダブル合格者にとってはその通りです。 ですが、両校の受験者の合計と比較してダブル受験者数があまりに小さい場合、 ダブル合格者のもたらす結果は補正して見る必要があると考えます。 統計学に精通されている皆さまなら、私の申しあげたことの趣旨を汲み取って いただけるのではないかと思い、こちらに書き込みさせていただきました。 立教明治スレであまりにも酷い解釈がまかり通っており、皆さまからの助言を 期待するものです。
少し本音ベースで話すと私は明治の出身です。 このダブル合格者の進学データを見たとき、正直無意味と思いました。 多分高校3年のときだったと思います。 なぜなら両校を受験しているという条件が一般的ではない、その他のケースの 方が圧倒的に多いだろう、と思ったからです。 実際、明治に入学して友人に立教受験について訪ねると1人も立教を受験した人は いませんでした。彼女も明治ですが、やはり女友達にもいなかったそうです。 なので明治入学者のほとんどは立教を受験していないと考えます。 ですから、立教と明治のダブル合格者の進学データについては明大生一般の実状と 異なるものと考えます。 明治ではよくこう言われます、「そもそも立教青学は受けない」と。 理由は偏差値の差以上に校風のベクトルが違い過ぎるからです。 明大生は早稲田、公立大落ちがほとんどです。
380 :
132人目の素数さん :2011/08/28(日) 03:08:01.25
俺、早稲田だけど明治は受けなかったけど立教は受けたよぐらいしか言えない
381 :
132人目の素数さん :2011/08/28(日) 03:59:35.07
> 実際、明治に入学して友人に立教受験について訪ねると1人も立教を受験した人はいませんでした。 それは何人にたずねたのかな? 係属高校出身者を除いて100人ぐらいにたずねていれば一応評価できるけど。 立教も明治もどんぐりの背比べだから、おれから見たらあまり違いはないように思う。 だから気にしないでいいと思う。 今の不景気な時代に私立大学に行くことは、裕福な家庭の子息にしか できないことだからね。 勉強するのは旧帝や早慶にまかせておいて。 まったり遊んで卒業すればいいんじゃないの?
>>379 読売ウィークリーのデータがどれくらい信用できるかって問題はある。
08年くらいだと個人を特定できたんだっけ?
もしも、きちんと個人を特定してダブル合格をフォローできてるなら
立教と明治の両方を受かった学生は立教に行ってるのが多いくらいは
言えそう。
まあ、似たようなLVの大学を複数受けてるってことは、そのLVの大学が
適正LVで、そのために受験料も余分に出せるってことなので、お金がある
って意味では立教向きの属性はあるかも。
でも、どうでもいい数字だなと思う。
学生の雰囲気も違うし、入った大学が気に入ってればいいんじゃないの。
>>380 やはり立教の方がいいということでしょうか、
それとも明治は早稲田コンプという雰囲気だから敬遠されたんでしょうかね。
ご回答ありがとうございます。
>>381 周囲にはせいぜい20〜30人くらいです。ですからほとんど主観の領域です。
付生には尋ねていません。
>立教も明治もどんぐりの背比べだから、おれから見たらあまり違いはないように思う。
>だから気にしないでいいと思う。
>勉強するのは旧帝や早慶にまかせておいて。
>まったり遊んで卒業すればいいんじゃないの?
私が主張したいのも、まさにこれらのことです。立教も明治も同レベル。
ただ両方受けた人にとっては立教が良かった、ただそれだけ。
もしくは明治はいやだった。ほとんど好みの問題で偏差値云々の話でないと
考えています。
私の考えでは、立教を併願するということは少しでも魅力を感じていたという
ことで、選択する可能性があります。一方私の持論である、明大生は立教を
受けていないという考えに立てば、ダブル合格者の進学データは、明治合格者の
スケールに比して極小となります。データとして偏りがあるということになります。
一応立教明治スレでも併願者数のデータを貼り付けてもらいました。
後程コピペします。
>>382 ホントにどうでもいい数字なんです。
ぜひそのことを立教関係者の方に理解してほしいのです。
さきほの件です。古いデータですが各校の併願先がわかります。
887 エリート街道さん sage 2011/08/27(土) 22:30:11.29 ID:wvvB/703
>>877 はサンプルに偏りがあるけどね
明治立教を例にすると
@明治、立教にどちらも合格し、明治か立教に入学した
A明治だけ、立教だけに受験した合格した人は対象外
B明治、立教どちらも合格したが他の大学に入学したは対象外
2001年と古いが代ゼミの併願対決ではこうなってる
http://www.geocities.co.jp/CollegeLife-Lounge/6635/ 明治法 早大法1129 中央法1128 法政法840 立教法549★ 日本法533 早大社518
明治商 早大商*951 明治営*672 法政営654 明治政639 早大社575 立教経513★ 中央商508
明治政 早大社*818 早大商*805 明治商639 中央経562 早大政562 法政経508 明治営502 立教経477
明治文 早大教*640 中央文*585 法政文583 早大文581 立教文491★ 國學文417
明治理 立教ランク外
立教文 青学文*730 早大教697 上智文633 早大文623 学習文566 明治文491★ 中央文386
立教経 早大商1208 立教経952 早大社724 明治営621★ 上智経568 法政営560 明治商513★ 立教社510 早大政488 明治政477★ 慶応経441
立教理 理大理*389 中央理312 理理工247 上智理237 早大理233 青学理203 早大教154 学習理149 明治理130★
立教法 早大法*714 明治法549★ 中央法546 上智法470 法政法397 早大社366 立教経356 学習法319
877 エリート街道さん 2011/08/27(土) 21:47:18.40 ID:DkVmnfYc
具体的にサンプル数が判明しているソース
■私大併願対決「MARCH関関同立編」 (AERA 2010年1月25日号)
http://iup.2ch-library.com/i/i0047294-1263749439.jpg 【マーチ編】 【関関同立編】
○立教266 - 121明治● ○同大612- 37立命●
○立教157 - 46青学● ○同大495- 32関学●
○立教149 - 54中央● ○同大464- 5関西●
○立教268 - 12法政● ○立命139- 134関学●
○明治210 - 81青学● ○立命246- 55関西●
○明治311 - 169中央● ○関学373- 55関西●
○明治515 - 15法政●
○青学105 - 60中央●
○青学206 - 31法政●
で、この表を見易くしてくれたのがコレ。 明治立教の併願は387名。明治の単独受験者数は10万人以上。立教も数万はいる。一見サンプル抽出の手法を取っているかのように見えるが、明らかに立教明治の併願というのはレアケースと言える。果たしてそのようなデータに信憑性はあるのか? そしてそのデータに翻弄され、受験生の適切な選択を妨げてはいないだろうか。私はこの現状をなんとかしないと、と思ってる。 879 エリート街道さん 2011/08/27(土) 21:52:52.60 ID:DkVmnfYc 明治法政530人 明治中央480人 立教明治387人 明治青学291人 立教法政280人 青学法政237人 立教青学203人 立教中央203人 青学中央165人 明治・法政・中央はホーチミンで併願が多いのは当たり前 次に多いのが立教明治。立教法政も多い。 この辺は六大学だからか。
>>386 まず、2001年のデータは古すぎます。
10年前のデータをだしても現在の人気の変数にはなりません。
>そしてそのデータに翻弄され、受験生の適切な選択を妨げてはいないだろうか。
>私はこの現状をなんとかしないと、と思ってる。
って書いてるけど、別に受験生はそんなこと考えていないでしょ。
受かりそうな大学を併願してるだけ。
で、受かった後に、自分の大学を少しでもいいと思いたいから語ってるだけ。
ということで、君が気にしてるほど受験生は気にしてないし、ネットに書き込む
属性の人がそういってるだけなので放っておいていいと思います。
2010年のデータはどうですか? また受験生に関しては私の勝手な想いですから気にしないでください。 これらの立教明治のダブル合格者の進学データは大学受験板、学歴板に大量に貼られ、そのたびに不毛な論争が続いています。どうにかこのダブル合格者の進学データの無意味さ(立教明治の優劣を決める上での指標という意味で)を証明したいと思うので、助言を下さい。
389 :
369 :2011/08/28(日) 22:12:52.11
>370 ありがとうございます。Rの場合のパッケージと関数を教えて頂けないでしょうか よろしくお願いします
>>385 >○立教266 - 121明治●
全学部で 2:1 ぐらいの比だよね。率に直すと 69% ; 31%。
n = 387人だと、約20人以上の差がつくと5%有意なので、
この結果は「統計的に見て有意差あり」。
差が出る要因は
1.人数:一般入試合格者数の違い
2.学部学科構成(一方にあって他方にない学部学科の志望者数)
3.キャンパス・部活・宗教・就職先・・・
とか、もっと細かく見て行かないとわからない。
あと、併願同時合格者にもし女性が多いと、立教に行く率が高くなるかもね。
なので統計学ではなく、専門としてはマーケティングや社会学が近いかも。
けど一般常識としては、「これぐらいの差なら大体同ランクの大学」。
× 約20人以上の差がつくと5%有意なので、 ○ 約40人以上の差がつくと5%有意なので、 (仮説 p=1/2 の下で √(np(1-p)) = √387 / 2 ≒ 10)
質問です。 tukeyの方法で30群(自由度270)を多重比較したいのですが、ステューデント化した範囲の表には10群までしか載っていません。10群以上は不可能なんでしょうか? それとも補間する方法があるんでしょうか? よろしくお願いします。
質問です。 変動係数の存在意義って何ですか? 標準化統計量を比較すればそれで事足りる気がするんですが。
>>392 可能です。
が、10までしかない表から30の場合を補間することはできません。
>>393 標準化統計量を比較するとは?
具体的に言うと、どういう数値を、何と何とで比較することを意味しているのでしょうか?
>>395 んーと、変動係数ってデータ集団の桁が違えば、
標準偏差の大きさが違ってくるから、
散らばりの程度を集団間で比較できないので必要と言う話ですよね?
それに対して標準化統計量って、ある特定のデータが
集団の中でどの辺りに位置しているかを表すわけですよね?
つまり、2つのデータ集団のデータを全て標準化して、
さらに2つのデータ集団ごとに標準偏差をとれば、
集団間の散らばりの程度を表現できますよね?という話です。
どうでしょう?
>>396 確かに、変動係数の存在意義は小さいと思いますが、それはさておき。
>2つのデータ集団のデータを全て標準化して、
>さらに2つのデータ集団ごとに標準偏差をとれば、
データの標準化というのは、「各々のデータから平均を減じて標準偏差で割る」ことでしょ?
いわゆるz得点というものですが。
そうすると、平均0、標準偏差1になりますから、もう一度標準偏差をとったら、当然1以外になりようがないでしょう。
ではなくて、A集団とB集団のデータを込みで平均と標準偏差を計算して、込みで標準化した後、
それぞれの集団ごとに集計して標準偏差をとるということですか?
たとえば、平均1で標準偏差0.1のA集団(アリ)と平均170で標準偏差10のB集団(ヒト)とを込みで標準化できると思いますか?
(まさに桁違いの場合)
計算はできますが、どういう意味をもつのでしょうか。
398 :
392 :2011/08/31(水) 11:38:48.13
>>394 ありがとうございます!
自由度と群数から範囲を求められるツールを手に入れたので、それでやってみようと思います。
399 :
132人目の素数さん :2011/08/31(水) 13:02:53.38
lkjs6
400 :
132人目の素数さん :2011/09/02(金) 00:27:21.39
質問です。 y=a+bx+eにおいて aとbをOLSで求めたとして、 その推計値はどの様な確率変数に従うか説明しろって言われたら 何て答えれば必要充分なんでしょうか? サンプル数が多ければ正規分布、少なければt分布だと思うのですが これだけだと説明になってないし・・・
>>400 t分布は間違い(a, b の推定値とは違う話)。
>はどの様な確率変数に従うか
問いとしては、誤差項の分布の「平均・分散」(と幾つかの標準的な仮定)を与えた時に、
「確率変数 a, b」の分布の「平均・分散」がどう表せるかを答えさせるのが主旨だと思う。
分布形は仮定せずに答えたあとなら、誤差項が正規分布に従うなら・・・とか付け足してもOK
402 :
132人目の素数さん :2011/09/02(金) 16:09:55.47
>>410 ありがとう御座います。
>「確率変数 a, b」の分布の「平均・分散」がどう表せるかを答えさせるのが主旨
ということは「a,bは不偏推定量であり、分散は〜〜の式で求めることが出来る」
とか書けばいいのでしょうか?
403 :
132人目の素数さん :2011/09/02(金) 16:32:16.64
ちゃうやろ。 おそらく「t分布に従う」、という答えを求められているぞ。 数学的に正確かどうかは別の話。
404 :
132人目の素数さん :2011/09/04(日) 16:23:52.48
質問です。 ある計測をして、 1,2,3,3,4,4,4,5,5,5,5,6,6,6,7,7,7,8,9,300 という20個のデータが得られたとします。 このとき、けた外れに大きい300というデータを取り除いたり、この計測データには不適(測定ミス)だと判断できるような方法はあるでしょうか? わかりにくい内容で申し訳ありませんがよろしくお願いします。
>>404 実際に測定ミスであったか否かの判定は統計では分からないです。
ただそれが外れ値、異常値であるという示唆は得られるので、それに従って
検証し直すことになります。測定ミス、入力ミスでない外れ値であるとなった
場合にそれを分析から除去するのか、別の処理をするのかは研究の内容にも
よるでしょう。
>>404 それが、計測ミスか入力ミスか外れ値かはわからないが
極端に外れているかどうかは、統計でわかるよ。
407 :
404 :2011/09/04(日) 19:13:12.26
>>405-406 ありがとうございます。
では300というデータが他のデータ群から極端に離れていることを客観的に示すためにはどのような方法で示せばよろしいでしょうか。
質問ばかりで申し訳ございません。
409 :
404 :2011/09/05(月) 20:30:08.99
>>408 わざわざありがとうございます!!
参考になります。
こんばんわ正規分布と標準正規分布がいまいちわかりません。 標準正規分布は平均=0 標準偏差=1と言うのはわかりますが。 問題で工場の[平均5.2kg][標準偏差が0.1kg][5.0kg]未満の製品は社内で不合格とされるとでているのですが生産された製品の不合格率の割合が何パーかがわかりません。 分かる方おねがいします。
質問です。 『ある会社Aが「うちの授業受けた人の90%はTOEFLの点数が20点上がってるよ」って宣伝してました。それに対し、会社Bが「Aは誇張している!」と訴えました。 規制協会が調査に乗り出して、Aの授業を受けた人のうち100人の成績をGET。その内訳は ・50人は35点up ・35人は20点up ・15人は0点up(点数上昇無し) でした。 この時、有意水準5%でAの主張またはBの主張を検定しなさい。』 という問題なのですが、90%という部分をどう扱えばよいのかわかりません。 その部分さえ無ければ普通の仮説検定でよいと思うのですが…。
>>411 Aの宣伝が正しければ、ランダムに生徒を調べてみたら、100人のうち90人前後が成績upしているはず。
協会が調べてみたら、50人がupしていて、50人は変わらず、だったとしたら、
90%upした集団からのサンプルとは言い難いと考えるでしょうね。
では、85人がupだった場合はどうなのか。90人には足りないけれど、
この85人は、元々のA社の言う90%が正しいとして、「たまたま」5人少なかっただけ、と言えるかどうか。
「普通の仮説検定」の意味がよくわかりませんが、これもごく普通に行われる仮説検定。
>>411 >点数が20点上がってるよ
20点「以上」では?
>>411 >90%という部分をどう扱えばよいのかわかりません
期待値の算出に使う
ランダムに選んだ100人中に成績が上がらなかった人が 15人以上になる確率を考えればいいんじゃね?
416 :
132人目の素数さん :2011/09/12(月) 13:59:25.12
20%上がっているか、上がっていないかの2値判定なので、2項検定に持ち込む。 20%以上上がっている人が何点であるか、また20%以下の人が何点であるかは関係ない。 「35点up」とか「0点up」とかの情報は使われない。引っかけ問題。
20点以上上がったか、上がらなかったかという二つのカテゴリーに単純化して二項検定 でいいんじゃないの
419 :
132人目の素数さん :2011/09/20(火) 13:57:36.70
「2つの確率変数XとYの相関係数は0だが、独立ではないような例を示せ」って たとえば何があるんでしょう? 自分は苦し紛れに需要が完全に硬直的な状態のマネタリーベースと総需要の関係と答えたんですが・・
>>419 相関係数ってのは、二つの変数の間に直線の関係があるかを示している。
なので、右上がり、右下がりといった傾きの無い関係を考えればいい。
経済学部みたいだけど、そういう時の例は経済に限らなくてもいいのでは。
Y=sin(X)、Xの範囲は(−360°、+360°)とか。こんなに範囲取らなくてもいいけどね。
Y=X^2、Xの範囲は(-1、1)とか。下がって上がるので相関ゼロ。
Y^2+X^2=r^2、XとYの相関はゼロだけど円という関係にある。
>>419 独立性の問題だから理論的な確率分布の話。
例として簡単なのは以下のような離散型確率分布
x y 確率 p(x, y)
0 1 1/4
1 0 1/4
0 -1 1/4
-1 0 1/4
z = 0 … 1/4 z = 1 … 1/4 z = 2 … 1/4 z = 3 … 1/4 x = sin(zπ/2) y = cos(zπ/2)
423 :
忍法帖【Lv=6,xxxP】 :2011/09/22(木) 00:04:05.90
控除率50パーセントの宝くじって、一度に1000万ぶん買うと平均して500万もどってくるってこと?
控除率は、そういう使い方をするようだな
425 :
132人目の素数さん :2011/09/22(木) 04:12:30.76
日本の宝くじは控除率54%じゃなかったっけ? 世界で最も割の悪いギャンブル。 損することが決定しているギャンブル。
>>425 そういう発想で言うなら、得するギャンブルはないと思うけど。
胴元が損するギャンブルつうか。
> 損することが決定しているギャンブル もし俺がたった一枚買った宝くじが 末等以外のどれかにあたれば 払った金額よりも受け取る金額のほうが高いのだが それは「損」にあたるのか?
個別の問題を取り上げても仕方ないだろヴぉけ
個別で考えずに、何が「損得」なんだ?
430 :
132人目の素数さん :2011/09/22(木) 21:00:28.12
質問です。 統計学で出てくるt分布の数表って、誰がどうやってつくったんですか? 適当に乱数降ってシミュレーションしたんでしょうか。 あと、p値ってコンピュータで求める方法(アルゴリズム)あるの? ってか教科書の数表には普通にでてくるんだけど、あれはどうやって算出してるんですか。 全然わからなくて困ってます。教えてください。
どっかで見たような… マルチなのか?
わからなくて困ってるなんて書く人が書く内容じゃないと思うが。 本当にわからないのなら、わからなくても困らない。
なにこの流れ
434 :
132人目の素数さん :2011/09/22(木) 21:46:13.40
分割表の独立性検定の証明がみたいのですが、 どこかにあるかわかりませんか?
分割表の独立性検定の証明ってなんのこと?
436 :
132人目の素数さん :2011/09/23(金) 16:05:29.82
I×J分割表における独立性の帰無仮説の元でピアソンのカイ二乗統計量が 自由度なんぼかのカイ二乗分布に法則収束する証明のことです。
>>425 宝くじってのは、行政(主に地方自治体)が政策をやる時にお金を
集める手段なので、控除率が高いのは当然。
当たったらラッキー。でも元々行政に資金を供給するために宝くじ
買ったんだから残りはちゃんと使ってね。くらいの気持ちで買うもの。
439 :
132人目の素数さん :2011/09/23(金) 20:48:39.32
モデル言うの忘れてました。すみません。多項分布に関してです。 尤度比統計量は、まだ証明してません。積多項分布の一様性検定は証明できたのですが、 多項分布における独立性検定が難しいんですよね。最終的には、対称性検定を証明してから 漸近展開していきたいので、そのステップにと思ったのですが・・・。
440 :
132人目の素数さん :2011/09/25(日) 00:47:45.95
臨床医やってるものですが、論文書くのに統計家に相談するにはどういう方法がありますか? 金積むってのはなしで。
>>440 自分が卒業した大学の統計講義の担当者に相談する。
自分の所属した研究室の関係者経由で探す。
ただし、相談される相手も、あなたの相手で時間を取られるわけだから、
手土産くらいはあった方がいいと思うよ。
薬学農学たくさんもいそう
444 :
132人目の素数さん :2011/09/25(日) 22:54:12.45
>440 統計数理研究所の統計相談に申し込む
446 :
132人目の素数さん :2011/09/26(月) 08:42:49.03
447 :
132人目の素数さん :2011/09/26(月) 08:44:38.29
統計数理研究所て何やってるの?
448 :
132人目の素数さん :2011/09/28(水) 15:34:34.01
「パラメータを推定する」とよくありますが、一体どういうことですか? 簡単言うと何をやってるんでしょうか?そして、なぜ推定できるんですか? どれだけ説明を読んでも全く理解できません。どなたか教えてくださいませんか?
まあLevenberg-Marquardtだな よく使うのは
>>448 >どれだけ説明を読んでも全く理解できません。どなたか教えてくださいませんか?
例えば、私がここで説明しても、
>>448 は「説明を読んでも全く理解できません。」と言うのだろうと推定される。
451 :
132人目の素数さん :2011/09/28(水) 17:53:08.09
分からん
>>448 ちょっとだけ説明しよう。
以下のXは標本平均、σは標本平均の標準偏差(ただし母分散はわかってる)
だとする。
μ-mσ<X<μ+mσ
から
X-mσ<μ<X+mσ
へ、発想を転換する。
後は考えろ。
>>448 んと、例えばテレビの視聴率を知りたいとして、
関東圏 2011/09/28 午後8時の日テレ視聴率を p (0≦p≦1) とする。
この p が知りたい「パラメータ(母数)」。
視聴率調査では、関東の全世帯から600世帯を無作為に抽出して、
調査機をテレビに設置する。
2011/09/28 午後7時に送られて来たデータの60件が日テレを視聴してれば、
60 / 600 = 10% が知りたいパラメータ p の「推定値」になる。
世帯を無作為に選んでいるので、確率法則によって、この推定値の
誤差を見積もることも可能。(一般に抽出世帯数が多いほど誤差は小さくなる)
×2011/09/28 午後7時 ○2011/09/28 午後8時
>>449-454 みなさん本当にありがとう
>>450 に関しては「その通り」としか言えません
>>452 μとmは例えば何ですか?
>>453 標本抽出した後に、さらに標本を抽出しても解けますよ、ということですか?
確率って色んな事象でそれぞれ違うものだと思ってたんですが、
なぜ確率法則で推定できるんですか?
あらかじめ、これはこの分布(正規分布とか?)だ!と決めてしまうということですか?
ごめんなさい、質問ばっかりになってしまいました
>455 その質問をするところを見ると、統計の本を読んでないのがわかる。 説明がわからなくても、μについてなんですかと質問することは、 統計の本を読んでいればあり得ない。 とりあえず、「どれだけ説明を読んでも全く理解できません」てのは 何に書いてある説明を読んだのか教えて。
>>453 統計学のど素人なのですが、教えてください。
> 一般に抽出世帯数が多いほど誤差は小さくなる
あくまでも、@各世帯のデータが独立であること(ある世帯の視聴結果が他の世帯の視聴結果に一切影響しないこと)、
A無作為抽出であること、の2つ両方の条件が満たされることが大前提ですよね?
>>456 今は家に帰って来てしまったので本の名前は分かりません
μは平均だと思ってたんですが、違うようです
信じられないんだと思いますが、本は何冊も読んでます
でもその本を理解できないんです
そのレベルの頭なんです
正直、
>>452 の文字の意味が分かったとしても、多分何を言いたいのかは分からないと思います
>>457 >A無作為抽出であること、
それは大前提。
>@各世帯のデータが独立であること(ある世帯の視聴結果が他の世帯の視聴結果に一切影響しないこと)、
こちらは無関係。また母集団においては「独立」という概念もないです。
というか、社会的な特性なら、口コミや世代・職業・性別・地域文化など、
母集団のメンバー間に何らかの影響関係が存在するのが普通です。
また身長などの身体特性にも、年齢・性別・国・民族などの共通関係があります。
したがって平均特性の異なる母集団層を、標本抽出時に区別することが
できる場合には、同じ無作為抽出でも、より高度で精度の高い比例抽出法や
層別抽出法などが使われます。(詳細は「標本調査法」を参照)
実験計画法や臨床テストのコントロールグループ構成なども同様
>>455 >なぜ確率法則で推定できるんですか?
下手な鉄砲でも数撃てば当たるから。
神がいるから。
>>459 丁寧に説明いただき、ありがとうございます。標本調査法について詳しく調べてみます。
ただ、無作為抽出によるパラメータ推定は、母集団の分布が分かっている場合に限る、
ということになると思うのですが、その認識は違いますでしょうか?
また、往々にしてビジネスでは、母集団そのものの分布が分からない、推定したい
(パラメータの平均・標準偏差、そもそも正規分布していると仮定してよいかどうかさえ分からない)、
ということがよくある(というか、ほとんど)と思います。
その場合、限られた標本(例:キャンペーン時のアンケート調査結果や一部の消費者の購買履歴)から
母集団に関する意味合いを導き出そうとした場合、統計学的にはどのようなアプローチが考えられるのでしょうか?
たくさん質問してすいません。私なりに統計学の入門書等を読みはじめ、ビジネスでの使い方等を
検討しているのですが、理解がなかなか進まないこともあり、いまひとつ、道筋が見えてこないのです・・・。
母集団の分布が分からなくても、何回も抽出した標本の平均の分布は正規分布なんだな。 言ってる意味が分からないと思うが。
>>463 で、何回も抽出した標本の平均の分布が正規分布に従うから、何なの?
>>462 >無作為抽出によるパラメータ推定は、母集団の分布が分かっている場合に限る、
>ということになると思うのですが、その認識は違いますでしょうか?
違います。
例えば視聴率調査の場合だと、母集団分布は「観た割合 p」「観なかった割合 1-p」。
それは「分かって」いますし、その知識を前提にすることは何ら制約にはなりません。
そして未知な部分である p の値を、「無作為抽出した標本中の観た割合=標本割合」
によって推定するわけです。
しかし身長などの数値型特性の場合には、結果の種類が多すぎるので
上のように各値の母集団割合を正確に推定するには大標本が必要になります。
しかし普通はそこまで全てを知る必要もないわけです。
そこで母集団の平均値 μ だけを考えて、どんな分布形なのかは未知とします。
それでも標本平均値から μ は簡単に推定可能です。
(続く)
466 :
465続 :2011/09/29(木) 21:27:14.00
>>462 >また、往々にしてビジネスでは、母集団そのものの分布が分からない、推定したい
>(パラメータの平均・標準偏差、そもそも正規分布していると仮定してよいかどうかさえ分からない)、
>ということがよくある(というか、ほとんど)と思います。
ビジネスに限らず、先の二項母集団のように単純な場合を除けば、
母集団分布形は未知であることが普通ですよ。
しかし多くの場合、推定精度の評価や検定などの統計処理には、よく「正規分布」が
使われます。それが誤解の元かと。しかしこれは「母集団分布に関する仮定」
なのではなく、単なる「簡便計算法」にすぎません。
つまり、(上に話が出ているように)標本のサイズが少し大きくなると、代表的な
推定値の確率分布は極めて正規分布に近くなります。そこで、より扱いやすい
正規分布を使って「確率の値を近似」する、という実際的なアプローチです。
Excelなどで正確な分布から求めた確率値と、正規分布を使った結果とを
比較してみれば、差は無視できるぐらい小さいことが確認できます。
このあたりの内容は注意事項とか枝道も多いので、サクッとしたレベルでの話ですが、、、
ベンフォード分析の適用についてご教授下さい 「自然界の数値群」という適用条件の定義が分かりません 例えばフィボナッチ数列 A(n)=A(n-1)+A(n-2) に適用できて、等比数列 A(n)=A(n-1)×10~(n-1) には適用できません。 適用条件の定義について教えてください
>>464 母集団の分布が分からなくても、推定するときにとても役に立つわけです。
通常の調査で実際に母集団の分布が未知であるとはいっても、普通は、標本をみるとこれは正規分布と考えられますね、という検定はできるよね?
それに、母集団がそもそも正規分布じゃない場合はどうするの?
>>466 の説明だけ聞くと、何にも分からないし正規分布と程遠いかもしれないけどとりあえず正規分布になるってことにしちゃえよ、
それで分析しちゃえよ、だって分析が楽じゃん、で、なんとなく数字を出してみました、それが「推定」ですと言っているようにしか見えない
例えて言うなら、
コイツ何言ってるのか分かんねぇよ、多分文句言ってるんだよ、文句言ってるんだと思って対応しとけばいいよ、それが正義だから、
と言ってるのと同じことやってるように思える
>>465 ,466
457,462です。ご説明ありがとうございます。
私の勉強不足のため、いただいた内容をきちんと理解できてはないと思いますが、
少し、頭が整理できてきたような気がします。
>しかし多くの場合、推定精度の評価や検定などの統計処理には、よく「正規分布」が
>使われます。それが誤解の元かと。しかしこれは「母集団分布に関する仮定」
>なのではなく、単なる「簡便計算法」にすぎません。
「簡便計算」により、実用的に十分な精度で推定値を求める、もしくは、値の範囲を絞ることができる、ということですね。
そして、その簡便計算のもとになる確率分布がいろいろ存在すると(正規分布、t分布・・・)。
ただ、統計学の素養がない人(私もですが)に対して、簡便計算を適用することそのもののの妥当性や
仮定する確率分布の妥当性を理解してもらうのは、現実的にはかなり厳しいですよね?
つまり、統計学の素養がない人に対して、「未知の母集団(例:ある商品の消費者の1ヶ月あたりの購入金額の
平均)に関して、こんなことが分かりましたよ(推定されましたよ)」と言ったときに、いかに推定値の信頼度が
(統計学的に)高いかを説明しても、納得感を十分にはもってもらえなさそうですね・・・。
いずれにしても、自分でサンプルデータを使って手を動かして実際に数値を出してみながら、
テキストの理解を進めていき、何がどう使えるのかを自分で探っていきます。
早く、このスレの皆さんの話についていけるようになろうと思います。
どうもありがとうございました。
SPSS ってIBMが出してるマニュアルないんですか?
472 :
132人目の素数さん :2011/10/03(月) 12:27:21.20
重回帰分析について。 【質問1】 AICなどの説明変数選択規準を用いたとき、分散分析のp値では 有意であると判断できながら、説明変数のp値を見ると、有意ではない説明変数が 含まれることがあります(例:有意水準5%)。 説明変数のp値が有意かどうかで判断できるのならば、AICなどの方法で 変数選択を行う意義はどこにあるのでしょうか。 また説明変数選択規準を考慮するのならば、説明変数の有意性は どのように解釈すれば良いのでしょうか? 【質問2】 変数選択を行うと、多重共線性を取り除くこともできることがある、 というのは正しい理解でしょうか。
473 :
132人目の素数さん :2011/10/03(月) 12:31:46.88
>>472 472です。
この質問の回答に相当する内容が載っている書籍をご紹介いただくのも歓迎です。
地元の図書館や国会図書館に置いてあるといいな。
474 :
132人目の素数さん :2011/10/03(月) 14:26:49.43
>472 p値で変数選択はできません。 「有意でない」と「ない方がよい」は違います。 p値で変数選択している場合は多重共線性は考慮されません。 p値の信頼性が低下するだけです。
475 :
132人目の素数さん :2011/10/03(月) 15:25:34.53
>474 返信ありがとうございます。 つまり、「有意でないからと言って、その変数は採用しない方が良いとは言えない」ということですね。 確かに説明変数間に多重共線性が起こっている場合、採用する説明変数によって回帰係数が不安定になるので、おっしゃるようにp値の信頼性が低下するということですね。
>>472 2の方ですが、実感では取り除けることもあります。
ただもちろん取り除けないこともあるので多重共線性を取り除く方法として
使えるわけではありません。
このあたりを明確に書いた書籍は知りません。
477 :
132人目の素数さん :2011/10/03(月) 23:05:22.86
>>476 ご回答ありがとうございます。
そうですね。
わたくしの理解では「取り除くこと『も』」できるという程度で、
多重共線性が起こっていることを見つける方法は
いくつか提唱されていますね。
>>472 そもそも重回帰分析を行うということは、複数の変数のセットで
説明ができるかを考えているので、その場合は個々の変数の有意性
には意味がない。
変数の組み合わせにおり、ここの変数が有意かどうかは変化してしまう。
重回帰では、ある変数を追加したり、減らしたりすることで、変数の
セットとしての説明力がどうなるのかが重要で。
変数を単に増やせばそれは見せかけ上の説明力が高くなってしまう。
そこで、変数のセットの説明力を比較する指標が必要になる。
とはいえ、被説明変数に対する影響が統計的に誤差の範囲と扱われて
しまうような説明変数の集まりでは説明に困るので、主たる説明変数は
それなりに有意な方が話がしやすいね。
479 :
132人目の素数さん :2011/10/05(水) 12:06:35.51
>>478 これまでにいただいた回答も含めて考えてみると、
どうもまだ体系的に理解できていなかったことに気づきました。
疑問だった点がスッキリしました。
本当に感謝します。ありがとうございました。
このスレはテーマが実務に近いから基地外が集まらないな。
キチガイコレクターに用はありません。お帰りください。
482 :
132人目の素数さん :2011/10/12(水) 13:41:27.70
FAQっぽくて恐縮ですが、 対応のない2種のt検定(分散が違うのでWelchの方法)で、「平均に差がない」帰無仮説ではなく、 「平均の差が○○以下」という帰無仮説を棄却したい(=p<0.05で平均が○○以上差があることを示したい)のですが、 どうすればいいのでしょうか? Excelでできるみたいなのですが、そうではなく、アルゴリズムも知りたいです(自分で実装するため)。
483 :
132人目の素数さん :2011/10/13(木) 12:12:18.29
時系列順に65234,65219,65109,68749,63411というデータがあります。 5つめがこれまでの4つに比べて減ったかどうかを仮説検定するには、どう計算すればよいでしょうか。 おそらく母集団が何にしたがっているのかもわからない状態です。(こういうときにとりあえず正規分布を仮定してもいいのでしょうか) ウェブ上のこのページの通りにやればできるよというようなお答えでも結構です。どうかヒントだけでもお教え下さい。
484 :
132人目の素数さん :2011/10/13(木) 19:47:50.32
このスレ、むずい質問多いッスね。
485 :
132人目の素数さん :2011/10/13(木) 20:53:03.22
>482 一方の全てのデータから○○を引いて、 「平均に差がない」のt検定(片側)をしなさい。
488 :
学生 :2011/10/13(木) 22:40:55.06
統計学と製薬会社に関係があると聞いたのですが、 具体的にどのようなところで使われているんですか? あと、品質管理と統計学にも関係があると聞いたのですが、 どこで使われていますか?
ある製薬会社である病気に効果が期待できる投薬を開発した。 その病気をもつ患者300人を100人ずつの3つグループA、B、Cに分け、 Aグループには新薬の実験に参加協力の了解を得た上で新薬を投薬 Bグループには新薬の実験に参加協力の了解を得た上でブドウ糖を投薬 Cグループには何もしない という状況で経過を見た。結果、Aグループは55人が回復、Bグループは50人が回復、 Cグループは45人が回復した。さて、この新薬は効果があったのだろうか? このような事をきちんと判断できる数学的能力が不可欠。
>>488 品質管理を書いておくと
例えば、原材料を購入したとしてそれが必要な品質を満たしているかは
確認しないといけない。
その際、全て調べるわけにはいかないので、抜き取りで検査をする。
どれくらい調べればいいかを決めないといけないので統計学を使う。
後は、製品(薬)を作る時に、機械で自動で作っているとする。
でも、作っているうちに、機械がずれてきて、製品の精度(薬の
内容物の量)などがおかしくなってくる。
そこでできた薬を定期的に調べて、機械の調子を調べるんだけど、
機械をきちんと調整してあっても少しはずれるので、どれくらい
ずれたら機械がずれたと判断して再調整するかを考えないといけない。
こういうのでも統計学を使う。
>>482 Welchの t値の式の分子を
A = |(xの標本平均-μx) - (yの標本平均-μy)|=|xの標本平均-yの標本平均-(μx-μy)|
として、仮説:|μx-μy|<ε の範囲で最小になる A を使えば良いんでない?
分母や自由度は同じ。つまり一番判別しにくい仮説値で検定。
しかし信用されるには、どっかの本か論文に出てる必要があるね。
>>483 それだけしかデータが無い場合、統計学的には何も言えないと思うよ。
>>487 どんな分布かわからないから
だろうね。
493 :
132人目の素数さん :2011/10/14(金) 10:33:37.84
>491 なんでやねん。 データから定数を引いても、分散構造は全て維持されるので、 485の方法で十分。
494 :
482 :2011/10/14(金) 15:41:09.10
引き算する値(kとします。)を変えていくとpの値 (今はとりあえずExcelのttestを使っています。ttest(***,***,1,3)という形式で)が 変わっていきますよね。 そのときに最大のpを与えるkが2群の最も確からしい平均値の差と言って良いのでしょうか?
495 :
132人目の素数さん :2011/10/14(金) 15:47:51.15
>494 推定したいのか、検定したいのか、どっちやねん。 kが決まっているならt検定 kを求めたいなら推定。(不偏推定量は単に平均値の差だ)
496 :
482 :2011/10/14(金) 16:37:33.88
もっとも確からしいk(平均値の差)を求めたいんです。検定と推定で混乱しています...。 まだ、何が分からないのか分からない段階です。
497 :
132人目の素数さん :2011/10/14(金) 17:02:12.59
kは点推定でいいのか、区間推計したいのか、どっち?
498 :
132人目の素数さん :2011/10/15(土) 01:19:33.35
区間推計の幅の中央が点推定と一致するのでしょうか? だったらとりあえず区間推計します。 点推定だけでも良いです。
一致するよ。点推定値±t値×標準偏差 の形になるから。 また自由度が25以上ならt値は正規分布値とほぼ同じだから、 正規分布値を使えばデータ自体は正規分布に従う必要がない(大標本法)。
500 :
499 :2011/10/15(土) 19:23:12.12
この場合は、正規分布値→標準正規分布の臨界値、ね。 あと細かくは、 t値→t分布の臨界値、標準偏差→推定量の標準偏差(標準誤差とも言う)。
501 :
132人目の素数さん :2011/10/17(月) 16:12:26.55
会社の中で、売り上げなどをSPSSを使って実際に分析し経営などを考えてる人はいるんですか? というのも、大学で今は心理学の統計分析のためにSPSSを習っていますが、普通の企業に就職した場合 このSPSSを使えるという能力は役に立つような場面はあるのかと思いました。
503 :
132人目の素数さん :2011/10/17(月) 19:36:29.65
>501 いない。 世間知らずもいいところ。
504 :
132人目の素数さん :2011/10/17(月) 20:32:50.43
>>501 すでに
>>503 が回答しているが、全くそのとおり。
世間では、まず統計学というものを知らない。
知らないから何に役に立つのかもわからない。
占いと同程度だと思われている。
Statistical Package for the Social Sciences 猫
>>501 503,504が回答しているが俺も一言。
仮に、価値のある意味合いを導き出せ、(SPSSでも何でもよいが)統計的に分析してこんなことが分かりました、
だから、こうしたほうがよいですってアクションにつながることを言えたとしても、
説明する相手(例えば、経営層や上級管理職)が統計学の素養を持っていなければ、納得してもらえない。
そして、そのような素養を持っている人は極めて少ない。
主張に対する根拠を補強する、箔をつける、という補助的な意味合いで、統計分析の結果をビジネスに
利用することはあるかもしれないが、主役にはなり得ない。
知らない人から見れば、統計学はうさんくさく、占いよりも役に立たない。
まぁ学生は世間知らずでいいんだけどね。
大人気ない社会人が多いなwww
>>501 社会に出てすらこの程度だ気にすんな。
ただ言ってることは正しいけどな。
社会なんかに出なくても、文系学部の大半はそんなもんだよ、学生も、先生も。
510 :
132人目の素数さん :2011/10/18(火) 02:23:25.10
文系、理系、違いは感じないけどな。 個人の能力差のほうがよほど大きい。
511 :
132人目の素数さん :2011/10/18(火) 03:53:43.59
猫は?
何か用事ですかね? 猫
513 :
132人目の素数さん :2011/10/18(火) 08:02:59.39
514 :
132人目の素数さん :2011/10/18(火) 08:06:24.58
>>512 欧州大手の銀行破綻だが、
これでEUはギリシャを見捨てるだろうか?
何れにしても今まで経験した事がない規模での
世界大恐慌のフラグが立ったな。
日本はどうなることやら。。。
>>514 ギリシャからアイルランド、スペイン、ポルトガル、イタリアと来た経
済危機ですが、ギリシャがデフォルトになったら(EUとして)困るのは
当たり前ですからね。だから酷い事になる前にDEXIAを管理破綻させたと
いう考え方ではないですかね。でもコレで済むかどうかは判りませんね。
どうもこのままではギリシャ自身を管理破綻させた上で、他にも関連の
国債(特にギリシャのヤツとイタリアのヤツ)を保有している銀行を守
るという考え方なんですかね。
極めて危険な状態に突入しつつある感じですね。ちゃんとフランスが持
ちこたえてくれるかどうか心配です。
猫
>>510 理系で、統計がわからないかつその結果を信じないてのが、そんなに(文系ほどに)いる?
517 :
132人目の素数さん :2011/10/18(火) 10:29:50.48
>501 の世間知らずなところは、「経営に役立てる」という部分。 経営ってそういうものじゃない。生き残るのに精一杯。 かといって統計が社会で使われていない、ということではない。 専門的、研究的な部分では重要。 例えば、製薬での疫学、小売りのマーケティング、金融のリスク管理、コンサルタントの調査など。 統計で食っていくためには、「統計+専門分野」が必須である。 統計だけの職業はあり得ない。
>>517 > 経営ってそういうものじゃない。生き残るのに精一杯。
役立てるのと生き残るのは反しないと思うが
誰かを論破してやりたい気持ちが逸っちゃったんでそ 親切にも統計が役立つ例を挙げてくれてるけど
520 :
132人目の素数さん :2011/10/18(火) 13:23:51.39
>役立てるのと生き残るのは反しないと思うが 反するよ。社会に出ればよくわかる。 在庫管理みたいないかにも統計的な問題でも、 当用仕入れで処理している会社がが99.9%だ。 馬鹿だからそうしているのではなく、現場の猥雑さを体験すれば、 誰でもそうなる。
「統計を役立ている会社は 生き残れない」 この命題が真のときに「反する」と言うんだと思うんだが 現場では違うのか?
>>521 520が言いたいのはそういうことではなく
現場では少数の例外は無視していいということになっている
ということだろ。
ほとんどすべての実数はx^2=4の解ではないので解なしってことで良いですか?
在庫管理て、統計的な問題なの? 生産計画でなくて?
季節要因とか過去データに基づいて在庫調整するってのはあるよね
A:統計を会社経営に役立てる
B:会社が生き残る
>>520 の話は
「AとBは 背反 」 ではなくて 「AはBの必要条件でない」 だ。
統計の前に 数学適論理の基本をやり直したほうがイイ。
>>525 その在庫調整って、仕入れや販売や生産の計画でするんでないの?
それが在庫管理なのか生産仕入計画なのかは言葉の問題だが、 いかにもというほど統計的なものではないな。
論理もそうだが、『社会に出たら』とか書いてるあたりでただのしったかとしか思えん。個人的にはだけど。
説明できないバカに限って社会に出たら分かるとか言っちゃう法則
べつに限ったわけじゃないのに 限ってを慣用句として使っちゃう法則
かと言って「社会に出たら」とか言い出しちゃうやつが馬鹿であることには疑いを挟む気にならない。
じゃぁ会社に入ったらていう
そもそも質問者の501はまだ大学生でしょ? 学生相手に世間知らず(キリッ とか痛すぎる
>>532 おれは「社会に出たら」とセットで述べられるものを聞いてからでないと判断できないと思うよ。
>>535 まぁそうだけどね。
件の内容はそうではないと考えるからだけどね。
社会人10年以上やっててそんなこと言うのは社会人なりたてか、使えないやつくらいだし。
>>523 他の書き込み読まないで考えた
その方程式は解が厳密に決まりすぎておかしい
どこかに落とし穴があるに違いないから解なしってことで良いです
>>537 x-5>0 これも大半の実数は解にならないので、解なし?
>>538 それは「大半の実数は解にならない」といえるのか?
負の実数 → × 0 → × 5以下の正の実数 → × 5を超える正の実数 → ○ 負の実数 だけで実数のほぼ半分なので 実数の半分以上は×と言うのは乱暴だろうか?
541 :
132人目の素数さん :2011/10/19(水) 11:32:17.74
>>501 ツールはSPSSでも何でもいいけども、経験や勘「だけ」を頼りに意思決定をするのに比べれば、
「もしこれまでのデータから何か規則性や法則性があるのならば」
その傾向を統計解析などを利用して把握するということに意義はあります。
絶対にないとは言い切れませんし、役に立たないとも言い切れません。
また役に立つ「場合もある」とは言えるのです。
マーケティングや工業分野などではSPSSやS-PLUSなどの統計解析ソフトのほか、
データマイニングソフト(Visual Mining StudioとかSPSS Modeler)を
日常の実務で利用している会社はあります。
また書店ではビジネスパーソンを対象にした
データ分析・統計解析関連の本も発売されています。
542 :
132人目の素数さん :2011/10/19(水) 16:44:06.75
543 :
132人目の素数さん :2011/10/19(水) 19:40:22.80
>>542 向こうのスレを読んだ感じ気をつけないといけないのは、
>>356 が書いてる玄海の人口の問題。
確率が低かったとしても、全く癌になる人が出ないってのはまれ。
全国平均が0.005%だとして、玄海の人口が6400人だとすると、玄海で10万人中35人にあたる2人が癌になる確認を求めると
6400!/(2!(6400-2)!)*0.00005^2*(1-0.00005)^(6400-2)=0.0371
つまり3.7%。
なので、5%水準だと有意に違うけど、1%水準だと違うとは言えない。
これはちょうど2人の確率なので、2人以上だと4.1%になる。
まあ、調査をしてみてもいいかもしれないって感じかな。
544 :
132人目の素数さん :2011/10/19(水) 19:43:23.56
12月14日は防災に注意だ!
x-5>0はむしろ解あり。 x=4.9999ぐらいでも解。
>>545 過半数が解ではないなら多数決で解なしでいいじゃないか
統計学のスレなんだから 多数決っていうより誤差を味わいたいんだよ。 政治系の板だったら過半数ゴリ押しはとっても楽しいと思う。
利根川進 MIT教授、RIKEN-MIT神経科学研究センタ所長、ハワードヒューズ医学研究所研究員、 (ノーベル生理学医学賞を受賞) 「うん、それは一つのきっかけがあってね。 あの[京都大学の経済]研究所に浅田彰という男がいた。 これがものすごく頭のいい男でね。ぼくがこれまで出会った人間のうちで一番頭がいい男でね。とにかく何でも知っている。 数学がものすごくできて、文学にも明るかった。基礎教養だけじゃなくて、およそ何でも知っている。 政治学・社会学・歴史学・文化人類学・金融工学・精神分析・記号論・哲学・美学・音楽・絵画・舞踊・オペラ・ 心理学・建築・現代数学(純粋数学)・理論物理学・コンピューター・医学・薬理学まで知っていた。 もともと佐和隆光の弟子なんだけど、特別研究員を7年間もやって、そのころから天下に鬼才として名の知れわたっていたというような人なの。 本人も、体育科(運動神経)のこと以外なら何でもアドバイスしてやれるから何でもきいてくれというくらい幅が広かった。 だからもちろん、経済学もよく知っていた。あの[経済]研究所で彼が経済学がわかる人だったもんで、ぼくとすごくいい友達になったんです」
549 :
132人目の素数さん :2011/10/20(木) 15:43:49.13
>>543 さん。玄海原発スレに出向いて説明して頂き、ありがとうございました。
日本は危険な国だから二度と来ちゃいけないと「英語」で世界中に伝えるべき
551 :
132人目の素数さん :2011/10/27(木) 00:40:04.33
・ある母集団から無作為抽出された標本サイズ400の標本があり、その標本平均が1。母分散が100.このときの母平均が2である確率はいくらか? ・ある母集団から無作為抽出された標本サイズ25の標本があり、この標本の不偏標本分散が15である時、母分散が10以下である確率は5%よりも高いか低いか? 教えてー
552 :
132人目の素数さん :2011/10/27(木) 00:41:20.79
原発はもうやめて欲しい。 住めない土地が拡散。。。
553 :
132人目の素数さん :2011/10/27(木) 04:31:35.41
原発は安全です! 決して事故は発生しません! と言い続けてきた人々はどこにいったの? 責任とらないの?
>>553 但し『そういう人を叩く事しか認めない』という考え方も危険。
猫
555 :
132人目の素数さん :2011/10/27(木) 04:38:24.04
まあ、御用学者のせいで 国民が科学を信用しなくなったのは事実。 全て人間が悪いんだけどね。
556 :
132人目の素数さん :2011/10/27(木) 04:50:37.04
>>555 科学より、御用学者のほうが信用できる
と判断しているのだから、国民の責任。
>>557 現段階の科学は、まだ自然界のものではなくて、人間の脳内のものでしかないから、仕方がないorz
>>557 >科学より
その場合の科学(特に議論のあるもの)っていうのが人間からから独立
してアクセスできるものならそう言えるけど、実際は誰かの口や論文を
通してしか接することが出来ないじゃないですか。
おかしいなー。 変な人たちがわざわざきてる。w
>>558 現段階の科学は、まだ自然界のものではなくて、人間の脳内のものでしかない
↓(ならば)↓
科学より、御用学者のほうが信用できる
という主張なのか?
>>559 たくさんの人の言う、科学として正しいと信じられているもの
よりも 御用学者個人のほう正しいと信じるのは
その話とは関係ないでしょう。
たとえば、学者が自分の立場や利益のために嘘をつく確率を考えても
立場の違う学者何人もの意見の総合(たとえば共通部分)と、
御用学者1人の意見とではどちらが信用に値するかくらいは
統計的にも言えるでしょう。
原子力関連学者は、日本の原発はほぼ安全だと言ってたし、 他の学者も、安全なんじゃないって言ってた。 そもそも現代社会で、御用か非御用の区別って、簡単にできるのかなー それに、完全な非御用学者なんて、どれ位いるのだろー 完全な非御用学者がいても、外に発信される時は湾曲されてそうだし。 むずかしいなー あと、本当に自然界に法則なんてあるのかなー 絶対に例外のない法則って、一つ位発見されたの? 俺、学問好き。科学も嫌いじゃない。 でも、勘違いしてる学者や学者崩れ多すぎて、不快感を感じるのも事実。
後半関係ないし、 多数の意見の共通部分を取り入れることの意義がわかっていないとしか思えない
少なくとも 生活空間にある放射能をもつ物質が健康に与える被害に関する なにか新しい発見があったわけでもないのに これまでは危険なので専門家が管理せねばならないと法律でされていたものを 特に対策もせずにほおっておいても安全だと言い出すような学者は 信用出来ないでしょうね。
>>564 すいません。
僕、趣味としてしか(独学で始めたばかりで)、難しいことは分からないんですけど、
多数の意見の共通部分を取り入れる、
とはどうゆう意味で、
その意義についても、教えてくれませんか?
素直に教えて欲しいだけで、悪意や多意はありません。
趣味として学問始めたばかりなのに、勘違いした学者とかどんだけ傲慢なんだ。 結果としてその学者が誤っているとしても趣味程度に始めた学問で専門家と呼ばれる人間を勘違いとかいうのは、 それこそ当人の勘違いも甚だしい。
でたw 勘違いww
>>567 566と563は同一人物だと仮定しているのか?
>>488 製薬会社と品質管理に関心があるというのは、専門課程前の薬学部生なのですかね?
製薬業特有の統計学用途は、新薬の薬効評価時の統計的検定でしょうね。
新薬実験データから薬効有無を証明する手法としての役割ですね。
品質管理への応用は、統計的品質管理(SQC)として応用統計学の1分野を
占めています。品質管理が必要とされる製造業では、どの企業でも利用されていますね。
数千個とかの量産品の品質を全数検査するのには多大な時間を要するので、少数の代表品を
検査して全数の品質合否を推測するのに統計学を使うわけです。
>>551 >このときの母平均が2である確率は・・・・・
母集団が正規分布と仮定して、2以上の確率なら算出できるが、ぴったり2.0で
ある確率は0ですね。
X軸対数でヒストグラムを描きたいのですが このときビンのサイズは、リニア軸で等間隔にするのか、Log軸で等間隔にするのか どちらがよいのでしょう?
対数を取る以上、対数軸で等間隔じゃね?
それぞれ別の指標をZ得点(いわゆる偏差値)で標準化してそれらを平均して一つの指標を作ろうと 思っているのですが、これで出てくる指標って意味のある数字になりますかね? またその際の平均は加重平均でいくつかの指標に重みをつけたいと思っているのですが その際の重みの目安などはありますか? かなり抽象的な質問になってしまい申し訳ありませんが、特に前者の質問よろしくお願いします
>>574 前者:なるっしょ。
ただし、ものによりけり。数学の成績・英語の成績・体重の3つでやっても「意味」はないっしょ。
しかし、数学・英語・国語なら意味はあるっしょ。
あと、他の指標とは異なる分布の指標が入るとまずいとか。
後者:主成分分析なんかでどうすか。
つか、最初の「別の指標」を主成分分析して主成分得点を使うってのはいかが?
数学・英語・国語をz化してから主成分分析しても、
素点で主成分分析しても結果は同じ(相関係数行列から出発するやり方なら)のはず。
平均や分散が大きく異ならなければ、単純な足し算が一番手軽だとは思うけど、
それを受け取った人が「もっとそれらしい数字を出せ」とか言ってくるのが難。
577 :
132人目の素数さん :2011/11/12(土) 22:59:53.91
都道府県別幸福度ランキングなるものが発表されたのですが、 犯罪、持ち家、貯蓄とか比較してるらしいですが、指標としてバラバラで無意味な気がします。 統計学的にどのような意味があるのでしょうか。
>>576 ありがとうございます。
各指標自体は度数分布でだいたい同じ曲線の分布になっているので大丈夫そうです。
主成分分析いいかもしれないですね。ただ新しく作った指標をあらたに重回帰等の回帰分析の
従属変数に使う際に主成分得点で出した係数だと説明力が弱くなってしまうのが懸念されます。
>.平均や分散が大きく異ならなければ、単純な足し算が一番手軽だとは思うけど、
それを受け取った人が「もっとそれらしい数字を出せ」とか言ってくるのが難。
まさにこれで学生としてはつらいところです。
>>577 いろいろな社会統計指標を合成して合成変数をつくるのは社会科学の統計分野ではよくあることですが、
基本的にはそうして作った指標を独立変数として組み込みますが、
結局それを従属変数(つまりY)にもってくるのはあまりよくないですよね。
580 :
132人目の素数さん :2011/11/12(土) 23:16:35.33
m
581 :
132人目の素数さん :2011/11/12(土) 23:33:14.99
582 :
132人目の素数さん :2011/11/13(日) 01:20:57.80
>>577 個人的には単純に所得のみを比較したほうが幸福度を
表現しているような気がします。
しかし、何を幸福とするかは個人によって異なるので、
そのような意味を付加した結果の解釈は統計学の範疇にはいりません。
文化論とかそういう学問になりますね。
統計学とは関係ないような気がします。
統計学はあくまで分析手法に理論的な裏付けを与えることを
目的としている学問ですから、その結果に意味を与えるのは、
分析者なんです。
ですから分析者によって結果が異なることはよくあることであり、
そのような分析者によって結果が異なる場合があるということは、
それが統計学の範疇を超えているという意味でもあります。
だから、それをこのスレで質問すること自体が意味ありません。
むしろ、文化論などのスレで質問する内容だと思います。
>>582 > 個人的には単純に所得のみを比較したほうが幸福度を
> 表現しているような気がします。
物価を考えずに?
続きは文化論で
>>583 都道府県レベルなら統計局に物価調査の統計データあるから使えばいいのにね。
>>582 > 個人によって異なるので、そのような意味を付加した結果の解釈は統計学の範疇にはいりません
統計学の範疇とは何のことを言っているのかよくわからない。
数理統計学なんじゃね?
統計の各分野での応用は、それぞれの分野の問題なので 個人だなんだと言う前にすべて統計学の範疇外だな。
すみません。お伺いいたします。 a+b+c=1 になる数があって、a,b,cでそれぞれ分布関数を作っております。 aが大きければ、bが小さくなるということを検定したい場合は、t検定、カイ二乗検定 相関分析のうちどれを用いたらよいでしょうか。
590 :
132人目の素数さん :2011/11/16(水) 11:26:30.06
>589 cは関係ないだろう。 a,bの検定は相関検定。 フィッシャー逆変換で統計量を求める。
お伺いしたいことがあるのですがよろしいでしょうか? 学校での成績処理で素点、小問正答、領域等のデータから様々な切り口で数字を見たいと思っています。 そうするにあたって何か適当な書籍はご存知ないでしょうか? まだまだ始めようと思ったばかりで手付かずですので、入門的なものから応用的なものまで教えていただけると助かります。 ずいぶん昔ですが、学生の頃に鈴木先生、山田先生が書かれている数理統計学の本で勉強したことはあります。 よろしくお願いします。
592 :
132人目の素数さん :2011/11/16(水) 20:58:09.46
「推定量の分散が小さいほど『良い』」という考え方が今ひとつわかっていません。 「分散が小さいほど、真のパラメータ候補を絞り込める」的な解釈でよいんでしょうか?
それでいいんじゃね。
594 :
589 :2011/11/17(木) 00:34:43.04
595 :
132人目の素数さん :2011/11/17(木) 20:36:28.62
経済学部1年、数IIIC未習 統計学の本は何がいいのか?
授業で教科書指定はないのか?
>>595 授業の教科書があるならまずそれを読め。
それがない、またはわからないなら
ビジネスマン向けのエクセルを使う統計入門のような本がいくつか出ているので
そういうのを読んでみる。 実戦向けなので、理論は二の次になるけど、そのぶんわかりやすい。
598 :
132人目の素数さん :2011/11/18(金) 14:29:46.96
電波テロ装置の戦争(始) エンジニアと参加願います公安はサリンオウム信者の子供を40歳まで社会から隔離している オウム信者が地方で現在も潜伏している それは新興宗教を配下としている公安の仕事だ 発案で盗聴器を開発したら霊魂が寄って呼ぶ来た <電波憑依> スピリチャル全否定なら江原三輪氏、高橋佳子大川隆法氏は、幻聴で強制入院矛盾する日本宗教と精神科 <コードレス盗聴> 2004既に国民20%被害250〜700台数中国工作員3〜7000万円2005ソウルコピー2010ソウルイン医者アカギ絡む<盗聴証拠> 今年5月に日本の警視庁防課は被害者SDカード15分を保持した有る国民に出せ!!<創価幹部> キタオカ1962年東北生は二十代で2人の女性をレイプ殺害して入信した創価本尊はこれだけで潰せる<<<韓国工作員鸛<<<創価公明党 <テロ装置>>東芝部品)>>ヤクザ<宗教<同和<<公安<<魂複<<官憲>日本終Googl検索
599 :
132人目の素数さん :2011/11/18(金) 16:23:18.40
魂は幾何学 誰か(アメリカ)気づいた ソウルコピー機器 テロ装置の再読願います
600 :
132人目の素数さん :2011/11/18(金) 19:31:25.03
統計学を学んだ事の無い者ですが、今ある検索エンジンを作っています。 20件みつけたら検索を終えるのですが、 データベース全体の10%から20件が見つかったとすれば、 全部探した場合に200件みつかると推測できますが この200という数字にどれぐらい誤差が出るかは検索した割合10%に依存しますよね。 何%まで誤差が出るかを計算する式などはあるのでしょうか? 参考にすべきURLや検索すべきキーワードがあれば教えて下さい。
雑には二項分布、正確には超幾何分布だな。
602 :
132人目の素数さん :2011/11/19(土) 18:42:44.37
統計学の本を読んでいるんですが質問させてください 統計量Tについてなんですけど T=[(xバー - μ)√(n-1)]/s と T=[(Xバー - μ)√n]/s の二種類の定義があるような気がしたのですが これはどう考えたらいいのでしょうか? 私が間違っていますか?
603 :
132人目の素数さん :2011/11/19(土) 23:55:44.45
sが母標準偏差か標本標準偏差かによって変わってくる その本をよくよんでみ
604 :
602 :2011/11/20(日) 02:17:07.09
いや、どちらもsは標本標準偏差です 鳥居泰彦「はじめての統計学」には後者の式が書いてあって z=(xバー - μ)/[σ/√(n)] の母標準偏差σを標本標準偏差sに置き換えたtは自由度n-1のt分布をする とあります そういう理解でいいのでしょうか?
605 :
132人目の素数さん :2011/11/20(日) 03:24:38.38
定義というのは統計学では 共通の約束事ではなくて、この本ではこう定義します、 という意味ですから、すきかってにいろんな定義が 出てきます。 だから、まあ気にしないことです。
>>602 なんか適当な回答をしてる人がいるけと、前者はないよ。
その式にでてくる、s/√nってのは、標本の分散は母分散をサンプルサイズのnで割ったものになり、標準偏差はそのルートになるってこと。
標本の標準偏差はσ/√nってのをやってるでしょ。
これは、母分散を標本から計算される不偏分散に置き換えても変わらないので、s/√nになる。
分散の方は母分散がわかっていない時は、n-1で割り不偏分散のs^2を求める。
不偏分散の計算には、n-1が出てくるけど、これを標本の分散にする時は、nで割ればいい。
結果として、以下の母分散が分かってる時の正規分布の時の式のσをsに置き換えて、自由度n-1のt検定になる。
z=(xバー - μ)/[σ/√(n)]
607 :
602 :2011/11/20(日) 07:36:59.12
>>606 ご丁寧にありがございます
小島寛之「完全独習統計学」には不偏分散が出てこず、sの定義で混乱しています
要するに同じ「標本分散」s^2という記述があってもそれは
偏差平方和/n のこともあれば
偏差平方和/(n-1) のこともある
ということなのかな
とにかく本を読み進めてみます
>>607 標本分散には、普通の人が使うnで割る分散と、母分散により近くなると
統計学的に確かめられているn-1で割る不偏分散があります。
で、普通はt検定(これから出てくるカイ2乗検定、F検定)とかの話を
するならば、分散の推定量は「自由度(nじゃなくてn-1を使う理由)」
を考えた不偏分散です。
逆いえば、母分散の推定量を自由度を考えないnで割った単なる分散で
間に合わせているのに、自由度が絡むt分布を説明するのは整合性が取れ
てません。
でもって、例えば区間推定で(以下のxはxバーのことね)
母分散がわかっている場合、x-m*[σ/√(n)]≦μ≦x+m*[σ/√(n)]
母分散がわかっていない場合、x-t*[s/√(n)]≦μ≦x+t*[s/√(n)]
に出てくるnは、母分散σ^2もしくはその推定量のs^2に対して、サンプル
から計算されたxの平均の分散はnで割ったものになるというのを使って、
ルートして標準偏差(σ/√(n)とかs/√(n))を求めてるので、そのまま
サンプル数のnを使えばOK。
つまり、標本からの(不偏)分散を計算するときに考えたn-1と検定とか区間推定
の式の所で出てくるnは考え方が違うんだけど、ここを混同してるんだと思うよ。
> 602 T=[(xバー - μ)√(n-1)]/s と T=[(Xバー - μ)√n]/s とではsの定義が異なるだけでは? 上は s^2 = 偏差平方和/n で下が s^2 = 偏差平方和/(n-1) で標本分散が定義されていれば、どちらもT値は同じ。
小島寛之の本は詐欺本。 『数学を日常生活に生かす確率的発想法』って本を買ったが、日常生活で生かす内容が全く出てこない。 まじ騙された。
日常生活が狭い範囲の世界のひとには数学を生活に活かすことは難しい。
>>609 そういうことのようです
お騒がせしました
人によって記号や用語の使い方に幅があるので、いろいろな本のつまみ食いはだめですね
そういう記号は通常それぞれの本で定義されている。 そこを読んだほうがいい。
>>608 >母分散により近くなると
>統計学的に確かめられているn-1で割る不偏分散があり・・・・・・
この表現を応用統計社内教育でも見たんだが、nでなくn-1で割った方が
母分散により近いというのを、どのように確かめたの?
その際のnって、どのくらい?1億?1兆?1京?
>>614 そういう確かめ方ではなく、分散の期待値の計算をすると出てくる。
ちょっと数式の多い(数理)統計学のテキストをみると、ネットでググっても
見つかると思うよ。
616 :
132人目の素数さん :2011/11/26(土) 14:00:52.11
614 意味があるnはだいたい30以下だよ
617 :
132人目の素数さん :2011/11/26(土) 17:55:39.66
>>610 本のタイトルなんて売るための目的で付けられる。
いわゆる「企画本」はタイトルだけで内容がない本が多いよ。
書店で手にとって内容を確認して買うようにしないとね!
統計のスレだから書いておくと、
「ベイズな予測―ヒット率高める主観的確率論の話 」
宮谷 隆 (著), 岡嶋 裕史 (著)
という本など、近年まれにみるクソ本だ。内容はまったくなし。
著者の「宮谷隆」,「 岡嶋裕史」というのは相当な馬鹿というか
低能な奴らで、ベイズ統計を全く知らないんだ。
適当にウソを馬鹿のようにちょこっと書いておわり。図書館で見てまじ驚愕した。
あと、もう一冊あげておくと、
「金融工学の悪魔―騙されないためのデリバティブとポートフォリオの理論・入門 」
吉本 佳生 (著)
という本もあまりのクソ本でまじびびった。
「金融時系列は正規分布するらしい!けど実際はちがうんだぜ!」
という1行で済むことを一冊の本にした、歴史に残るクソ本。
しかも、アマゾンID複数から絶賛のコメント書きまくり。
吉本 佳生には即死んで欲しい。
などなど、企画本は腐るほどあるので、気をつけたほうがいいです。
どんな歴史だよww
統計を独学したいです。 なお高校数学B、数学Cなどにある基礎的な統計については学習しています。 その高校数学以上で次にどういったもの本を読めば いいかお勧めありましたら教えていただけますか? ゆくゆくは、ベイズやRについて理解したいですが、 まだそこまではって感じです。 欲をいいますと、高校の数学教科書のように体系つけられているもの。 またこれとは別に、エクセルで学べる補助的な本があれば知りたいです。
>>620 要するに開票するまでもなかったってことですね。
出口調査から予測する→サンプルサイズによって、誤差がほぼわかる。→その誤差以上の差がついていることがわかる。 →当選確実 こういうことだろ。
事実その通りの結果になったしな。 ただ過去に当選確実で外れたことはあるよ。 当選確実って100%ってことじゃないからな。
確率100%のときに外れる可能性はあるかないかという問題では、 可能性があるというのが数学だからな。
>>624 そういう話じゃないでしょ。
>>620 統計学がわかってたら、そういうコメントにはならない。
TVの説明でも「事前の情報から当選の可能性が高いということであって
違う場合もあります」って説明してた。
そういう説明をするなら、「確実」って言葉を使うなとは思う。w
正しいサイコロの目が1を出す確率は1/6であることは100%確実である
これは国家メディアの統計学の乱用。 開票開始0分、開票0%で当選確実とNHKが報道するのは捏造報道以外のなにものでもない。 NHKはこういう捏造報道の前科がたくさんある。 首相不信任案投票の直前に、首相が辞任とは一言も言っていないのに、辞任表明と報道したり、 新首相を決める民主代表選のときに、決選投票直前に馬渕が野田を支持という嘘を報道したり、 NHKは政治に介入するために積極的に捏造報道してるとしか思えない。
628 :
132人目の素数さん :2011/11/28(月) 16:28:36.08
有意水準とベイズの意味が分かっていない人が多いな…。 開票0%での当確(p値が有意水準以下)であっても、 一定の確率で結果が反転する。 統計学を学んだ人には、常識中の常識、であると思うのだが、。。。。。
629 :
619 :2011/11/28(月) 16:38:16.51
すいません。 オススメの本ありませをか? (-_-#)
>>627 その「当確を出す」という行為の根拠はどうやら『投票所での出口調査』
だそうですけどね。だからソコは然程の批判には値しないとは思います。
でも未確認情報の報道や虚偽報道は糾弾されるべきでしょうね。尤もコレ
はアメリカでもありますけど。
日本のマスコミは無茶苦茶ですから。
猫
631 :
132人目の素数さん :2011/11/28(月) 17:14:21.23
@選挙日前の事前調査で事前分布を得る A出口調査の結果で、事前分布をベイズ更新 B開票途中データで、さらに事前分布を更新 C予想当選確率が閾値を超えた時点で当確 テレビ局による違いは、利用している 事前調査の分布 出口調査データ 閾値(有意水準) が違うことによって起こる。 機械的なことなので、誰が悪いとかはない。 強いていえば、「当選確実」ということばが不適切。
632 :
132人目の素数さん :2011/11/28(月) 17:16:33.42
当確が外れることを「悪」だというのならば、 有意水準を厳しくすればいいだけだが、 そんな選挙報道を国民が望んでいるかどうかだな。
ではどういう言葉が適切かと? 猫
634 :
132人目の素数さん :2011/11/28(月) 17:43:24.35
当選ほぼ確実 では駄目ですかね。
開票0分で速報出すということは、 はじめから0分に出すという恣意的な政治的意思がなければできない。 それを国民が望んでるって? そんなくだらないこと国民が望むものか。 当選確実速報は当選速報ではないのだ。
636 :
132人目の素数さん :2011/11/28(月) 17:52:16.14
選挙速報があろうとなかろうと、投票は全部開示するんだろ。 意図的に誤報を出すことにどんな意味があるんかね。 寧ろ誤報によって局の信頼性が只落ちるだけだと思うが。
>>634 その方が少しはマシですかね。ではNHKに進言してみてはどうでしょうか。
猫
99.5%の確率なら、 当選確実の200人の議員のうち一人がぬか喜びすることになるだろう。
>>636 NHKは、積極的に政治に介入してまで、保身したいということ。
今回は、利権を守るために自民と民主と共産と総連が手を組んだ。
統計学の悪用には目を光らせないとな。
640 :
132人目の素数さん :2011/11/28(月) 18:26:44.14
確実って確かで間違いないって意味だったので、当選確実って無理あるね。 せめて開票してから未開票分を反対票に足しても順位が変わらない時に当選確実って言葉を使うといいのに。
641 :
132人目の素数さん :2011/11/28(月) 18:29:51.15
誤報出すことが、政治に介入? 馬鹿なのか、想像力豊かなのか、どちらかだな。
>>640 ソレは確実ではなくて確定ですよね。
猫
643 :
132人目の素数さん :2011/11/28(月) 18:55:43.90
>640 そうですね。 確定はなんとなく、完了的なニュアンスあるけど。 確実というのは、今現在においては、というニュアンスがあるような気がしますね。
644 :
132人目の素数さん :2011/11/28(月) 19:00:58.59
そう思えば、確実でもいいのか。と思った(笑)。
>>636 自分も「速報」にまったく意味を感じませんね。速報するために投票用紙を開きやすい特別な
ものにするとか、人を多く投入するとか税金の無駄遣いと思う。
ただ今回は速報知りたがる人が大勢いた。 開票8時にアクセスが殺到してニュー速の2chサーバが落ちた。
647 :
132人目の素数さん :2011/11/28(月) 19:12:19.63
なんか、ぜんぜん統計がわかっていない人がひとり紛れてますね。 開票前であろうと、調査データをもとに事前分布を推計することはできます。 真のデータがないと、推計ができない、と思っているのでしょうか? 選挙とかNHKとか、そういう問題ではなく、 統計ではごく普通に使われている手法なんですが…。 何が「悪用」なのでしょうか? 事前分布を使うこと? 当確と確定を混同して報道すること?
648 :
132人目の素数さん :2011/11/28(月) 19:19:09.22
速報は、選挙民の為というより、マスコミ同士のスクープ力の競争なのかもね。 何処が一番速く当確を出せるか?みたいな。 もちろん、誤って出したら大幅減点。 マスコミ各社の情報収集力と、正解な判断力を問われる、もう一つの競争なのかもしれない。
649 :
132人目の素数さん :2011/11/28(月) 19:22:00.24
>647 そういう、話ではないと思う。 但し、スレ違いなのだが。
なんでもスレだからスレ違いではないんじゃない? しらんけど
653 :
132人目の素数さん :2011/11/28(月) 20:43:34.36
>何処が一番速く当確を出せるか?みたいな。 事前調査で当選が決まっているようなケースでは、 投票終了時となるので、競争はないでしょう。 投票終了前だと違反だ。 今回の大阪だと、ひょっとして、という人もいたかもしれないけど、 前回の東京都知事選など、投票終了直後・開票率0%で、石原当確に 誰も違和感は持たなかった。
>>635 > そんなくだらないこと国民が望むものか
そうか?
むしろ違和感があるのは、あれだけ批判されている石原他が選ばれることに違和感を持たいない有権者の方
656 :
132人目の素数さん :2011/11/28(月) 21:36:58.51
>>653 確かに、事前に判りきっているならばね、もちろん競争にはならないけど。
そうじゃないものも多くて、選挙は複数あるでしょ。
特に統一地方選挙とか、衆議院参議院同一選挙とか。
ある意味、日本全国お祭りで、マスコミ特にニュース部門にとってはビッグイベントだと思うのね。
当確っていうのは、ビッグイベントの中でもっても注目される場面。
ここに、マスコミが力入れない筈はないと思う。
統計で使う数式は同じでも、出口調査の標本の数とか、事前のリサーチとか、そんなこんなで、マスコミの情報収集力の差がでてくるわけで。
そう思えば、今回起きた日テレの投票終了前の当確テロップフライング事故みたいな事が起こっても不思議ないなぁ。
とまぁ。ぜんぶ想像ですがね。
星印を並べる→p値を明記する→信頼区間を計算する って具合に変わってきたわけだ。 だから、 当選確実→当選確率○%→得票何票(誤差±○票) って感じで書くようになるんじゃないの。 (本紙・本局調べの出口調査による)と書いておけば問題なかろう。
658 :
132人目の素数さん :2011/11/28(月) 21:54:22.35
選挙報道って不毛かと思ったけど、お祭りにする事で、いくらかの投票率をあげてるのかもね。 だって、こういう報道がなくなると、まったく無関心な人が増えるだろうし。 当確間違いも、ある意味面白い。
まあ「天気予報の降水確率」みたいなモンですかね。甲子園球場のお弁当 屋さんに取っては大事な情報なんでしょうけど。 猫
660 :
132人目の素数さん :2011/11/28(月) 22:18:44.42
そういえば降水確率は何を表してるんですかね。 50%あれば、雨が降らない日とかなかったよぅな気がするけど。 気のせいかしら。
>>660 そういうのは私みたいなド素人には極めて疑問に思える事柄なんですよ。
そもそもその数値はどういう方法で算出されるんですかね。加えてその
数値が正しいかどうかの精度はどう理解すればいいんですかね。
猫
662 :
132人目の素数さん :2011/11/28(月) 22:29:54.23
過去の天気予報の降水確率と、過去実際の天気データを比べてみたら面白いかもですね。
>>662 そういうデータはきっと気象庁が自分で持ってる筈ですよね。何故ならば
自分達の予報の正確さに関する問題なので。
猫
投票時間締め切り後に開票0%でどんな予想を出そうが、結果に影響はない。 統計学うんぬんの前に、開票率0%で統計学における批判ではないことで批判してるやつって、なぜ統計学を学んだりしてる能だろうか。 無駄でしかないのに。
>>660 気のせいです。
翌日予報ぐらいになると真面目に集計したら大体50%になります。
(一定時間内に1mm以上の雨が降った場合ね。)
>>665 なるほど。「何を以て雨が降ったと定義するのか」にも依存しますよね。
猫
>>604 みんな、統計学とは違う意味で批判してるだけだと思います。
あなたも少しズレてますね。
>>656 > 当確っていうのは、ビッグイベントの中でもっても注目される場面。
> ここに、マスコミが力入れない筈はないと思う。
そこが最も注目されるようにしているのはマスコミ自身ではないですかね。
本来、最も注目が行くものは当確ではなく当選でしょう。
669 :
132人目の素数さん :2011/11/29(火) 04:58:26.64
ほ!
降水確率もそうだが、個々の統計値がどういう定義をされてるかというのは重要。 例えば、大学の偏差値を勘違いしてるゆとりかあまりにも多いとか。 団塊Jr世代の受験戦争では、偏差値50以下の大学なんてほとんどなかったと言っても 全入世代のゆとりは偏差値なんだからあり得ない、 偏差値の意味を知らないアホとかいう頓珍漢なレスを返す。
なんだか思いついたことをそのままの順番で書き綴ったような文章だな
ゆとりは馬鹿だから仕方ない。
673 :
132人目の素数さん :2011/11/29(火) 11:58:03.49
>>668 早く結果を知りたい人が多数いる限り、報道の価値としては、当選の事実より、当確に重きを置くのは当然だと思います。
674 :
132人目の素数さん :2011/11/29(火) 12:15:56.47
団塊Jr.だが、偏差値50以下の大学がなかった、というのはない。 但し、底辺校と言われた学校の偏差値が異常に高くなっていたのは思い出す。 俺の通った、専修大学なんて、いまではFランクなんだろうな。(T_T)
専修大学出身のボクシング世界チャンピオンが生まれたんだ 喜べよ
いるな。大学の偏差値が大学の順位の偏差値と勘違いしてる奴。
大学の順位についてを偏差値にする? 何を言ってるか、意味不明。
678 :
132人目の素数さん :2011/11/29(火) 14:50:12.48
たぶん、大学の順位って北から本校がある大学を並べた順番のつもりだろう。
679 :
132人目の素数さん :2011/11/29(火) 14:55:36.61
ちょうど名古屋大学あたりがメディアンだろ。
普通に悪意なく、通訳すれば。 模試結果で表れる、大学と試験結果の偏差値対応表は、大学の価値・ブランドを示しているのではない。 と言いたかったはず。
大学の価値は数値化されているものなのですか?
数値化の一例:偏差値
いや、
>>677 が大学の順位とは何かを説明せねば、意味不明。
オマエラ、もういいだろ。許してやれや。
685 :
132人目の素数さん :2011/11/29(火) 15:23:22.66
順位についての偏差値なのだから、ど真ん中が標準値でありメディアンでもあり平均値でもある。 で各偏差は一つずつ+するか、−加えればいい。
なんだ? 統計学スレに、大学偏差値について、ウンチク語ろうとしたら。 返り討ちされたみたいな。感じ?
許してやれよ…
>>677 意味不明だろ?
ゆとりは順位から偏差値を計算できると勘違いしてる。
>>686 だれがいつ返り討ちにされたんだよ?w ゆとりか?w
ゆとりは馬鹿だから仕方がない。
昔は分数できない大学生が〜だったのに、今は四則演算できない大学生が〜だからな。 全入世代こえ〜
693 :
132人目の素数さん :2011/11/29(火) 18:26:59.55
今の人間て生きていて何が楽しいの?
>>693 ソレはどうやら「自分の目標を思いっきり低く設定するから」という様な
話だそうです。
猫
鬱になる人は目標が高いからって化猫が言ってた。
>>670 >偏差値50以下の大学なんてほとんどなかった
ってどういう意味?
>>696 極端に偏差値が悪すぎる大学が数校あって、
あと大多数は偏差値が50以上あったて事じゃない?
それか、
>>670 がゆとりかのどちらかだ。
まあ正規分布の形にはならんなあ。
偏差値も正規分布するのも、大学ではなくて、受験生がだろ。 大学の偏差値が50以下なのではなく 偏差値50以下の受験生が行ける大学が あんまりなかったってこと。 大学への進学率もだいぶ低かったし。
>>697 ゆとりはおまえみたいに勘違いしてることだよ。
おまえのように大学の偏差値の定義を知らず、妄想で論理展開する。
ゆとりもおまえと同じように言葉を定義せず、論理展開する非科学的思考がデフォになってる。
数学板の統計スレで、一般にいう「大学の偏差値」という統計値は、 偏差値ではなく、その大学に合格した学生の偏差値の平均値だということを知らない馬鹿っているんだな。 偏差値じゃないことは、まじめに統計学やってりゃすぐ気づくんだけど。 数学板住人がこんな簡単なひっかけに引っかかるとは恥ずかしいw
ゆとりは馬鹿だから仕方がない。
>>700 >合格した学生の偏差値の平均値
その偏差値ってどこから求めてるの
模試。だから大学の偏差値は、模試やってる予備校が発表するし、 予備校ごとに発表する大学の偏差値は違う。 受験生なら常識なんだけど、ここって大学生やら大卒っていないの?
705 :
132人目の素数さん :2011/11/30(水) 12:01:12.79
なんか、話題のレベルが下がってきたね。 >698 の >偏差値も正規分布するのも、大学ではなくて、受験生がだろ。 とか、勘弁してほしい。
学歴の話は荒れるな。
はげました。 ____ //~ ~\:\荒れるな。 もっと正確に書いて下さい。 | (●) (●) :| | ノ(_)ヽ ::| | `-=ニ=-′::|いけめんの男前だ。 \ `=′ ::/ /`ー――-´\
学歴が無意味だという事が誰も判ってない馬鹿な国。 猫
存在が無意味な猫
>>709 そんな事はちゃんと知ってます。ですが私が数学板から立ち去る事はアリマセン。
猫
>>697 これはひどい。頓珍漢なレスとはこのことだな。
大学の偏差値を偏差値と思ってるなんてほんとゆとりらしいや。
>>700 >その大学に合格した学生の偏差値の平均値だ
普通は、最低点というか、合格ラインなんじゃないの
平均じゃ大学選びの目安にしにくいじゃん。
たとえば、「偏差値55」という大学があったとしたら、合格ラインが55だというのなら53の受験生はもうちょいがんばろうと思うかもしれんが、
平均が55なら、さらにその標準偏差もわからないと自分は受かりそうかどうかわからんし、上に外れ値があったら平均値は代表値にはならんし。
ゆとりには合格者の偏差値の平均は目安にならないのか。 ┐(´д`)┌ ヤレヤレw
ちょっと話はズレるけど 何でもかんでも平均値を求めておけば(平均値さえ求めておけば)いいって風潮は気になる
>>714 こういうのが、「サラリーマンの平均年収は○万円」とか「平均貯蓄額が○百万円」なんて週刊誌のヨタ記事を見て冷や汗たらすんだろうなあ
気の毒に。
河合塾の場合「ボーダーラインは河合塾が予想する合否の可能性が50%に分かれるライン」
代ゼミの場合「各大学の2次試験(個別試験)の合格レベルの予想」(国公立2次について)
駿台の場合「駿台偏差値ランキング(合格目標ライン)」
>>713 の「最低点」というのも正しいとは言えないようだが、「平均」は明らかに違う。
どういう根拠で「平均」と結論づけられたのか、そちらこそ興味深い。
ゆとりは馬鹿だから仕方がない。
>>716 大学受験したことないの? いくらなんでもキミ無知杉。
なに?今度は平均値の意味が分からないゆとりが暴れてんの?
720 :
132人目の素数さん :2011/11/30(水) 23:51:07.91
>712 偏差値は正規分布にはならない。
>>713 偏差値を出してるとこによって多少は異なるが、6割合格の偏差値であることが多い
>>720 またわけの分からないことを言い出す奴が
統計学って、いろんなバックグラウンド持った人達(学力も様々)が勉強するせいか、 認識に齟齬が出やすいね
>>720 梯子が付いてるのも赤いのもパトカーでなくて消防車だろ
梯子は赤くない
↑今ここ
大手の全国模試データって生で見られる ところある?どれくらい歪んでるのかしら
生で見る、というのが何を指しているのかによる
729 :
132人目の素数さん :2011/12/01(木) 16:00:10.61
偏差値←標準化はしているが正規化はしていない。 標準化と正規化の違いが分からない人は退場
正規化って何? 色々な分野で別の意味持つんだけど
731 :
132人目の素数さん :2011/12/01(木) 17:20:16.20
標準化 1次モーメントと2次モーメントを規格化。 →偏差値の場合、1次モーメントが50、2次モーメントが(10)^2 正規化 3次以上の高次モーメントも規格化 →狭義には歪度を0、尖度を3(定義によっては1)にすること。 5次モーメント以上はあまり関心が持たれない。 偏差値は標準化の結果得られる数値なので、正規分布には従わない。
732 :
132人目の素数さん :2011/12/01(木) 17:22:03.66
↑ 注)一次元データの場合
世論調査みたいな感じで3800の調査で母集団2億の動向を探るって妥当? 調査対象が充分すぎるとか少なすぎるとかある?
十分過ぎる。3800人と100万人の誤差を比べれば分かること。 100万人調査することは無駄骨でしかない。
3800人と100万人の誤差って言われてもよくわからないんだけどね ラジオ聞いてたら3800の調査で2億の動向わかるのかよっていう感じのコメントしてる経済記者がいたからどうなのかなと思った
>>735 きちんとした調査なら3800人でも十分。
ただ、調査の仕方が悪くて聞く人が偏っていると、結果が信用できない。
例えば、電話で昼間に調査したら、答えるのは主婦ばかりになるとかね。
2億人全体のバランスと合うように、年齢階層とか収入の分布とかを作ったグループで
調査しないとだめ。
質問するグループをきちんと作ったとしても、みんなが答えてくれるわけじゃないので、
一部の人が関心があって答えたいような質問だと回答率が下がって結果も偏る。
きちんと抜き出すなら2000人もやれば十分なんだが 街頭調査や電話口調査ではとても偏りなく抜き出したとは言えない。 経済記者は、そういうことが言いたいのか馬鹿なのかのどちらか。 おそらく後者。
実際にサイコロで3800回と100万回振って、1が出る確率を比べてみるといい。
宝くじを3,800円分と100万円分買ってみれば 少数事例では3,800くらいじゃ全く役に立たないこともわかるぞ。
え? 3800円でも十分1等が当る確率の近似値になるけど?
計算しやすいように1回100円の宝くじだとして、3800円分38回買う。一等当選確率理論値が0.001%とする。 まぐれで1等一本当っても1/38=約2.6%、すべて外れてたら確率0% 3800回どころか38回でこの程度の誤差。
>>737 2000人どころか100万人規模の予測でも標本数は数百人で十分と、以前統計啓蒙本で
見た記憶があるのですが、許容誤差に応じた最小標本数の算出はどのような式で求める
のですか?
掲載Webページか書物かを、紹介して頂けませんか。
>>741 > 一等当選確率理論値が0.001%とする。
随分良く当たる宝くじだな。 それなら少数でも役に立つだろう。
同じじゃないだろ。 何いってんだ。
測度変換で確率なんていくらでも変わっちゃうもんねって意味?
10%の確率で起こると予測したものが 実際には11%だったときには その誤差は1%ですか10%ですか?
>>745 ? 算数できない子?
世論調査で与党の支持率が変化するごとに、サンプル数を変えろって言ってんの?w
>>748 与党の支持率みたいな大きなものでは問題ないよ。
全く理解せずに答えてるだろ。
>>751 すまんが数学で頼むわ。
予測対象の確率が変化することによってなんで、サンプル数を変えなきゃならんのか。
宝くじの当選確率が0.00000001%と0.001%で誤差の差を数式でお願い。
>>751 意味が分からない。同じサンプル数で野党の支持率では問題が出るのか?
数学できないネトウヨは、支持率が高いと民意だといい、
支持率が低く出るとサンプル数が少ないから信用できないというが・・・おまえ・・・
世論調査では国民新党は支持率0だった。先の参院選獲得議席も0だった。 何か問題でも?
756 :
132人目の素数さん :2011/12/04(日) 00:32:08.26
> 数学できないネトウヨは、 よこからすまんけど、統計学に数学なんか使うな! と声を大にしていいたい! つか、なんで統計学スレが数学板にあるんだ? 気持ち悪いから、もう統計学スレ立てないでくれ。
>>754 与党も十分多いよ。 1議席の必要票みたいな大きなものの話をしてるんじゃないんだ
>>742 過去スレに、選挙の支持率調査例題で、標本数算出法が掲載されていた
記憶があるんだが、何番スレだったかな?
しまった
762 :
132人目の素数さん :2011/12/13(火) 22:12:13.61
763 :
132人目の素数さん :2011/12/14(水) 17:41:44.41
エクセルで無相関検定ってできない?
764 :
132人目の素数さん :2011/12/14(水) 23:51:08.42
日本人の統計学者の研究って実際に役に立ってるんですかね? 統計学の文献見てても日本人の名前が出てこないのですが
>>764 Akaike, Hirotugu (1974). "A new look at the statistical model identification". IEEE
Transactions on Automatic Control 19 (6): 716–723.
とか。
確かにAICは海外の論文でもよく目にする
伊藤の公式とか。有名すぎるか。
768 :
132人目の素数さん :2011/12/15(木) 01:10:16.82
日本の統計学が、なぜ世界的に認められているのか?というと、 北川敏男の功績が大きいのだと思う。
769 :
132人目の素数さん :2011/12/15(木) 21:49:09.89
分散って単なる副産物であって、その数値自体には使い道ないって解釈あってる?
比較以外にはないね。あと平方根をとって標準偏差にするか。
771 :
132人目の素数さん :2011/12/16(金) 02:08:25.96
>>769 >>770 えええええーーーー!
おまいらアタマ大丈夫か?
視野が狭いというか、なんというか、、、
772 :
132人目の素数さん :2011/12/16(金) 20:10:22.87
>>771 わからないから聞いているんだ。
教えてくれないか?
774 :
132人目の素数さん :2011/12/16(金) 22:32:49.86
>>772 ファイナンスや工学部ならすぐわかるはず
なんだよなあ。
どこの学部なんだろ?
まあ、統計学を使う仕事につけばわかるよ。
つけないだろうけど。
すぐ分かるんなら具体例を書いたらどうだ? 標準偏差でなく分散の大きさを直接使う例だぞ。 比較もしないからF検定もだめだぞ。
Hestonさんは確率変動分散をモデル化したけどね
おっさんって否定はするけど例は出せないっていうもが多いよね。
>>776 それも実際の確率微分方程式に組み込んでるのは標準偏差だよね。
いんや、varianceをもでるかしたのがヘストンモデル
価格の方じゃなく分散そのものに確率微分方程式を持ち込んでるのか。 まあでも相対的な変動を見ているんであって値そのものに 関心があるわけではないんだろうけどね。
高校数学からの橋渡しとして 西岡先生?の単位が取れる統計ノートって本が、良さげにみえるのですが。 実際、使ってる人読んだ事のある人、いらっしゃいますか?
782 :
132人目の素数さん :2011/12/17(土) 17:32:28.55
高校数学からの橋渡しは、数学Bの統計と数学Cの確率と統計w どうせ、受験科目として勉強してないだろ。
783 :
132人目の素数さん :2011/12/17(土) 19:39:20.46
あのー、初心者なんですけど、 分散とかも比較にしかつかえないなら、 平均値も比較にしかつかえないですよね? そういうこというと現実の数値は全て 比較にしかつかえないなーと思いました。
比較って相対的なものだよ。 平均値は目標値があったりとか絶対的な値に意味があるよ。
785 :
132人目の素数さん :2011/12/18(日) 11:10:56.02
分散をσ^2 と表したりs^2 と表したり見かけますが、どちらが一般的でしょうか?
>>786 西日本の大学の統計教科書では、それぞれσ^2は母分散、s^2は標本分散と書き分け
表わすとされていますね。μが母平均、xバーが標本平均と同様ですね。
ありがとうございました。よくわかりました。 もし、よろしければ、高校数学スレで確率変数の質問してますので。 そちらも…
>>785 > 48市町村1174地点という出荷前標本調査の標本数が過少だったからだったのでは?
48市町村1174地点というのは無作為抽出ではありません。
これで信頼性を高めるには、「多いところは意図的に外す」ができないくらい多く
かぎりなく全数調査に近いことをしなければ標本数は足りないでしょう
>>785 母数が国民全部なら±2.5%あたりで十分な調査などいくらでもあると思うが
どのような調査を考えているのか?
西日本 という大学はあるが (短期大学だが) 東日本 という大学はない (東日本のつく大学はある)
>>787 普通はそれが一般的な表記だろう。
U^2については本によって分かれるけどね。
>>769 分散を評価しないと良い結論は言えないよ。
大学学部程度だとあまりわからないかもですが。
795 :
132人目の素数さん :2011/12/18(日) 22:14:46.99
そういう意味では、分散がわからないと 分布がわからないから、 確率計算がなにもできくなる。
多変量になるとさらに共分散、相関係数なんかも 重要になるのでね。 行列代数も詳しくないとだめですよ
>>756 数学特に線形代数もわかんないで
数理統計なんかできないわ。
理論をちゃんとやらないで利用だけするなら
そうすればいいけどそれだったらテレビやネットの
いいかげんな世論調査とかアンケートの結果と変わんないでしょ。
世論調査がいいかげんとは。 本気で言っているのか。
>>794 話がずれている気がする。
相対的な評価はするでしょ。
数値自体ってそれを100にしたいとかそういうことではないのか?
ばらつきの制御自体は考えるけどその場合はやはり標準偏差だな。
共分散もそれを直接使う例があったら教えてほしい。
普通は相関係数にしてしまうよな。
葱
今ソレを煮てるワ。仕上がりは明日やけんどナ。 猫
今夜の調理はもうシマイや。そやしそろそろ寝るとスルかね。 猫
統計の分散がs^2 で確率変数の分散がσ^2 でない?
>>803 母分散,標本分散の定義見てみればわかるでしょ?
>>798 「いいかげんな世論調査」にそういう文句をつけるということは
「世論調査はすべて正しく厳密に行われている」よいう反論ということでよろしいか?
世論調査の標本のとり方、質問文、結果の処理に恣意性がはいる可能性はあるな
世論調査を厳密にするのは不可能だし、する必要もない。 かといって調査を捏造するほど、いいかげんなことはしていない。 バラツキはあるが、各社どこも似たような結果なのが証左。
808 :
806 :2011/12/20(火) 01:01:33.94
>バラツキはあるが、各社どこも似たような結果なのが証左。 違うだろ、新聞の色が出ているだろ。
テレビとかはよく、 ランダム・デジット・サンプリング、層化二段無作為抽出法 なんかを使ってるけど回収率とかも見てもどれほどいい結果かは 言いにくいでしょ。 やってるところがどんな結果がほしいかで誘導することも多いだろうし。
>>807 > 調査を捏造するほど、いいかげんなことはしていない。
どうしてそう信じられるの?
以前ある会社に勤務してた時、顧客からボーナス等の金額のアンケート取ってその調査結果を新聞発表してた でもそのアンケートのほとんど社員がねつ造したものだった 実話です
>>811 とは別人だけど
大手の企業がアンケートを取る時には、関連会社経由でとることが多い。
で、たいがいは関連会社は自社に登録している客の情報を利用してアンケートを実施する。
なので、金融機関系のシンクタンクだと、サンプルが偏っていることが多い。
まあ、その会社の商品開発ならいいんだけど、それを一般的な調査結果のように公表することも多い。
>>813 選挙があることが
世論調査は厳密に進められることはしないと
信じられる理由になるのか?
それが新聞に書いてあるのか?
× 世論調査は厳密に進められることはしないと ○ 世論調査は厳密に進められると
こうじゃね? 選挙があることが 世論調査は捏造なしに進められると 信じられる理由になるのか? それが新聞に書いてあるのか?
だな
>>814 信じられる理由になるわけないだろ。
ちゃんと新聞各社ばらつきあるだろ。だから厳密ではないと言い切れる。
しかし、各社の推移を見ると、相関性が高く、選挙結果との相関性も高い。
だから、厳密ではないが、いいかげんでもない。統計学的に明らかだと思うが。
>>統計学的に明らかだと思うが。 もう少し統計学的な発言ができませんでしょうか?
>>819 分散と相関係数ぐらい自分で計算しろよw 初心者すぎだぞ>
>>818 それが信じられる理由でないなら、
世論調査がいいかげんではないと
信じられる理由は何なんだ?
極端な話をすれば、 前日の他誌の発表を元に自社の捏造分を混ぜて
今日の原稿を書いたら、相関性が高く、選挙結果との相関性も高いものに
なるぞ。
>>820 おまえ、相関と分散くらいしか知らないんだろ
だから
>>818 のようなアフォなことが書ける
823 :
132人目の素数さん :2011/12/20(火) 16:40:53.46
>>822 なら各社新聞社の世論調査がいいかげんなことを、統計学的な分析と結果をお願いします。
しかも、相関、分散以外の高度な統計とやらで。
お、話を逸らしたな
例えばフェルミ推計も併せてでも推論するならともかく
>>818 レベルじゃなw
どの社も通常サンプル数も公表してるんだから信頼水準を適当に設定して
各社間の差を比較評価するとか書けば尤もらしい意見になると思うんだがな
どうだい
>>823
826 :
132人目の素数さん :2011/12/20(火) 17:00:22.55
>>825 分析結果まだ〜?
なんで各社の世論調査はいいかげんだと証明しないの〜?
まさか計算方法しりませんとかないよね?
>>825 言ってる意味が分からない。
いいかげんさを証明するのに、フェルミ推定というさらにいいかげんなものを推論して何がしたい?
>>822 随分と時間がかかるな。さっさと分析結果張れよ。
まさか逃げ出したんじゃないだろうね。最低のゴミくずだな、おまえ。
>>826 いい加減かもしれないし正しいかもしれないんだが
おまえは正しいと主張している
酔って証明をすべきなのはおまえな
>>827 薄い根拠で「新聞社は正しい」と主張するよりは”遥かに”ましになるだろ
それもわからんか?
>>829 おれは既に計算済みで結果のコピペ準備して、
おまえの回答待ってんだが。
>>830 分かるわけないだろ。おまえの妄想問題なんか。
勝手に問題変えるな。誰もそんなこと話してないだろ。頭おかしいのか?
新聞社は正しいではなく、
世論調査は厳密ではないが、いいかげんでもないってことだ。
ほんと馬鹿ほど妄想で勝手な解釈するから困る。
あれ?論点は捏造があるかどうかじゃっ?
世論調査が捏造ってネトウヨかよw
答えまだ〜?
838 :
806 :2011/12/20(火) 18:09:42.03
>>798 1.世論調査が正しいことを検定する
2.世論調査が間違っていることを検定する
は違うだろ。言い出しっぺが1を統計的に実行してみせるのが筋じゃねー。
だな。言い出しっぺがまずは証明すべき。
世論調査をいいかげんと言ったのは
>>797
ソースが二種類あってそれをもとに各社がそれぞれ捏造した結果に見えるんだが
字が読めないんですね。分かります。 統計学学んでるなら、このグラフを見ただけで何のグラフか分かるはず。
>>822 さっさと分析しろよ。
おまえはどんだけアフォなんだよ?w
844 :
132人目の素数さん :2011/12/20(火) 18:57:34.51
世論調査はいいかげんで捏造なのに、 なんで思想、哲学の違う各社に相関性が高かったり、分散が小さかったりするんですかね? しかも大阪地方選のときも投票開始0分でズバリ的中。 本当に捏造でいいかげんなのでしょうか。 なぜ捏造でいいかげんなのか証明してほしいものです。 逃げてばかりのお馬鹿さんに言ってるのですよ。
>>840 順位の動きを見ると傾向があるので、統計的にはデータをいじってる可能性が高いって結果でしょ。
メンデルの遺伝の実験データがおかしいと、フィッシャーが指摘したのと同じかな。
>>845 調査方法、サンプル範囲が違うから当然そういう傾向が出る。
報道2001は首都圏のみとか。あるいは固定電話世帯のみとか。
というか早く世論調査はいいかげんで捏造したものという分析してくれよ。
ほんといつも逃げてばかりだな、おまえ。
まず捏造はないということを証明しろや あの図が証明なのかw 恥ずかしい奴w
どうやって証明するんだ?w フィッシャーだって証明できてないw
>>847 まずは捏造であることを証明しろ。捏造と言い出したのはおまえだ。
ぼくは捏造は無いとは言えないと主張しているだけ 証明の義務はない
>>841 >捏造した結果に見える
>捏造した結果に見える
>捏造した結果に見える
捏造かどうかなんて、 各社の世論調査にニコニコの調査もプロットすればすぐ分かるよ。 ネトウヨはいつもニコニコ以外の世論調査は捏造って言ってるからね。 本当なら有意な差が出るはず。
見つけたよ。確かに捏造疑惑があるな。 東京都都議選に関係する世論調査(どの政党の候補に投票しますか?) 自民 民主 サンプル数 毎日新聞 13% 26% 1063 朝日新聞 15% 28% 999 東京新聞 20.3% 32.5% 1529 ニコニコ動画 31.1% 11.8% 12507 NHK出口調査 26% 44% 現実の都議選得票率 25.9% 40.8%
実際の投票には行かない可能性があるので自民と民主の比率のみが正しいとすると 適合度検定で棄却されないのは東京新聞、朝日新聞の2つになるな。 毎日新聞は棄却されるがp値0.022で、ニコニコ新聞はほぼ0。 ニコニコ動画は、東京都の選挙権を持たない人がいるからだろう。
ニコニコ新聞ってw 自分でワロタ
>>855 ニコ動見てる人は関心ある人ばっかだから
偏ってしまうからなぁ。
まあ個人的には結果に納得するがw
>>797 〜
>>858 世論調査はいい加減で捏造とか否捏造はないとか、理系学問板なのに主観評言の
横溢洪水ですね。
数学板らしく最適標本数算出式
>>761 の数理的な可否などを、論じませんか。
>>859 そうですねぇ
サンプルサイズ計算しないとだめね
分散すら計算することから逃げる人たちです。 議論はできないでしょう。
>>859 おいおい、検定は主観じゃないだろ。
>>860 サンプルサイズぐらい誰でも計算できるだろ。
支持率20%を信頼幅2%で予測するための人数は1536。
この人数で支持率が10%だと信頼幅約1.5%。
各新聞社の調査は人数だけなら十分とれているよ。
おっとこれも書いとかないと文句出るんだろうな。
>>855 の2社は約1000人の調査だけど信頼幅は支持率20%で2.5%を目指したんだろうね。
自民と民主で支持に差があることはこれで十分にわかる。
信頼幅2%? なにそれ?
N=30 α=0.05 のときの(片側検定)Z値とt値てどうやってもとめるんですか? 誰かやり方だけでいいので教えてください
>>823 いい加減だという証明がないことが
いい加減な世論調は存在しないという証拠になるのだ
という主張ということでよろしいか?
>>839 797は「(すべての)世論調査がいい加減」 と 言っているのではなく
「いい加減( 形容されるある)世論調査」についての話をしているのだが
>>840 をみて
いいかげんだから世論調査は信用できないというほうが稀だろう。
この程度のバラツキでいいかげんだから許せない人ってここにいるの?
論点がずれてる も少し上からきちんと読め
>>865 それだけの情報だと何がしたいか伝わらんよ
片側検定って言ったっていろいろあるんだよ
>>868 なぜ、「いいかげんな世論調査」 の話題に
「すべての世論調査はいい加減で信用出来ないというのはおかしい」と乗っかってくるんだ?
必要条件と十分条件の違いとか、∃と∀の違いとかわかってるか?
一人で勝手に話題を限定したがる人がいるな。
とりあえず他人の言葉を否定したくてしょうがない人がいると話がややこしくなる
>>870 信頼幅という用語を
>>864 氏同様初めて目にしたが、言われるように信頼区間の幅の
意味のようですね。
統計教科書本でも見た記憶がないが、信頼率、信頼度、信頼水準、信頼区間、
信頼上(下)限同様に、JIS規格の用語集には掲載されているのかな。
876 :
132人目の素数さん :2011/12/25(日) 01:41:21.02
どこで聞けばいいのか分からないのでここで質問させてください。 正規分布のような分布なのだけど、偏っている分布で、数学的に美しいのはどういうものになるのでしょうか? 正規分布は * ** *** ********** *********** ********** *** ** * こんなのですが、私が求めているのは * ** ********** *********** ********** *** *** ** ** * * こんな感じで偏った正規分布みたいな形です。よろしくお願いいたします。
>>876 範囲がどこからどこで考えているのかわからないですけど
そのような形ならば
カイ2乗分布か、F分布だと思いますよ
878 :
132人目の素数さん :2011/12/25(日) 06:24:26.30
879 :
132人目の素数さん :2011/12/25(日) 06:53:49.98
>>876 ポアッソン分布も有力候補に挙げられると思いますよ。
880 :
132人目の素数さん :2011/12/25(日) 15:49:58.85
>>862 >支持率20%を信頼幅2%で予測するための人数は1536。
>この人数で支持率が10%だと信頼幅約1.5%・・・・・・・
これらの算出には、どういう算出式を使われたのですか?
881 :
132人目の素数さん :2011/12/25(日) 19:06:57.47
さ
882 :
132人目の素数さん :2011/12/25(日) 22:08:32.60
884 :
132人目の素数さん :2011/12/25(日) 23:43:17.00
相関係数の検定ってどうやるんですか?
>>875 信頼幅って言葉はあるみたいだけど信頼区間の幅というのが正しい定義みたいだよ。
だから
>>862 の最初は4%の間違いだね。
>>880 二項分布の正規近似による信頼区間で簡単に確認できたけど?
すみません 大学で統計学を学んでいるのですが 質問させてください 第2種の誤りを犯す確率を小さくする方法として 「有意水準を大きくする」 以外に何がありますか?
889 :
132人目の素数さん :2011/12/27(火) 21:11:45.34
すみません。統計学を勉強し始めたばかりのものなのですが、 「標本の数と大きさ」の違いでいきなり躓いてしまいました。 これはとある問題なのですが、 Q、標準的な統計学の試験問題についてある母集団から 無作為に抽出した学生を対象として解かせてみたところ、得点は次のようになった。 22,27,36,38,40,46,51,58 Q1,この標本の数と大きさを答えよ 標本の数は8だと思うのですが、大きさについての求め方がわかりません。 どなたかご回答をお願いしますm(__)m
数は 1 で大きさは 8かな?
>>890 ご回答ありがとうございます。質問なのですがなぜ数が1なのですか?
1というのはどこから来たものなのでしょうか?
ベイズの入門的な本を読んでわからなくなりました。 1/5の確率で当たるカードを二人めくるゲームです。まず二人がそれぞれのカードを選びます。 一人目をめくります。ハズレでした。 次にもう一人がめくる番ですが、最初のカードがハズレだと確認したあとに、選んでいたカードと別なカードを選び変えてしまいました。 そのカードを開くと当たりだったのです。 ベイズ理論によると、二人目の行動により当たる確率が高くなったそうですが。 うんなことあるかいな? そうなると、くじを戻さないくじ引きならば、後で選ぶ方が確率が高くなるはずです。 どなたか説明いただけませんか?
>>891 こういう抽出(試行)をもういちどやれば、2になる。
>>893 ご親切に解説していただき、ありがとうございましたm(__)m
>>892 オレもこういうの、苦手なんだが。まず 2枚ひいたところで、オレの当たり確率は
1/5, 相手も 1/5。山にあるのが 3/5(つまりオレの札が外れの確率は 4/5)。相手が
はずれを開いた段階で、オレの札の確率は依然として 1/5だが、山の 3枚のおのおの
は、4/5 * 1/3 = 4/15の確率に増える。1/5 < 4/15 だから、そっちに
くらがえしたほうが有利となる。
ありがとうございます。 凄く理解したけど納得いかないーw 因みに、これはベイズの話でもなく一般的な確率の考えでも同じでしょうか?
者ティホール問題の亜型だな
898 :
cheese ◆pMONpHJxkARi :2011/12/27(火) 22:49:00.90
>>893 stage の数を標本の数と呼ぶのは初耳です。
標本の大きさも標本数も同じ意味ですよね。
900 :
cheese ◆pMONpHJxkARi :2011/12/27(火) 22:55:57.36
ちょっとぐぐってきました。
>>899 リンクありがとうございます。
標本の大きさが100(100個の標本)が3セットあるとき
標本の数は3セットあるということなんですね。
stageの数とは全然関係ありませんでした。(二段階抽出の話かと思ったので)
>>896 現実問題として、こうなるらしい。オレもいまだに納得いかん。
ありがとうございます。 納得いかないので、エクセルでシミュレーションしてみます。
くじを戻さないくじ引きとは関係ないみたいですね…
905 :
892 :2011/12/27(火) 23:54:34.69
エクセルでこの問題をテストしようと思けど、、明日朝から帰省だったので。 また後日。。(確率スレの方が良かったかしら。) でも、相手がハズレを引いた段階で山の3枚、「オレ」の1枚をそれぞれ対等に1/4になった、 と考えるのがまだ正常に思うけど。 と思ったら、先にカードを開く方が1/5で、後に開く方が1/4になるってのも。。
>>905 > 先にカードを開く方が1/5で、後に開く方が1/4になるってのも。
相手は単にカードを開くのじゃなくて、「オレのコントロールできない 4枚の
中から、外れカードを一枚持ち去った。結果、山に残ったカードの当たり
確率は濃縮された」と考えるみたいなんだな。
907 :
892 :2011/12/28(水) 00:33:35.57
>>906 ありがとう。うーむ。
>>897 さんの、モンティホールでぐぐってみたら説明があった。
「論」ではなくて「実証」されてるんですね。
こんな単純で面白いモデルが、高校確率で扱わなかったのはなぜだろう。
高校でベイズの定理は習わないだろ。
Bayesは難しいが今の主流だからなぁ
中畑が監督では厳しいだろうな
中畑じゃなくても厳しいだろ
>>886 >信頼幅って言葉はあるみたいだけど・・・・・・・
会社で、”JIS Z8101 統計−用語と記号”を見ましたが、”信頼幅”は載っていないですね。
正確には、信頼区間の幅というべきでしょうね。
>>903 くじを戻さないくじ引きと、相手がハズレと分かった上で、引くくじを変える行為に、違いを感じないんだが。
例えば、二人が5本のくじを引くとして、それぞれ心の中で、引くくじを決めていたとする。(特に引くくじを宣言するわけでない。)
一人目がハズレで、二人目が気が変わって最初に思っていたくじとは別なくじを引く。
この時に、二人目が当たる確率はもはや1/5ではないと?
>>909 ビルゲイツがほめたベイズの定理という本のカバーがあったなー
ん、くじ引きの時は前もって引くくじを決めていて、実際のくじを引く場面(二番手以降)では、それではないくじを引く事にすればいいんだな。 (?_?) 先行不利? (?_?)
Bayes流が讃えられているってことは マルコフ連鎖も素晴らしいってことだよね
手元に一つのサイコロがある時、このサイコロに偏りがあるかどうかを調べるため、 サイコロを10000回投げて1の目が何回でたかを数えることにする。 1,「このサイコロに偏りがない」というためには1の目の出る回数は 何回から何回の間でなければならないか? 2,「このサイコロは1の目が出やすい」というためには1の目が出る回数は 何回以上でなければならないか? なお、有意水準は5%とする。 大学の統計学の問題でわからなくなってしまいました。どなたかご教授ください。 よろしくおねがいします。
>>912 別にすべての統計用語がJISに載ってるとは限らないだろ。
クロス集計表とかも載ってないぞ。
まあマイナーな言葉は使わないのがよいというのは分かるが。
intervalを幅と訳せば信頼幅だな
920 :
132人目の素数さん :2011/12/29(木) 08:59:42.27
921 :
132人目の素数さん :2011/12/29(木) 10:59:57.92
>>917 1の目だけを議論しても、偏りが無いなんて断定出来まい
その問題(1)を出した先生はアホ
>>917 >>921 の言うのももっともだが、1の出る確率を 1/6として、
1ばかり出る 1回連続 0.167 2回連続 0.028 3回 0.005
1が出ない 1回目 0.833 17回目 0.045 26回目 0.009
>>892 > ベイズ理論によると、二人目の行動により当たる確率が高くなったそうですが。
ならないならない。
これはモンティホールとは根本的に違う。
>>917 > 大学の統計学の問題でわからなくなってしまいました。どなたかご教授ください。
とりあえず、どこまで分かって、どの辺りで分からなくなってるのか説明してくれ
それから10000回投げて1の目が10000回出たら、「このサイコロおかしいだろ」って言うと思うけど、
それを数学的に述べてみてくれ。
どの程度理解してるのか分からないと、説明のしようがない
>>925 > 何が違うか言ってミ?
ふつうのクジは1人目が当たる可能性がある。
モンティホールの司会者は100%ハズレを引く。
>>926 > モンティホールの司会者は100%ハズレを引く。
この例題の対戦相手も 100%はずれを引く運命のもとにあったのかもしれない。
あるいは、実はイカサマをやっていて、相手に勝たせたかったのかもしれない。
どれが当たりか知っていたと称するモンティも、この相手も、客観的事実は
単にはずれを引いたということだけ。
928 :
132人目の素数さん :2011/12/29(木) 15:33:25.34
>926,927 統計学的には926が正しい。 「運命」とか「いかさま」をいいだすと、統計学の問題のほとんどが成り立たない。 とくに断らない限り、試行はi.i.d.とし、それを客観とする。
一回目でハズレた事象は、意図的だろうと意図的でなかろうと二人目にとっては変わらない。ってこと?
っていうか。 やっぱり、取り替えた方が確率高くなるの?
いかさまも運命もないというなら、別に札は替えなくていいんじゃない?
ありがとうございます。つまり確率は、1/5ですね。
期末の過去問で分からない箇所があるので、解き方を含めて教えてください 問:27人分のデータを得て、2変数間の相関係数を計算した。次の@〜Dの相関係数のうち、有意水準が.05のときに仮説採択と言う結論になるものを全て選べ。 @.28 A.35 B.38 C.44 D.50
934 :
933 :2011/12/30(金) 01:40:15.30
935 :
132人目の素数さん :2011/12/30(金) 03:27:06.59
>>934 その表ってのは、リンクが切れているみたいですが。。。
科学雑誌Newtonによると、太陽の直径は約140万キロメートルであり、 秒速約30万キロメートルの光は5秒弱で通過できる計算になります。 しかし、太陽の中で生じた光(光子)は他の素粒子と衝突を繰り返し、 太陽の表面に達するまで平均で5,000年もかかるそうです。 【問題】 太陽の中で生じた光で太陽の表面に達するまで10,000年以上かかるものは、 太陽の中で生じた光のうち何%でしょうか?
937 :
933 :2011/12/30(金) 12:01:05.84
>>920 実際EXCELとかで計算するとすぐに分かるだろ。
>>862 で示されてた結果はそのページの無限の式で
最大誤差(信頼区間の幅の半分)=0.02
信頼率に対応する正規分布点=1.96
予想される母集団の比率=0.2
とすると得られるぞ。有権者の数はすごく多いから
有限の式は要らないんじゃないかな。
そのページでは最大誤差は0.05とすることが多いって書いてあるけど
それだとp=0.5でも384人で十分になる。
新聞社はさすがにそれよりかは多く調べてるってことだね。
1000人ぐらい調べてるってことは逆算すると最大誤差0.03という
あたりの設定かな。
結局どのぐらいの差まで見たいかに依存するので後は問題ごとに
考えるしかないよ。
>>941 平均5,000年→一定確率とみなせる。
goo辞書 【統計学】
確率論を基盤にして、集団全体の性質を一部の標本を調べることによって推定するための処理・分析方法について研究する学問。
統計学と関係さえあればどう関係あるかは問わないはず、ここは「なんでも」スレだから。スレチじゃないと思う。
言ってること間違ってるかな?
ところで、解けない?
943 :
132人目の素数さん :2011/12/31(土) 00:46:41.85
ランダムウォークは統計力学で統計学じゃないし、進行距離分布の半径依存性も分からず解けるわけないし、数値もでたらめだから釣りとしか思わん。
>>943 数値はでたらめのつもりはないし問題を前提にしてもらえればいいと思う。
釣りのつもりはない。
統計学に関係あるかと思うけどスレチになるのかな?
解けるわけないし→回答と解してよい?
3次元ランダムウォークなら半径依存性はないと仮定していることになるな。 ただ3次元ランダムウォークって簡単に確率評価できたっけ? シミュレーションならなんらかの解は出せそうかな。
そこで、ベイズの登場なのら。
質問いいですか? 平均の表現としてxの上にバー(ー) を書く書き方あるけど2chでは とう表現してるの? 標本平均です。
>>949 2chの流儀は知らんが、
¥bar{x}でいいんちゃうん
>>951 そうです。.txt用です。
>>950 のアイデアならば
E(ber(X))、V(ber(X))となる
けどおk?
標本平均: \bar{X} = \frac{1}{n} \sum_{i=1}^{n} X_{i} 標本分散: S^2 = \frac{1}{n} \sum_{i=1}^{n} (X_{i}-\bar{X})^2
958 :
936 :2012/01/03(火) 22:07:16.14
回答がないので出題を終了します。 ありがとうございました。
あー、せっかく回答を考えたのに締切かー
じゃあ言ってみて
ちょっと変わった不思議なコインがあるとします。 このコイン10,000回投げてみると、大体半数づつ表と裏が出ているのですが、なぜか、表と裏が連続してでる事が極端に多いのです。 例えば、表100回連続でたあと、裏が200回でます。 でも10000回投げてみると大体半数ずつに収まっています。 このような、極端なブレを検定するには何と何を比べればよいでしょうか? またもし、100回200回の連続ではなくて、10回20回の連続が出現するとして、それが通常の範囲なのか調べるには、何と何を比べればよいでしょうか? 統計は数学2レベルですが、難しい解答でも構いません。解らないところは自分で調べますので。 どうぞよろしくお願いします。
100分の1で当たるくじがあったとすると10000回やった時の標準偏差は√期待値で10 なのはわかるんですが、 それぞれのあたりが1/2の確率でもう一回当たるとした時の標準偏差はどうやって計算したら良いですか?
>>961 「統計は数学2レベル」
この問題はそうかもしんないけど
本来の数理統計の理論はそんなレベル低くない
失礼しました。 私の統計の知識が、数学UBしかないという事です。 コインの問題は、自分が疑問に思っていることを、コインに置き換えているだけですので、普通の統計学の「問題」とは趣きが違うかもしれません。
ところでこの問題。 連続して事象が発生する回数を記録して相対度数のグラフを出して、それを普通のランダムなコインの相対度数のグラフと比べる事で、検定できそうですが、いかがでしょうか?
分散は各確率変数の二乗と、各確率を掛け合わせた和から、期待値の二乗を引いたもの。
962の場合は二項分布になるから。 繰り返しの回数 × 確率 ×(1-確率) でも分散の値は求められる。かも。
あいや、962は二項分布じゃなかったゎ。 上のは無し。
>>967 Var(X)=E(X-E(X))^2
SD=√Var(X)
972 :
132人目の素数さん :2012/01/05(木) 12:03:39.38
統計の分野の最新の論文はどこのサイトで見れるんでしょうか? やはりarxivでしょうか?
974 :
132人目の素数さん :2012/01/06(金) 01:04:59.06
>>972 どういう方面の論文を探すかわかってなければ、
なかなか答えようがありません。
>>961 > 極端なブレを検定するには
何を検定したいんだ?
>>961 コインを投げるときに、「表裏」ではなく、直前回と同じ側が出たかどうか「同異」を調べれば
出目の独立した偏りのないコインでは、「同異」の両者はほぼ同数になるはずだ。
その不思議なコインの「同異」が50%であると仮定して、そのコインを投げた結果を
検定をしてみるといい。
>>977 さん。
>>976 さん。取り上げていただいて、ありがとうございます。
そうです。
裏表ではなくて、直前の現象と同じであるかを調べたいのです。
同異というのですかね。参考にさせていただけます。
すいません。もうひとつ質問します。
1/2になる確率の通常の事象について、その事象を繰り返していきますと、同異の分布は均しくなっていきますでしょうか?
上手く言えないなぁ。
つまり、10円だろうと、500円だろうと、エクセルでランダムに1/2を発生させただろうと、もし偏りがなければ、前の事象と同じ事象が連続して現れる確率は均しくなるでしょうか?
もし、これを分布としてグラフ(横軸:連続回数。縦軸:発生数)を描くと、滑り台のような、右下がりの分布図になると思いますがいかがでしょうか?
979 :
978 :2012/01/07(土) 02:11:52.64
自己解決しました。よく考えたら。 1/2の確率の事象ならば、前回と同じものが出る確率も1/2ですね。 ですので、10円でも500円でも、エクセルでも1/2の事象なら、 前回と同じものが出る確率は1/2になるのは1/2ですね。当たり前か。 自分が質問したのは、コイン投げで、もし前回と同じ事象がでる事象が続いたとき それは、大きくぶれながらそのうち、1/2に収束していくのか。 それとも、1/2に添うように小刻みに修正?しながら、1/2に収束していくのか。 ちょっと謎だったのです。 分布グラフについても、 試行を続けると、「同異」する可能性は1/2づつ減って行きますので。 理論的には右下がりで、下の指数グラフのような(但しY=1を通らない)グラフになるかな と思いました。 試行100回で1/2の確率で前回と同じ事象を示すグラフなら、理論的に 下のような座標に添う分布になるかと思います。(どうだろう。) X軸:連続回数 Y軸:連続回数の発生数 例えば、3回つづけて同じ事象が続く事象は25回/100回 (2,50) (3,25) (4,12.5) (5,6.25) (6,3.125) (7,1.5625) いろいろ勉強になりました。ありがとうございました。
>>938 >無限の式で
>最大誤差(信頼区間の幅の半分)=0.02
>信頼率に対応する正規分布点=1.96
>予想される母集団の比率=0.2 ・・・・・・・
応答有難うございます。最大誤差=0.02 とは、=±0.02 の意ですね。
>>979 > それは、大きくぶれながらそのうち、1/2に収束していくのか。
> それとも、1/2に添うように小刻みに修正?しながら、1/2に収束していくのか。
もしかして、よくある誤解をしているのかもしれないので、ひとこと添えておく
理想的なコインを投げたところ、「たまたま」表ばかりが20回とか100回とか
続けて出てしまうことがあるかもしれない。(そういう可能性は0ではない。)
しかしもしそういうことが起こってたとしも、十分多くの回数コインを投げ続けると
表裏は1/2に収束して行く。
ただし、この収束では、先にでた100回の表を埋め合わせるように裏が100回分多く出る
というような意味のことではない。
101回目以降もコインは変わらず1/2で表裏が出続ける。
先に言った「十分多くの回数」とは、最初に出た100回なんて誤差のうちにしかならないくらい
多くの十分な回数という意味なんである。
982 :
132人目の素数さん :2012/01/10(火) 02:33:02.45
大学の実験で、正規分布に従うとされるデータを200個取ったのですが、 データ整理の項目で、標準偏差と平均の平方根を比較せよ、というものがあります。 この2つの値を比較する意図が分からないのですが、何が分かるのでしょうか。
983 :
132人目の素数さん :2012/01/10(火) 03:50:06.94
>>982 もっと詳しく説明してもらわないとわかりません。
例えば、標本サイズが200で標本は1個なの?
984 :
132人目の素数さん :2012/01/10(火) 04:58:45.33
>>983 標本サイズ200、標本数1です。
放射線学の実験のデータ処理なので統計学に深く突っ込んだ話ではないと思います。
平均値と標準偏差は同じ次元のデータなので、
どうして平均値に√をつけたものと、標準偏差の値を比較するのかが分からないのです。
得られたデータについて何の評価もできない気がするのですが。
それ分からんとはあまりに勉強不足じゃね?
>>982 平均・分散・標準偏差の定義をよく見て考えてみ
987 :
984 :2012/01/10(火) 10:23:13.26
数時間ガチで考えて分からないんですけど、 標準偏差と√(平均)の比較っていうのは、 分散と平均の比較とほぼ同義ですよね。 そもそも、分散だと元のデータと直接比較ができないから、標準偏差の概念があるんじゃないんですか? それぞれの定義も考えたんですけど、どう変形しても結局2乗と1乗の比較になっちゃうから比べられないです。
>>982 「元の分布の標準偏差」と「データ偏差の2乗平均の平方根」だろ。
0
今年の5月頃に行われるRSSのHigher Certificateを受験される方はいらっしゃいますか? 大学1〜2年程度の知識とのことですが、お薦めの参考書とかありますかね?
0
三百三十六日。
995 :
132人目の素数さん :2012/01/13(金) 20:49:08.63
>>992 すごいムズイと聞いて
おれは受けるのやめました。
ガムバッテください。
>>992 こういう資格があるんですね。目指して勉強しようかな。