統計学なんでもスレッド 13

このエントリーをはてなブックマークに追加
733132人目の素数さん
世論調査みたいな感じで3800の調査で母集団2億の動向を探るって妥当?
調査対象が充分すぎるとか少なすぎるとかある?
734132人目の素数さん:2011/12/02(金) 09:53:28.68
十分過ぎる。3800人と100万人の誤差を比べれば分かること。
100万人調査することは無駄骨でしかない。
735132人目の素数さん:2011/12/02(金) 10:39:01.39
3800人と100万人の誤差って言われてもよくわからないんだけどね
ラジオ聞いてたら3800の調査で2億の動向わかるのかよっていう感じのコメントしてる経済記者がいたからどうなのかなと思った
736132人目の素数さん:2011/12/02(金) 15:03:17.20
>>735
きちんとした調査なら3800人でも十分。
ただ、調査の仕方が悪くて聞く人が偏っていると、結果が信用できない。

例えば、電話で昼間に調査したら、答えるのは主婦ばかりになるとかね。
2億人全体のバランスと合うように、年齢階層とか収入の分布とかを作ったグループで
調査しないとだめ。
質問するグループをきちんと作ったとしても、みんなが答えてくれるわけじゃないので、
一部の人が関心があって答えたいような質問だと回答率が下がって結果も偏る。
737132人目の素数さん:2011/12/02(金) 15:20:48.39
きちんと抜き出すなら2000人もやれば十分なんだが
街頭調査や電話口調査ではとても偏りなく抜き出したとは言えない。

経済記者は、そういうことが言いたいのか馬鹿なのかのどちらか。
おそらく後者。
738132人目の素数さん:2011/12/02(金) 15:29:02.49
実際にサイコロで3800回と100万回振って、1が出る確率を比べてみるといい。
739132人目の素数さん:2011/12/02(金) 16:27:53.14
宝くじを3,800円分と100万円分買ってみれば
少数事例では3,800くらいじゃ全く役に立たないこともわかるぞ。
740132人目の素数さん:2011/12/02(金) 16:46:53.74
え? 3800円でも十分1等が当る確率の近似値になるけど?
741132人目の素数さん:2011/12/02(金) 17:31:00.16
計算しやすいように1回100円の宝くじだとして、3800円分38回買う。一等当選確率理論値が0.001%とする。
まぐれで1等一本当っても1/38=約2.6%、すべて外れてたら確率0%
3800回どころか38回でこの程度の誤差。
742132人目の素数さん:2011/12/03(土) 05:37:31.35
>>737
2000人どころか100万人規模の予測でも標本数は数百人で十分と、以前統計啓蒙本で
見た記憶があるのですが、許容誤差に応じた最小標本数の算出はどのような式で求める
のですか?
掲載Webページか書物かを、紹介して頂けませんか。
743132人目の素数さん:2011/12/03(土) 05:57:57.37
>>741
> 一等当選確率理論値が0.001%とする。 

随分良く当たる宝くじだな。 それなら少数でも役に立つだろう。
744132人目の素数さん:2011/12/03(土) 12:30:56.90
>>473
どんな確率でも同じだっつーの。
745132人目の素数さん:2011/12/03(土) 14:58:34.58
同じじゃないだろ。 何いってんだ。
746132人目の素数さん:2011/12/03(土) 15:02:14.88
測度変換で確率なんていくらでも変わっちゃうもんねって意味?
747132人目の素数さん:2011/12/03(土) 15:04:56.21
10%の確率で起こると予測したものが
実際には11%だったときには
その誤差は1%ですか10%ですか?
748132人目の素数さん:2011/12/03(土) 15:05:38.00
>>745
? 算数できない子?
世論調査で与党の支持率が変化するごとに、サンプル数を変えろって言ってんの?w
749132人目の素数さん:2011/12/03(土) 15:10:36.99
>>746
重回帰分析の話題じゃないの?
750132人目の素数さん:2011/12/03(土) 15:14:21.24
>>748
それが473と何の関係があるの? 
751132人目の素数さん:2011/12/03(土) 15:15:10.86
>>748
与党の支持率みたいな大きなものでは問題ないよ。
全く理解せずに答えてるだろ。 
752132人目の素数さん:2011/12/03(土) 15:15:50.05
>>747
ポイント使えよ
753132人目の素数さん:2011/12/03(土) 15:30:07.23
>>751
すまんが数学で頼むわ。
予測対象の確率が変化することによってなんで、サンプル数を変えなきゃならんのか。
宝くじの当選確率が0.00000001%と0.001%で誤差の差を数式でお願い。
754132人目の素数さん:2011/12/03(土) 21:18:00.90
>>751
意味が分からない。同じサンプル数で野党の支持率では問題が出るのか?

数学できないネトウヨは、支持率が高いと民意だといい、
支持率が低く出るとサンプル数が少ないから信用できないというが・・・おまえ・・・
755132人目の素数さん:2011/12/03(土) 22:49:33.14
世論調査では国民新党は支持率0だった。先の参院選獲得議席も0だった。
何か問題でも?
756132人目の素数さん:2011/12/04(日) 00:32:08.26

> 数学できないネトウヨは、

よこからすまんけど、統計学に数学なんか使うな!
と声を大にしていいたい!
つか、なんで統計学スレが数学板にあるんだ?
気持ち悪いから、もう統計学スレ立てないでくれ。
757132人目の素数さん:2011/12/04(日) 04:02:44.07
>>754
与党も十分多いよ。 1議席の必要票みたいな大きなものの話をしてるんじゃないんだ
758132人目の素数さん:2011/12/04(日) 15:54:55.11
>>742
過去スレに、選挙の支持率調査例題で、標本数算出法が掲載されていた
記憶があるんだが、何番スレだったかな?
759132人目の素数さん:2011/12/04(日) 21:36:17.17
>>757
このスレでおまえ一人浮いている。
76031.6.183.58.megaegg.ne.jp:2011/12/09(金) 17:08:09.06
しまった
761132人目の素数さん:2011/12/11(日) 11:25:35.93
>>758
標本数算出式が過去スレ群では検出できなかったが、埼玉県庁スレにあった。
”省略された多少面倒な計算”って、どういう式を指しているのかな?
”I の標本数を決定する式に行き着くまで、多少面倒な計算を
行っているのですが、ここでは省略させて・・・・”
標本数はどの程度あればよいのですか
http://www.pref.saitama.lg.jp/site/toukeifaq/q1-8.html
762132人目の素数さん:2011/12/13(火) 22:12:13.61
すみません、質問させてください
他スレで質問したら、統計スレでと言われましたのでココに書かせていただきます
http://nlp.dse.ibaraki.ac.jp/~shinnou/zemi2011/ml4nlp/ml4nlp-kaneta-0603.pdf
これの14Pなのですが、MAP推定の目標関数は、
logP(θ)+logP(D) = (α-1)Σlogp .....
の部分の変形が理解できません
このP(θ)はどこから来ているのかと、どのような変形または式からこの変形へ至っているのでしょうか?
763132人目の素数さん:2011/12/14(水) 17:41:44.41
エクセルで無相関検定ってできない?
764132人目の素数さん:2011/12/14(水) 23:51:08.42
日本人の統計学者の研究って実際に役に立ってるんですかね?
統計学の文献見てても日本人の名前が出てこないのですが
765132人目の素数さん:2011/12/15(木) 00:05:13.02
>>764
Akaike, Hirotugu (1974). "A new look at the statistical model identification". IEEE
Transactions on Automatic Control 19 (6): 716–723.
とか。
766132人目の素数さん:2011/12/15(木) 00:07:42.25
確かにAICは海外の論文でもよく目にする
767132人目の素数さん:2011/12/15(木) 00:34:44.98
伊藤の公式とか。有名すぎるか。
768132人目の素数さん:2011/12/15(木) 01:10:16.82
日本の統計学が、なぜ世界的に認められているのか?というと、
北川敏男の功績が大きいのだと思う。
769132人目の素数さん:2011/12/15(木) 21:49:09.89
分散って単なる副産物であって、その数値自体には使い道ないって解釈あってる?
770132人目の素数さん:2011/12/16(金) 00:11:41.54
比較以外にはないね。あと平方根をとって標準偏差にするか。
771132人目の素数さん:2011/12/16(金) 02:08:25.96
>>769
>>770
えええええーーーー!
おまいらアタマ大丈夫か?
視野が狭いというか、なんというか、、、
772132人目の素数さん:2011/12/16(金) 20:10:22.87
>>771
わからないから聞いているんだ。
教えてくれないか?
773132人目の素数さん:2011/12/16(金) 20:19:15.69
>>765>>766
2009年夏に亡くなられた赤池情報量基準(AIC)で著名なこの方ですね。
訃報 元所長赤池弘次先生 平成21年8月4日逝去 享年81才
http://www.ism.ac.jp/news/2009/announce/index.html
774132人目の素数さん:2011/12/16(金) 22:32:49.86
>>772
ファイナンスや工学部ならすぐわかるはず
なんだよなあ。
どこの学部なんだろ?
まあ、統計学を使う仕事につけばわかるよ。
つけないだろうけど。
775132人目の素数さん:2011/12/17(土) 00:22:52.24
すぐ分かるんなら具体例を書いたらどうだ?
標準偏差でなく分散の大きさを直接使う例だぞ。
比較もしないからF検定もだめだぞ。
776132人目の素数さん:2011/12/17(土) 03:44:49.99
Hestonさんは確率変動分散をモデル化したけどね
777132人目の素数さん:2011/12/17(土) 09:24:54.41
おっさんって否定はするけど例は出せないっていうもが多いよね。
778132人目の素数さん:2011/12/17(土) 10:06:59.47
>>776
それも実際の確率微分方程式に組み込んでるのは標準偏差だよね。
779132人目の素数さん:2011/12/17(土) 10:40:43.79
いんや、varianceをもでるかしたのがヘストンモデル
780132人目の素数さん:2011/12/17(土) 12:00:47.41
価格の方じゃなく分散そのものに確率微分方程式を持ち込んでるのか。
まあでも相対的な変動を見ているんであって値そのものに
関心があるわけではないんだろうけどね。
781132人目の素数さん:2011/12/17(土) 17:22:32.34
高校数学からの橋渡しとして
西岡先生?の単位が取れる統計ノートって本が、良さげにみえるのですが。
実際、使ってる人読んだ事のある人、いらっしゃいますか?
782132人目の素数さん:2011/12/17(土) 17:32:28.55
高校数学からの橋渡しは、数学Bの統計と数学Cの確率と統計w
どうせ、受験科目として勉強してないだろ。
783132人目の素数さん:2011/12/17(土) 19:39:20.46
あのー、初心者なんですけど、
分散とかも比較にしかつかえないなら、
平均値も比較にしかつかえないですよね?
そういうこというと現実の数値は全て
比較にしかつかえないなーと思いました。
784132人目の素数さん:2011/12/17(土) 23:49:35.89
比較って相対的なものだよ。
平均値は目標値があったりとか絶対的な値に意味があるよ。
785132人目の素数さん:2011/12/18(日) 11:10:56.02
>>737
>きちんと抜き出すなら2000人もやれば十分・・・・・・
母数の国民1億余人に対し、標本数2000人で十分というのは、許容誤差は何%でなのですか?
世上で、基準値500ベクレル超え福島県産出荷米発覚が問題になっていますが、これは
48市町村1174地点という出荷前標本調査の標本数が過少だったからだったのでは?
”48市町村1174地点で放射性物質の抽出検査を実施。全地点で基準値を下回り、10月12日、
安全宣言して新米の流通を全面解禁・・・・・・”
http://www.kahoku.co.jp/spe/spe_sys1071/20111203_01.htm
786132人目の素数さん:2011/12/18(日) 12:30:17.22
分散をσ^2 と表したりs^2 と表したり見かけますが、どちらが一般的でしょうか?
787132人目の素数さん:2011/12/18(日) 14:36:54.84
>>786
西日本の大学の統計教科書では、それぞれσ^2は母分散、s^2は標本分散と書き分け
表わすとされていますね。μが母平均、xバーが標本平均と同様ですね。
788132人目の素数さん:2011/12/18(日) 15:20:12.34
ありがとうございました。よくわかりました。
もし、よろしければ、高校数学スレで確率変数の質問してますので。
そちらも…
789132人目の素数さん:2011/12/18(日) 15:55:13.62
>>785
> 48市町村1174地点という出荷前標本調査の標本数が過少だったからだったのでは? 

48市町村1174地点というのは無作為抽出ではありません。
これで信頼性を高めるには、「多いところは意図的に外す」ができないくらい多く
かぎりなく全数調査に近いことをしなければ標本数は足りないでしょう
790132人目の素数さん:2011/12/18(日) 16:26:16.19
>>785
母数が国民全部なら±2.5%あたりで十分な調査などいくらでもあると思うが
どのような調査を考えているのか?
791132人目の素数さん:2011/12/18(日) 17:00:20.33
>>787
東日本は違うのか?w
792132人目の素数さん:2011/12/18(日) 17:07:44.16
西日本 という大学はあるが (短期大学だが)
東日本 という大学はない (東日本のつく大学はある)
793132人目の素数さん:2011/12/18(日) 21:50:32.05
>>787
普通はそれが一般的な表記だろう。
U^2については本によって分かれるけどね。
794132人目の素数さん:2011/12/18(日) 21:54:57.36
>>769
分散を評価しないと良い結論は言えないよ。
大学学部程度だとあまりわからないかもですが。
795132人目の素数さん:2011/12/18(日) 22:14:46.99
そういう意味では、分散がわからないと
分布がわからないから、
確率計算がなにもできくなる。
796132人目の素数さん:2011/12/18(日) 22:32:58.43
多変量になるとさらに共分散、相関係数なんかも
重要になるのでね。
行列代数も詳しくないとだめですよ
797132人目の素数さん:2011/12/18(日) 22:52:29.37
>>756
数学特に線形代数もわかんないで
数理統計なんかできないわ。
理論をちゃんとやらないで利用だけするなら
そうすればいいけどそれだったらテレビやネットの
いいかげんな世論調査とかアンケートの結果と変わんないでしょ。
798132人目の素数さん:2011/12/18(日) 23:24:40.23
世論調査がいいかげんとは。

本気で言っているのか。
799132人目の素数さん:2011/12/19(月) 00:28:43.35
>>794
話がずれている気がする。
相対的な評価はするでしょ。
数値自体ってそれを100にしたいとかそういうことではないのか?
ばらつきの制御自体は考えるけどその場合はやはり標準偏差だな。
共分散もそれを直接使う例があったら教えてほしい。
普通は相関係数にしてしまうよな。
800 忍法帖【Lv=8,xxxP】 :2011/12/19(月) 00:42:39.41
801猫は馬鹿潰し ◆MuKUnGPXAY :2011/12/19(月) 00:59:17.97
今ソレを煮てるワ。仕上がりは明日やけんどナ。


802猫はぱァ〜 ◆MuKUnGPXAY :2011/12/19(月) 01:50:47.03
今夜の調理はもうシマイや。そやしそろそろ寝るとスルかね。


803132人目の素数さん:2011/12/19(月) 09:47:09.11
統計の分散がs^2 で確率変数の分散がσ^2 でない?
804132人目の素数さん:2011/12/19(月) 10:03:58.59
>>803
母分散,標本分散の定義見てみればわかるでしょ?
805132人目の素数さん:2011/12/20(火) 00:41:22.68
>>798
「いいかげんな世論調査」にそういう文句をつけるということは
「世論調査はすべて正しく厳密に行われている」よいう反論ということでよろしいか?
806132人目の素数さん:2011/12/20(火) 00:47:36.12
世論調査の標本のとり方、質問文、結果の処理に恣意性がはいる可能性はあるな
807132人目の素数さん:2011/12/20(火) 00:57:55.73
世論調査を厳密にするのは不可能だし、する必要もない。
かといって調査を捏造するほど、いいかげんなことはしていない。

バラツキはあるが、各社どこも似たような結果なのが証左。
808806:2011/12/20(火) 01:01:33.94
>バラツキはあるが、各社どこも似たような結果なのが証左。
違うだろ、新聞の色が出ているだろ。
809132人目の素数さん:2011/12/20(火) 01:36:07.20
テレビとかはよく、
ランダム・デジット・サンプリング、層化二段無作為抽出法
なんかを使ってるけど回収率とかも見てもどれほどいい結果かは
言いにくいでしょ。
やってるところがどんな結果がほしいかで誘導することも多いだろうし。
810132人目の素数さん:2011/12/20(火) 09:10:05.88
>>807
> 調査を捏造するほど、いいかげんなことはしていない。 

どうしてそう信じられるの?
811132人目の素数さん:2011/12/20(火) 09:31:31.03
以前ある会社に勤務してた時、顧客からボーナス等の金額のアンケート取ってその調査結果を新聞発表してた
でもそのアンケートのほとんど社員がねつ造したものだった
実話です
812132人目の素数さん:2011/12/20(火) 10:47:27.42
>>811とは別人だけど
大手の企業がアンケートを取る時には、関連会社経由でとることが多い。

で、たいがいは関連会社は自社に登録している客の情報を利用してアンケートを実施する。

なので、金融機関系のシンクタンクだと、サンプルが偏っていることが多い。

まあ、その会社の商品開発ならいいんだけど、それを一般的な調査結果のように公表することも多い。
813132人目の素数さん:2011/12/20(火) 13:33:30.20
>>810
選挙があるから。少しは新聞読んだら?
814132人目の素数さん:2011/12/20(火) 13:57:09.08
>>813
選挙があることが
世論調査は厳密に進められることはしないと
信じられる理由になるのか?
それが新聞に書いてあるのか?
815132人目の素数さん:2011/12/20(火) 13:58:26.29
× 世論調査は厳密に進められることはしないと 

○ 世論調査は厳密に進められると 
816132人目の素数さん:2011/12/20(火) 14:00:04.19
こうじゃね?

選挙があることが 
世論調査は捏造なしに進められると 
信じられる理由になるのか? 
それが新聞に書いてあるのか?

 
817132人目の素数さん:2011/12/20(火) 14:00:28.30
だな
818132人目の素数さん:2011/12/20(火) 15:48:48.85
>>814
信じられる理由になるわけないだろ。
ちゃんと新聞各社ばらつきあるだろ。だから厳密ではないと言い切れる。
しかし、各社の推移を見ると、相関性が高く、選挙結果との相関性も高い。

だから、厳密ではないが、いいかげんでもない。統計学的に明らかだと思うが。
819132人目の素数さん:2011/12/20(火) 16:02:28.19
>>統計学的に明らかだと思うが。
もう少し統計学的な発言ができませんでしょうか?
820132人目の素数さん:2011/12/20(火) 16:09:57.25
>>819
分散と相関係数ぐらい自分で計算しろよw 初心者すぎだぞ>
821132人目の素数さん:2011/12/20(火) 16:20:28.03
>>818
それが信じられる理由でないなら、
世論調査がいいかげんではないと
信じられる理由は何なんだ?

極端な話をすれば、 前日の他誌の発表を元に自社の捏造分を混ぜて
今日の原稿を書いたら、相関性が高く、選挙結果との相関性も高いものに
なるぞ。 

822132人目の素数さん:2011/12/20(火) 16:32:36.19
>>820
おまえ、相関と分散くらいしか知らないんだろ
だから>>818のようなアフォなことが書ける
823132人目の素数さん:2011/12/20(火) 16:40:53.46
>>822
なら各社新聞社の世論調査がいいかげんなことを、統計学的な分析と結果をお願いします。
しかも、相関、分散以外の高度な統計とやらで。
824132人目の素数さん:2011/12/20(火) 16:43:03.15
お、話を逸らしたな
825132人目の素数さん:2011/12/20(火) 16:50:12.32
例えばフェルミ推計も併せてでも推論するならともかく>>818レベルじゃなw
どの社も通常サンプル数も公表してるんだから信頼水準を適当に設定して
各社間の差を比較評価するとか書けば尤もらしい意見になると思うんだがな
どうだい>>823
826132人目の素数さん:2011/12/20(火) 17:00:22.55
>>825
分析結果まだ〜?
なんで各社の世論調査はいいかげんだと証明しないの〜?


まさか計算方法しりませんとかないよね?
827132人目の素数さん:2011/12/20(火) 17:17:55.61
>>825
言ってる意味が分からない。
いいかげんさを証明するのに、フェルミ推定というさらにいいかげんなものを推論して何がしたい?
828132人目の素数さん:2011/12/20(火) 17:24:08.25
>>822
随分と時間がかかるな。さっさと分析結果張れよ。
まさか逃げ出したんじゃないだろうね。最低のゴミくずだな、おまえ。
829132人目の素数さん:2011/12/20(火) 17:27:37.77
>>826
いい加減かもしれないし正しいかもしれないんだが
おまえは正しいと主張している
酔って証明をすべきなのはおまえな
830132人目の素数さん:2011/12/20(火) 17:29:08.49
>>827
薄い根拠で「新聞社は正しい」と主張するよりは”遥かに”ましになるだろ
それもわからんか?
831132人目の素数さん:2011/12/20(火) 17:29:27.24
832132人目の素数さん:2011/12/20(火) 17:30:48.69
>>829
おれは既に計算済みで結果のコピペ準備して、
おまえの回答待ってんだが。
833132人目の素数さん:2011/12/20(火) 17:38:51.02
>>830
分かるわけないだろ。おまえの妄想問題なんか。
勝手に問題変えるな。誰もそんなこと話してないだろ。頭おかしいのか?

新聞社は正しいではなく、
世論調査は厳密ではないが、いいかげんでもないってことだ。
ほんと馬鹿ほど妄想で勝手な解釈するから困る。
834132人目の素数さん:2011/12/20(火) 17:42:46.69
あれ?論点は捏造があるかどうかじゃっ?
835132人目の素数さん:2011/12/20(火) 17:46:55.91
世論調査が捏造ってネトウヨかよw
836132人目の素数さん:2011/12/20(火) 17:47:41.05
>>833
おい、論点すりかえるなよ
837132人目の素数さん:2011/12/20(火) 17:50:00.98
答えまだ〜?
838806:2011/12/20(火) 18:09:42.03
>>798
1.世論調査が正しいことを検定する
2.世論調査が間違っていることを検定する
は違うだろ。言い出しっぺが1を統計的に実行してみせるのが筋じゃねー。
839132人目の素数さん:2011/12/20(火) 18:15:38.55
だな。言い出しっぺがまずは証明すべき。
世論調査をいいかげんと言ったのは >>797
840132人目の素数さん:2011/12/20(火) 18:30:42.65
各社世論調査比較。
http://blog-imgs-31-origin.fc2.com/2/c/h/2ch774/439-227.jpg

相関性が全くなく世論調査はいいかげんですね。とはとても言えませんね。
841132人目の素数さん:2011/12/20(火) 18:35:59.36
ソースが二種類あってそれをもとに各社がそれぞれ捏造した結果に見えるんだが
842132人目の素数さん:2011/12/20(火) 18:39:00.35
字が読めないんですね。分かります。
統計学学んでるなら、このグラフを見ただけで何のグラフか分かるはず。
843132人目の素数さん:2011/12/20(火) 18:50:39.32
>>822
さっさと分析しろよ。

おまえはどんだけアフォなんだよ?w
844132人目の素数さん:2011/12/20(火) 18:57:34.51
世論調査はいいかげんで捏造なのに、
なんで思想、哲学の違う各社に相関性が高かったり、分散が小さかったりするんですかね?

しかも大阪地方選のときも投票開始0分でズバリ的中。
本当に捏造でいいかげんなのでしょうか。


なぜ捏造でいいかげんなのか証明してほしいものです。
逃げてばかりのお馬鹿さんに言ってるのですよ。
845132人目の素数さん:2011/12/20(火) 19:18:31.49
>>840
順位の動きを見ると傾向があるので、統計的にはデータをいじってる可能性が高いって結果でしょ。

メンデルの遺伝の実験データがおかしいと、フィッシャーが指摘したのと同じかな。
846132人目の素数さん:2011/12/20(火) 19:29:00.08
>>845
調査方法、サンプル範囲が違うから当然そういう傾向が出る。
報道2001は首都圏のみとか。あるいは固定電話世帯のみとか。

というか早く世論調査はいいかげんで捏造したものという分析してくれよ。

ほんといつも逃げてばかりだな、おまえ。
847132人目の素数さん:2011/12/20(火) 19:31:57.17
まず捏造はないということを証明しろや
あの図が証明なのかw
恥ずかしい奴w
848132人目の素数さん:2011/12/20(火) 19:33:52.97
どうやって証明するんだ?w
フィッシャーだって証明できてないw
849132人目の素数さん:2011/12/20(火) 19:43:24.83
>>847
まずは捏造であることを証明しろ。捏造と言い出したのはおまえだ。
850132人目の素数さん:2011/12/20(火) 19:46:41.71
ぼくは捏造は無いとは言えないと主張しているだけ
証明の義務はない
851132人目の素数さん:2011/12/20(火) 19:56:49.04
>>841
>捏造した結果に見える
>捏造した結果に見える
>捏造した結果に見える
852132人目の素数さん:2011/12/20(火) 20:14:35.36
捏造かどうかなんて、
各社の世論調査にニコニコの調査もプロットすればすぐ分かるよ。

ネトウヨはいつもニコニコ以外の世論調査は捏造って言ってるからね。
本当なら有意な差が出るはず。
853132人目の素数さん:2011/12/20(火) 20:22:15.45
>>850
馬鹿かおまえは。
854132人目の素数さん:2011/12/20(火) 20:25:53.51
>>853
おまえよりはましだけどな
855132人目の素数さん:2011/12/20(火) 20:44:23.48
見つけたよ。確かに捏造疑惑があるな。


東京都都議選に関係する世論調査(どの政党の候補に投票しますか?)
         自民   民主  サンプル数
毎日新聞   13%  26%   1063
朝日新聞   15%  28%   999
東京新聞   20.3% 32.5% 1529
ニコニコ動画   31.1% 11.8% 12507

NHK出口調査 26%  44%

現実の都議選得票率 25.9%  40.8%
856132人目の素数さん:2011/12/20(火) 21:19:57.44
実際の投票には行かない可能性があるので自民と民主の比率のみが正しいとすると
適合度検定で棄却されないのは東京新聞、朝日新聞の2つになるな。
毎日新聞は棄却されるがp値0.022で、ニコニコ新聞はほぼ0。
ニコニコ動画は、東京都の選挙権を持たない人がいるからだろう。
857132人目の素数さん:2011/12/20(火) 21:24:09.88
ニコニコ新聞ってw 自分でワロタ
858132人目の素数さん:2011/12/20(火) 21:46:48.05
>>855
ニコ動見てる人は関心ある人ばっかだから
偏ってしまうからなぁ。
まあ個人的には結果に納得するがw
859132人目の素数さん:2011/12/20(火) 23:15:52.58
>>797>>858
世論調査はいい加減で捏造とか否捏造はないとか、理系学問板なのに主観評言の
横溢洪水ですね。
数学板らしく最適標本数算出式>>761の数理的な可否などを、論じませんか。
860132人目の素数さん:2011/12/20(火) 23:56:38.43
>>859
そうですねぇ
サンプルサイズ計算しないとだめね
861132人目の素数さん:2011/12/21(水) 03:48:24.71
分散すら計算することから逃げる人たちです。
議論はできないでしょう。
862132人目の素数さん:2011/12/21(水) 08:24:40.93
>>859
おいおい、検定は主観じゃないだろ。

>>860
サンプルサイズぐらい誰でも計算できるだろ。
支持率20%を信頼幅2%で予測するための人数は1536。
この人数で支持率が10%だと信頼幅約1.5%。
各新聞社の調査は人数だけなら十分とれているよ。
863132人目の素数さん:2011/12/21(水) 08:28:48.63
おっとこれも書いとかないと文句出るんだろうな。
>>855の2社は約1000人の調査だけど信頼幅は支持率20%で2.5%を目指したんだろうね。
自民と民主で支持に差があることはこれで十分にわかる。
864132人目の素数さん:2011/12/21(水) 08:41:10.77
信頼幅2%?
なにそれ?
865132人目の素数さん:2011/12/21(水) 15:55:48.76
N=30 α=0.05 のときの(片側検定)Z値とt値てどうやってもとめるんですか?
誰かやり方だけでいいので教えてください
866132人目の素数さん:2011/12/21(水) 18:48:49.45
>>823
いい加減だという証明がないことが
いい加減な世論調は存在しないという証拠になるのだ
という主張ということでよろしいか?
867132人目の素数さん:2011/12/21(水) 18:51:55.07
>>839
797は「(すべての)世論調査がいい加減」 と 言っているのではなく
「いい加減( 形容されるある)世論調査」についての話をしているのだが
868132人目の素数さん:2011/12/21(水) 20:40:05.89
>>840 をみて
いいかげんだから世論調査は信用できないというほうが稀だろう。

この程度のバラツキでいいかげんだから許せない人ってここにいるの?
869132人目の素数さん:2011/12/21(水) 20:53:43.77
論点がずれてる
も少し上からきちんと読め
870132人目の素数さん:2011/12/21(水) 22:21:44.85
>>864
信頼区間の幅が±2%ってことだろ。
871132人目の素数さん:2011/12/22(木) 00:25:38.82
>>865
それだけの情報だと何がしたいか伝わらんよ
片側検定って言ったっていろいろあるんだよ
872132人目の素数さん:2011/12/22(木) 01:28:14.22
>>868
なぜ、「いいかげんな世論調査」 の話題に
「すべての世論調査はいい加減で信用出来ないというのはおかしい」と乗っかってくるんだ?
必要条件と十分条件の違いとか、∃と∀の違いとかわかってるか?
873132人目の素数さん:2011/12/22(木) 02:02:28.34
一人で勝手に話題を限定したがる人がいるな。
874132人目の素数さん:2011/12/23(金) 02:25:18.71
とりあえず他人の言葉を否定したくてしょうがない人がいると話がややこしくなる
875132人目の素数さん:2011/12/24(土) 13:25:04.72
>>870
信頼幅という用語を>>864氏同様初めて目にしたが、言われるように信頼区間の幅の
意味のようですね。
統計教科書本でも見た記憶がないが、信頼率、信頼度、信頼水準、信頼区間、
信頼上(下)限同様に、JIS規格の用語集には掲載されているのかな。
876132人目の素数さん:2011/12/25(日) 01:41:21.02
どこで聞けばいいのか分からないのでここで質問させてください。

正規分布のような分布なのだけど、偏っている分布で、数学的に美しいのはどういうものになるのでしょうか?

正規分布は

*
**
***
**********
***********
**********
***
**
*

こんなのですが、私が求めているのは

*
**
**********
***********
**********
***
***
**
**
*
*

こんな感じで偏った正規分布みたいな形です。よろしくお願いいたします。
877132人目の素数さん:2011/12/25(日) 02:42:02.58
>>876
範囲がどこからどこで考えているのかわからないですけど
そのような形ならば
カイ2乗分布か、F分布だと思いますよ
878132人目の素数さん:2011/12/25(日) 06:24:26.30
>>876
そういう分布はありません。
879132人目の素数さん:2011/12/25(日) 06:53:49.98
>>876 ポアッソン分布も有力候補に挙げられると思いますよ。
880132人目の素数さん:2011/12/25(日) 15:49:58.85
>>862
>支持率20%を信頼幅2%で予測するための人数は1536。
>この人数で支持率が10%だと信頼幅約1.5%・・・・・・・
これらの算出には、どういう算出式を使われたのですか?
881132人目の素数さん:2011/12/25(日) 19:06:57.47
882132人目の素数さん:2011/12/25(日) 22:08:32.60
>>877
>>879
バカなことを書かないように。
883132人目の素数さん:2011/12/25(日) 23:26:39.70
>>882
では優秀なお方、お答えは??
884132人目の素数さん:2011/12/25(日) 23:43:17.00
相関係数の検定ってどうやるんですか?
885132人目の素数さん:2011/12/26(月) 01:11:05.70
>>876
対数正規分布もある
886132人目の素数さん:2011/12/26(月) 10:26:06.73
>>875
信頼幅って言葉はあるみたいだけど信頼区間の幅というのが正しい定義みたいだよ。
だから>>862の最初は4%の間違いだね。

>>880
二項分布の正規近似による信頼区間で簡単に確認できたけど?
887132人目の素数さん:2011/12/26(月) 23:54:24.26
すみません
大学で統計学を学んでいるのですが
質問させてください

第2種の誤りを犯す確率を小さくする方法として
「有意水準を大きくする」
以外に何がありますか?
888132人目の素数さん:2011/12/27(火) 08:36:08.48
>>887
データの バラツキ(分散σ)を減らすことと、データの数(n)を増やすことによって第二種の過誤を少なくすることができます

http://staff.aist.go.jp/t.ihara/confidence.html
889132人目の素数さん:2011/12/27(火) 21:11:45.34
すみません。統計学を勉強し始めたばかりのものなのですが、
「標本の数と大きさ」の違いでいきなり躓いてしまいました。
これはとある問題なのですが、

Q、標準的な統計学の試験問題についてある母集団から
無作為に抽出した学生を対象として解かせてみたところ、得点は次のようになった。
22,27,36,38,40,46,51,58

Q1,この標本の数と大きさを答えよ

標本の数は8だと思うのですが、大きさについての求め方がわかりません。
どなたかご回答をお願いしますm(__)m
890132人目の素数さん:2011/12/27(火) 21:41:02.74
数は 1 で大きさは 8かな?
891132人目の素数さん:2011/12/27(火) 22:00:25.01
>>890 ご回答ありがとうございます。質問なのですがなぜ数が1なのですか?

1というのはどこから来たものなのでしょうか?
892132人目の素数さん:2011/12/27(火) 22:02:01.34
ベイズの入門的な本を読んでわからなくなりました。
1/5の確率で当たるカードを二人めくるゲームです。まず二人がそれぞれのカードを選びます。
一人目をめくります。ハズレでした。
次にもう一人がめくる番ですが、最初のカードがハズレだと確認したあとに、選んでいたカードと別なカードを選び変えてしまいました。
そのカードを開くと当たりだったのです。
ベイズ理論によると、二人目の行動により当たる確率が高くなったそうですが。


うんなことあるかいな?


そうなると、くじを戻さないくじ引きならば、後で選ぶ方が確率が高くなるはずです。

どなたか説明いただけませんか?
893132人目の素数さん:2011/12/27(火) 22:08:56.47
>>891
こういう抽出(試行)をもういちどやれば、2になる。
894132人目の素数さん:2011/12/27(火) 22:19:54.71
>>893 ご親切に解説していただき、ありがとうございましたm(__)m
895132人目の素数さん:2011/12/27(火) 22:37:05.98
>>892
オレもこういうの、苦手なんだが。まず 2枚ひいたところで、オレの当たり確率は
1/5, 相手も 1/5。山にあるのが 3/5(つまりオレの札が外れの確率は 4/5)。相手が
はずれを開いた段階で、オレの札の確率は依然として 1/5だが、山の 3枚のおのおの
は、4/5 * 1/3 = 4/15の確率に増える。1/5 < 4/15 だから、そっちに
くらがえしたほうが有利となる。
896132人目の素数さん:2011/12/27(火) 22:46:04.03
ありがとうございます。
凄く理解したけど納得いかないーw
因みに、これはベイズの話でもなく一般的な確率の考えでも同じでしょうか?
897132人目の素数さん:2011/12/27(火) 22:46:52.44
者ティホール問題の亜型だな
898cheese ◆pMONpHJxkARi :2011/12/27(火) 22:49:00.90
>>893 stage の数を標本の数と呼ぶのは初耳です。
標本の大きさも標本数も同じ意味ですよね。
899132人目の素数さん:2011/12/27(火) 22:52:12.24
>>898
呼びかたに、いろいろ流儀があるらしい。
http://blog.livedoor.jp/yahata127/archives/51615946.html
900cheese ◆pMONpHJxkARi :2011/12/27(火) 22:55:57.36
ちょっとぐぐってきました。
>>899 リンクありがとうございます。
標本の大きさが100(100個の標本)が3セットあるとき
標本の数は3セットあるということなんですね。
stageの数とは全然関係ありませんでした。(二段階抽出の話かと思ったので)
901132人目の素数さん:2011/12/27(火) 23:00:40.64
>>896
現実問題として、こうなるらしい。オレもいまだに納得いかん。
902132人目の素数さん:2011/12/27(火) 23:04:05.66
ありがとうございます。
納得いかないので、エクセルでシミュレーションしてみます。
903132人目の素数さん:2011/12/27(火) 23:06:36.87
くじを戻さないくじ引きとは関係ないみたいですね…
904132人目の素数さん:2011/12/27(火) 23:32:36.51
>>888
なるほど

ありがとうございます
905892:2011/12/27(火) 23:54:34.69
エクセルでこの問題をテストしようと思けど、、明日朝から帰省だったので。
また後日。。(確率スレの方が良かったかしら。)

でも、相手がハズレを引いた段階で山の3枚、「オレ」の1枚をそれぞれ対等に1/4になった、
と考えるのがまだ正常に思うけど。

と思ったら、先にカードを開く方が1/5で、後に開く方が1/4になるってのも。。
906132人目の素数さん:2011/12/28(水) 00:23:02.20
>>905
> 先にカードを開く方が1/5で、後に開く方が1/4になるってのも。
相手は単にカードを開くのじゃなくて、「オレのコントロールできない 4枚の
中から、外れカードを一枚持ち去った。結果、山に残ったカードの当たり
確率は濃縮された」と考えるみたいなんだな。
907892:2011/12/28(水) 00:33:35.57
>>906 ありがとう。うーむ。

>>897さんの、モンティホールでぐぐってみたら説明があった。
「論」ではなくて「実証」されてるんですね。
こんな単純で面白いモデルが、高校確率で扱わなかったのはなぜだろう。
908132人目の素数さん:2011/12/28(水) 10:06:44.72
高校でベイズの定理は習わないだろ。
909132人目の素数さん:2011/12/28(水) 10:45:56.15
Bayesは難しいが今の主流だからなぁ
910132人目の素数さん:2011/12/28(水) 11:06:28.00
中畑が監督では厳しいだろうな
911132人目の素数さん:2011/12/28(水) 11:20:36.12
中畑じゃなくても厳しいだろ
912132人目の素数さん:2011/12/28(水) 12:24:06.27
>>886
>信頼幅って言葉はあるみたいだけど・・・・・・・
会社で、”JIS Z8101 統計−用語と記号”を見ましたが、”信頼幅”は載っていないですね。
正確には、信頼区間の幅というべきでしょうね。
913132人目の素数さん:2011/12/28(水) 13:25:31.30
>>903
くじを戻さないくじ引きと、相手がハズレと分かった上で、引くくじを変える行為に、違いを感じないんだが。

例えば、二人が5本のくじを引くとして、それぞれ心の中で、引くくじを決めていたとする。(特に引くくじを宣言するわけでない。)
一人目がハズレで、二人目が気が変わって最初に思っていたくじとは別なくじを引く。
この時に、二人目が当たる確率はもはや1/5ではないと?
914132人目の素数さん:2011/12/28(水) 13:41:26.92
>>909
ビルゲイツがほめたベイズの定理という本のカバーがあったなー
915132人目の素数さん:2011/12/28(水) 13:48:09.30
ん、くじ引きの時は前もって引くくじを決めていて、実際のくじを引く場面(二番手以降)では、それではないくじを引く事にすればいいんだな。
(?_?)

先行不利?
(?_?)
916132人目の素数さん:2011/12/28(水) 16:41:16.99
Bayes流が讃えられているってことは
マルコフ連鎖も素晴らしいってことだよね
917132人目の素数さん:2011/12/28(水) 22:14:29.21
手元に一つのサイコロがある時、このサイコロに偏りがあるかどうかを調べるため、
サイコロを10000回投げて1の目が何回でたかを数えることにする。

1,「このサイコロに偏りがない」というためには1の目の出る回数は
   何回から何回の間でなければならないか?

2,「このサイコロは1の目が出やすい」というためには1の目が出る回数は
  何回以上でなければならないか? なお、有意水準は5%とする。

大学の統計学の問題でわからなくなってしまいました。どなたかご教授ください。
よろしくおねがいします。
918132人目の素数さん:2011/12/28(水) 22:24:26.17
>>912
別にすべての統計用語がJISに載ってるとは限らないだろ。
クロス集計表とかも載ってないぞ。
まあマイナーな言葉は使わないのがよいというのは分かるが。
919132人目の素数さん:2011/12/28(水) 22:47:00.83
intervalを幅と訳せば信頼幅だな
920132人目の素数さん:2011/12/29(木) 08:59:42.27
>>880>>862>>855
標本数算出式は以下の式なのでしょうが、このような政党支持調査の場合、
このどちらの式を適用するのですか?
対象母集団を(1)有限、(2)無限のどちらと看做すのですか?
標本はいくつ集めたらよいか 
http://www.ceser.hyogo-u.ac.jp/naritas/spss/sample_size/sample_size.htm
921132人目の素数さん:2011/12/29(木) 10:59:57.92
>>917 1の目だけを議論しても、偏りが無いなんて断定出来まい

その問題(1)を出した先生はアホ
922132人目の素数さん:2011/12/29(木) 13:04:38.22
>>917

>>921 の言うのももっともだが、1の出る確率を 1/6として、

1ばかり出る 1回連続 0.167 2回連続 0.028 3回 0.005
1が出ない 1回目 0.833 17回目 0.045 26回目 0.009
923132人目の素数さん:2011/12/29(木) 13:07:06.78
>>892
> ベイズ理論によると、二人目の行動により当たる確率が高くなったそうですが。

ならないならない。
これはモンティホールとは根本的に違う。
924132人目の素数さん:2011/12/29(木) 13:16:00.82
>>917
> 大学の統計学の問題でわからなくなってしまいました。どなたかご教授ください。

とりあえず、どこまで分かって、どの辺りで分からなくなってるのか説明してくれ

それから10000回投げて1の目が10000回出たら、「このサイコロおかしいだろ」って言うと思うけど、
それを数学的に述べてみてくれ。

どの程度理解してるのか分からないと、説明のしようがない
925132人目の素数さん:2011/12/29(木) 13:20:55.11
>>923
何が違うか言ってミ?
926132人目の素数さん:2011/12/29(木) 13:35:44.74
>>925
> 何が違うか言ってミ?

ふつうのクジは1人目が当たる可能性がある。
モンティホールの司会者は100%ハズレを引く。
927132人目の素数さん:2011/12/29(木) 14:28:03.82
>>926
> モンティホールの司会者は100%ハズレを引く。

この例題の対戦相手も 100%はずれを引く運命のもとにあったのかもしれない。
あるいは、実はイカサマをやっていて、相手に勝たせたかったのかもしれない。
どれが当たりか知っていたと称するモンティも、この相手も、客観的事実は
単にはずれを引いたということだけ。
928132人目の素数さん:2011/12/29(木) 15:33:25.34
>926,927

統計学的には926が正しい。

「運命」とか「いかさま」をいいだすと、統計学の問題のほとんどが成り立たない。

とくに断らない限り、試行はi.i.d.とし、それを客観とする。
929132人目の素数さん:2011/12/29(木) 15:39:43.01
一回目でハズレた事象は、意図的だろうと意図的でなかろうと二人目にとっては変わらない。ってこと?
930132人目の素数さん:2011/12/29(木) 15:44:43.89
っていうか。
やっぱり、取り替えた方が確率高くなるの?
931132人目の素数さん:2011/12/29(木) 16:15:17.07
いかさまも運命もないというなら、別に札は替えなくていいんじゃない?
932132人目の素数さん:2011/12/29(木) 16:54:04.97
ありがとうございます。つまり確率は、1/5ですね。
933132人目の素数さん:2011/12/30(金) 01:38:27.35
期末の過去問で分からない箇所があるので、解き方を含めて教えてください

問:27人分のデータを得て、2変数間の相関係数を計算した。次の@〜Dの相関係数のうち、有意水準が.05のときに仮説採択と言う結論になるものを全て選べ。

@.28
A.35
B.38
C.44
D.50

934933:2011/12/30(金) 01:40:15.30
表を貼り忘れました

http://i.imgur.com/4w2wv.jpg
935132人目の素数さん:2011/12/30(金) 03:27:06.59
>>934
その表ってのは、リンクが切れているみたいですが。。。
936132人目の素数さん:2011/12/30(金) 11:52:59.54

科学雑誌Newtonによると、太陽の直径は約140万キロメートルであり、
秒速約30万キロメートルの光は5秒弱で通過できる計算になります。

しかし、太陽の中で生じた光(光子)は他の素粒子と衝突を繰り返し、
太陽の表面に達するまで平均で5,000年もかかるそうです。


【問題】

太陽の中で生じた光で太陽の表面に達するまで10,000年以上かかるものは、
太陽の中で生じた光のうち何%でしょうか?
937933:2011/12/30(金) 12:01:05.84
>>935
すみません
IEブラウザで開いて頂ければ大丈夫だと思うのですが、念のためもう1度貼ります

http://www.dotup.org/uploda/www.dotup.org2447139.jpg
938132人目の素数さん:2011/12/30(金) 15:34:30.53
>>920
実際EXCELとかで計算するとすぐに分かるだろ。
>>862で示されてた結果はそのページの無限の式で
最大誤差(信頼区間の幅の半分)=0.02
信頼率に対応する正規分布点=1.96
予想される母集団の比率=0.2
とすると得られるぞ。有権者の数はすごく多いから
有限の式は要らないんじゃないかな。

そのページでは最大誤差は0.05とすることが多いって書いてあるけど
それだとp=0.5でも384人で十分になる。
新聞社はさすがにそれよりかは多く調べてるってことだね。
1000人ぐらい調べてるってことは逆算すると最大誤差0.03という
あたりの設定かな。
結局どのぐらいの差まで見たいかに依存するので後は問題ごとに
考えるしかないよ。