1 :
名無しさん@1周年 :
02/02/04 22:21 SSJデータアーカイブから統計解析、統計学を使った シミュレーションの話しなど。
外れ値を外すだけで、どうしてこんなに相関係数が 変わるんだ、と思った。 統計学って主観が入ってしまいそうでコワイ。
ふむふむ、それで?
つーか、まともに統計を使っている人なら、そういうはずれ値のはずし方 については慎重になると思うが。 もっと言えば、偽創刊というのもあるし、結局データオンリーではなんともいえない。 その後の解釈が問題。
5 :
名無しさん@1周年 :02/02/06 00:44
>>4 もともとのデータ収集がいまいちだったのに、それを
後任で任されたものだから、不満いっぱいです。
結局、データをひとつひとつ見ないといけない。
それも人に聞きながら。
6 :
名無しさん@1周年 :02/02/06 07:47
標準偏差が何のために存在するのかわからん。
7 :
名無しさん@1周年 :02/02/06 14:38
>>6 データのばらつきをあらわすんだが。
それじゃだめか?
8 :
名無しさん@1周年 :02/02/06 16:06
>>7 たったそれだけのためにあんなメンドしい演算すんの? 何で!
(ふったーつ、みっつ、というツッコミは却下)
9 :
名無しさん@1周年 :02/02/06 16:40
>>8 標準偏差というより分散を考えたほうがわかりやすいYO
(標本)分散=平均と各データ差の二乗和をサンプル数で割ったもの
どう?わかりやすくないかね?
そいで、このままだと単位の次元が二乗されたままなんでルートでひらくと、
標準偏差。
もっと言えば不偏推定量とかそのへんの話が理論的にはからんでくるんだけど
まぁいいや
10 :
名無しさん@1周年 :02/02/06 17:12
>>9 あ、わかったよ〜な気がしてきた。
最小二乗法もあてはめられるのか…。
11 :
名無しさん@1周年 :02/02/07 12:25
偏差値ってなんで50足すの?
信頼限界値ってどんな意味を持ってるんですか? またわかりやすく解説してある本があったら 教えてください。 お願いします。
あぼーん
14 :
名無しさん@1周年 :02/02/07 19:07
そうそう、言い忘れたけど、不偏分散を単純にルートで開いても 標準偏差の不偏推定量にはならないらしい。 この話は以前、心理学板で話題になってた。 なぜそうなるかの詳細は忘れたが、数理統計の専門的な知識が必要。 以上補足まで。
17 :
名無しさん@1周年 :02/02/07 19:49
>>12 区間推定のこと.「母平均の95%信頼限界が10〜12」ということは
「95%の確率で母平均は10〜12の間にある」=「10より小さいまたは12以上
になる確率は5%」ということ.
18 :
名無しさん@1周年 :02/02/07 19:50
>>18 多分。
だって、少数点以下を使いまくるより、
50とか60とかいったほうが見栄えがいいでしょ。
ちなみに母集団を正規分布であると仮定すると、偏差値が40−60の間に
全体の約69%、30−70に約95%、20−80に約99%が入る
計算になる。
まぁ、わかってると思うが。
20 :
名無しさん@1周年 :02/02/07 23:18
>>19 ども、自分も見やすいとかそれくらいの意味かなとは
思っていたけど多分じゃなくてこうだ!!!
ってのはないのかな。
みやすいだけなら100とかでもいいような気がするし
いまさら、 素朴な疑問なんだが、なんでこの板にこのスレがあるんだ・・・?
22 :
名無しさん@1周年 :02/02/07 23:44
何で50にしたかってこと、考案者の 桑田昭三氏の本に書いてないかな? 見やすさ(わかりやすさ)の気がするが・・・
23 :
名無しさん@1周年 :02/02/07 23:47
なんか、各板で統計すれが急にできたな。
>>17 なるほど
なんかわかった気がします。
どうもありがとうございました
26 :
名無しさん@1周年 :02/02/08 20:37
あぼーん
>>26 どこでも実験・調査があれば使うと思うんだが。
むしろ心理学板のほうがわかっている人は多いと思われ。
数学板だと数学扱いされない可能性高し。
単純にシミュレーション板でコアに議論することかなーと思っただけ。
29 :
名無しさん@1周年 :02/02/09 21:06
コレスポンダンス・アナリシスって、どんなの? なんかやってることは数量化4類っぽいんだけど。
そっか。 数量化4類を理解していて、 コレスポンデンス分析のイメージもしらなかったか・・・・ まあ、あるか
あぼーん
32 :
名無しさん@1周年 :02/07/14 21:12
数値化I類 重回帰分析において独立変数が定性的 数値化II類 説明変数が名義尺度の判別分析 数値化III類 パターン分類,コレスポンデンス分類と同様で,回答者の 反応パターンに基づいて反応者とカテゴリの両方を数値化。主成分分析 に似ている。
あぼーん
あぼーん
あげ
36 :
名無しさん@1周年 :02/12/17 14:54
Umbrella Sampling Methodについておしえてください。 これは、ガウス分布に従った乱数発生アルゴリズムなの? モンテカルロ法を使ったシミュレーションでみかけるけど。
37 :
名無しさん@1周年 :02/12/17 17:57
(^^)
(^^)
40 :
名無しさん@3周年 :03/03/26 16:14
エッジワースとかサーガンとかグラム・チャーリーなんかの級数について書いてある本しりませんか?
あぼーん
(^^)
∧_∧ ( ^^ )< ぬるぽ(^^)
━―━―━―━―━―━―━―━―━[JR山崎駅(^^)]━―━―━―━―━―━―━―━―━―
__∧_∧_ |( ^^ )| <寝るぽ(^^) |\⌒⌒⌒\ \ |⌒⌒⌒~| 山崎渉 ~ ̄ ̄ ̄ ̄
__∧_∧_ |( ^^ )| <寝るぽ(^^) |\⌒⌒⌒\ \ |⌒⌒⌒~| 山崎渉 ~ ̄ ̄ ̄ ̄
∧_∧ ( ^^ )< ぬるぽ(^^)
∧_∧ ∧_∧ ピュ.ー ( ・3・) ( ^^ ) <これからも僕たちを応援して下さいね(^^)。 =〔~∪ ̄ ̄ ̄∪ ̄ ̄〕 = ◎――――――◎ 山崎渉&ぼるじょあ
(⌒V⌒) │ ^ ^ │<これからも僕を応援して下さいね(^^)。 ⊂| |つ (_)(_) 山崎パン
51 :
名無しさん@3周年 :03/12/01 19:10
母集団のこと 表記は方法が決めれば楽だし 母集団の選び方 →データ集計・抽出 →有効な表現→解への手がかり
やはり今は「データマイニング」でしょう!
54 :
名無しさん@3周年 :04/09/24 21:43:30
今統計データ解析の論文読んでる。 bifrequencyって何だ?日本語でどう訳す?
55 :
FeaturesOfTheGod ◆UdoWOLrsDM :04/09/25 15:10:04
不偏分散のルートをとっても、(母集団の)標準偏差の不偏推定量にならないって本当?
56 :
名無しさん@3周年 :04/11/08 23:11:24
回帰分析の課題が出ているのですが、 どこかお勧めのデータがあるサイトはありませんか? いろいろと探しているのですが、うまく見つけることが出来ません。 どなたか教えてください。
57 :
名無しさん@3周年 :04/11/09 19:02:48
尤度 ↑ これなんて読むのですか? 「もっど」でつか?
58 :
名無しさん@3周年 :04/11/09 20:22:28
ゆうど
59 :
名無しさん@3周年 :04/11/10 05:57:15
>>58 本当にありがとうございます。
ついでに質問を追加してもいいですか?
「尤度」はなんという英語の訳語なのでつか?
>>59 Likelihood
先生は悲しみのあまり、涙で「いぬど」と読んでしまったぞ
61 :
名無しさん@3周年 :04/11/11 17:56:14
課題で多変量解析を使って分析を行ってみる っていうのがあるんですが 何かおもしろそうなネタないですかねえ? クラスター分析や因子分析あたりを使ってみようとは思ってますが。 あったら意見いただけると助かります。
63 :
名無しさん@3周年 :04/12/07 09:13:33
分散状況を計算したいんだが? ググッタが良くワカンネ。何か教えてくだされ
64 :
名無しさん@3周年 :04/12/18 11:17:39
推定可能関数とは、ようするに線型関数なのでしょうか?
語るっていうより、尋ねるスレだね
...これからも僕を応援して下さいね(^^)。 ━―━―━―━―━―━―━―━―━[JR山崎駅(^^)]━―━―━―━―━―━―━―━―━― ∧_∧ ピュ.ー ( ^^ ) <これからも僕を応援して下さいね(^^)。 =〔~∪ ̄ ̄〕 = ◎――◎ 山崎渉 __∧_∧_ |( ^^ )| <寝るぽ(^^) |\⌒⌒⌒\ \ |⌒⌒⌒~| 山崎渉 ~ ̄ ̄ ̄ ̄ ∧_∧ ( ^^ )< ぬるぽ(^^) (⌒V⌒) │ ^ ^ │<これからも僕を応援して下さいね(^^)。 ⊂| |つ (_)(_) 山崎パン ∧_∧ ∧_∧ ピュ.ー ( ・3・) ( ^^ ) <これからも僕たちを応援して下さいね(^^)。 =〔~∪ ̄ ̄ ̄∪ ̄ ̄〕 = ◎――――――◎ 山崎渉&ぼるじょあ
67 :
名無しさん@3周年 :2005/06/11(土) 17:20:33
68 :
名無しさん@3周年 :2005/06/11(土) 17:32:40
69 :
名無しさん@3周年 :2005/06/11(土) 17:32:59
70 :
名無しさん@3周年 :2005/06/12(日) 13:45:19
このスレ面白かったけど 今はすっかりつまらなく なっちゃったね
71 :
名無しさん@3周年 :2005/06/12(日) 19:45:14
最初からレベルが著しく低かったが?
72 :
名無しさん@3周年 :2005/07/09(土) 02:12:47
スレ違いかもしれませんが統計学の宿題がわかりません a(1),a(2),...,a(p)はa(1)>a(2)>...>a(p)>0を満たす定数とする。 z(1),z(2),...,z(p)の関数納1=1,p]a(i)z(i)^2を二つの条件 納i=1,p]z(i)=0, 納i=1,p]z(i)^2=1 のもとで最大にすることを考える。そのとき、この最大値は、 納1=1,p]1/(a(i)-λ)=0 を満たす最大の解λであり、区間(a(1),a(2))の中にあることを示しなさい。 ラグランジェの乗数法を使うそうですが、どなたか分かる方いませんか? 解けないと単位がきません!!
73 :
名無しさん@3周年 :2005/07/10(日) 23:31:00
そんな面倒くさい問題やだよw 自分で解きなさい宿題なんだから
74 :
名無しさん@3周年 :2005/07/11(月) 00:38:23
誰かGARCHモデルのパラメータを擬似最尤推定するプログラムのソース持ってないですか? GARCH(1,1)モデルが今緊急で必要なんですが。
75 :
名無しさん@5周年 :2005/10/23(日) 23:19:44
各国の統計を調べていたら、 国民一人当たりの牛乳の消費量が多い国ほど がんによる死亡率が高いことがわかった。 牛乳はがんを発生させやすいと結論してよいか? 架空データです。 結論してもよいでしょうか? よくない場合には、どのような背景があると考えられるでしょうか?
76 :
ちはるるる :2006/01/20(金) 23:03:09
統計学わかんないです。。。泣 ある地方の6歳児900人の標本抽出し、体重を測定したら、平均21.5kg、標準偏差3.0kgであった。 この地方の6歳児の平均体重μを有意度8%で推定せよ。 の答えってわかりますかぁぁ??教科書用読んでもさっぱりです。。。><。。。
78 :
名無しさん@5周年 :2006/01/22(日) 04:26:03
>>76 と言うか『有意度80%で推定せよ』って意味が分からん。
『検定』じゃなくって『推定』?それとも信頼区間が92%って意味かしら?
問題文正確に書き写してますか?
79 :
名無しさん@5周年 :2006/01/24(火) 03:31:35
学校の宿題で、以下のキーワードを使ってデータ予測のための統計と検定について 150字程度で説明しなければならないんですが、いまいちよくわかりません。 誰か教えてください。 キーワード:基本統計量,検定 ポイント: データを予測するまでの流れ 分析手法としての統計量 検定と予測の関係
80 :
名無しさん@5周年 :2006/01/24(火) 08:45:02
>>79 マルチポストやめれ
答える必要ないぞ
自分で考えろ
81 :
名無しさん@5周年 :2006/01/24(火) 13:30:17
あほ
>76 ある地方の6歳児900人の標本抽出し、体重を測定したら、平均21.5kg、標準偏差3.0kgであった。 この地方の6歳児の平均体重μを有意度8%で推定せよ。 1.信頼率 有意度α=0.08なので 信頼率(1-α)=0.92 2.統計量 平均値:サンプルから抽出した平均値21.5kg これを母平均と推定する。 μ~=21.5kg (↑hatのつもり。。。) 3.母標準偏差も母平均と同様。サンプルの値を推定値とする。 √V=3.0kg 4.信頼限界 φ=n-1=900-1 α=0.08のtの値を求める. t(φ,α)=t(899,0.08)=1.75 ±t(φ,α)√V/√n ±1.75×3.0/√900=±0.18 5.信頼度92%の信頼限界で 上部限界値 μ~up=21.5+0.18=21.68kg 下部限界値 μ~low=21.5-0.18=21.32kg >79 説明は長いからヤダ
83 :
名無しさん@5周年 :2006/01/28(土) 13:27:29
ワードでXの上にバー(-)やハット(^)を付けたり、ルートで囲むことは出来ますか?
メニュー 挿入-数式エディタ Wordでなく、TeXの方がいいよ。
85 :
名無しさん@5周年 :2006/01/29(日) 09:22:32
ひさしぶりに統計見た感じダビスタ04にはまって記憶の彼方に飛んでた何となく思い出した
86 :
名無しさん@5周年 :2006/01/29(日) 15:07:17
>>82 乙カレ。
>>78 も指摘してるが「有意度8%で推定せよ」
>>76 って、問題文に
引っ掛かったんだが。有意度8%でなく、信頼水準92%か信頼率92%でなら
疑問はないんだが。有意度って言い方もあるのか?
>>76 は何処の大学なの
かな。質問主
>>76 は、何処に行ったんだ?
87 :
名無しさん@5周年 :2006/01/29(日) 16:19:21
88 :
名無しさん@5周年 :2006/01/30(月) 21:23:44
すいません(汗) 今日大学の統計学の試験で、「偏差値58以上の確率は?」という問題が出されました…(泣) 私は、答えられずに終わってしまったんですが… 回答を教えていただけませんか?
89 :
名無しさん@5周年 :2006/01/30(月) 22:53:45
>>88 『偏差値』って『分布が正規分布だと仮定して』でてくる統計量だって知ってますか?
90 :
名無しさん@5周年 :2006/02/21(火) 19:38:05
91 :
名無しさん@5周年 :2006/02/25(土) 08:28:58
教えて下され 確率p=0.5からなる二項分布で信頼区間を95%としてその範囲が±0.01(pの±1%)となるには、試行回数nは何回必要になるのか、 求める式も知りたいです 関連のサイトをいろいろ見てみたのですが専門用語とか出てきて分かりません あと確率pと試行nが設定された場合の推定範囲の求め方も知りたいです お願いします
92 :
名無しさん@5周年 :2006/02/25(土) 23:50:21
うほッ!!
91>> 二項分布 B( n , p ) の n が大きいときには 平均値 np, 分散 np(1-p) の 正規分布 N( np , np(1-p) ) と近似できる。 で、とりあえず正規分布の話をすると、 正規分布の 95% が含まれるのは μ ± 1.96 σ (μは平均値、σは標準偏差) 信頼区間の下限は n(p - 0.01)、上限は n(p + 0.01) だから、 これが正規分布の標準偏差と対応して μ-1.96σ = n(p-0.01) となる。ここで二項分布を近似したときの平均と標準偏差はそれぞれ μ = np σ = √np(1-p) だから、これを代入すると 1.96 √np(1-p) = 0.01 n p = 0.5 を入れて解くと、n = 9604 となる。 コインの裏表の出る確率が等しいということを「95%信頼できます!」というには 約1万回もコイントスしないとだめなのか orz
94 :
名無しさん@5周年 :2006/08/27(日) 00:54:31
Univariate logistic regression analysis 日本語訳教えてほしいんですけどぅ。。
95 :
名無しさん@5周年 :2006/09/01(金) 00:12:31
bayes error あるいは ベイズ誤差、ベイズエラー そしてbayes error rateとの違い について知りたいんですが、どこで質問したらよいでしょうか シミュ板は最近知ったのですが くだ質スレとかないですよね?
96 :
名無しさん@5周年 :2006/09/04(月) 22:58:28
教えて下さい。今日会社で、相加平均から標準偏差×3を計算していたデータをみたのですが、どんな意味になるのですか?
日本語でおk。
98 :
名無しさん@5周年 :2006/09/14(木) 01:02:49
じゃんけんをn人でやる。花子が太朗の出す手を予知できるとき、花子が勝つ確率を 求めよ。また次郎の出す手も予知できるとき、花子が勝つ確率を求めよ。 教えてください
102 :
名無しさん@5周年 :2007/02/09(金) 17:45:32
説明変量が二つのデータから目的変数を求めるための重回帰式の係数を求める方法を教えてください.
103 :
名無しさん@5周年 :2007/02/15(木) 10:28:50
460 :名無しさん@ピンキー :2006/09/26(火) 23:59:14 ID:qT8JvqPu0
>>102 パシャ パシャ パシャ パシャ パシャ パシャ パシャ パシャ パシャ パシャ
パシャ パシャ パシャ パシャ パシャ パシャ パシャ パシャ パシャ パシャ
∧_∧ ∧_∧ ∧_∧ ∧_∧ ∧_∧ ∧_∧
( )】 ( )】 ( )】 【( ) 【( ) 【( )
/ /┘ . / /┘. / /┘ └\ \ └\ \ └\ \
ノ ̄ゝ ノ ̄ゝ ノ ̄ゝ ノ ̄ゝ ノ ̄ゝ ノ ̄ゝ
104 :
名無しさん@5周年 :2007/02/15(木) 10:30:27
いちよ、転用でつ。
105 :
名無しさん@5周年 :2007/06/16(土) 21:57:36
おっぱい
106 :
名無しさん@5周年 :2007/07/27(金) 21:12:15
107 :
名無しさん@5周年 :2007/09/05(水) 07:56:07
108 :
名無しさん@5周年 :2007/11/03(土) 21:51:40
109 :
名無しさん@5周年 :2007/11/20(火) 21:18:03
>>102 27 :132人目の素数さん:2007/11/16(金) 16:46:45
・・・散布図を確認するのはいい心掛けだけど、そこでは、
まず異常値があるかどうかをチェックすべきだろうな。
あった場合にその扱いをどうするかは場合による。
それから、サンプルは本当に独立性を満たしているか?
満たしていなければ、いろんな方法でモデルを工夫
しなければいけない。
回帰分析では最終的な誤差の分布が問題なのであって、
元の変数の分布はモデルの正当性とは関係がない。
なので、最初に変数変換をすればOKというわけではなく
実際に回帰してみて、モデルの診断を行うという試行錯誤を
せざるをえない・・・
統計学なんでもスレッド7
http://science6.2ch.net/test/read.cgi/math/1193183539/25-27
「はじめての統計学」(鳥居泰彦著)って わかりやすくて好きなんだけど、 索引が無いのが致命的だ。 索引ついた改訂版出してくれないかな?
112 :
名無しさん@5周年 :2008/01/11(金) 21:07:07
文系大学生です。統計学で卒論を書こうと思っています。テーマは自由なんですがなにかいいネタありますか?
>>112 統計データ解析でなく、統計学でということは統計学徒なのですね?
文系というと、専攻は心理学?社会学?史学?経済学?そもそも
文科生が、何故にシミュ板で質疑?
115 :
名無しさん@5周年 :2008/01/19(土) 13:29:46
116 :
名無しさん@5周年 :2008/02/04(月) 18:10:58
117 :
名無しさん@5周年 :2008/02/13(水) 23:23:06
118 :
名無しさん@5周年 :2008/02/19(火) 23:46:19
120 :
名無しさん@5周年 :2008/05/17(土) 11:59:29
122 :
名無しさん@5周年 :2008/06/07(土) 11:40:44
1/225の確率の抽選を17300回試行して、結果が1/293程度になってしまう確率はどれくらいでしょうか?
完全な素人なんですが、統計について聞かせてください。 ある5地域、各3000人にあるアンケートをした場合、 その結果をもって、何かを断言することはできるでしょうか? 具体的には、コンバットナイフなどを売る店に悪感情を抱いているか、というアンケートに対して、 70%の人間が悪感情を抱いているという統計結果が出たとします。 それをもって、『世間多く』はナイフ販売をしている店に対して悪感情を抱いていると断言することって可能なんですか?
124 :
・・・ :2008/07/21(月) 18:06:50
統計分析の利点と欠点は何だと思いますか?? よかったら教えてください><
125 :
名無しさん@5周年 :2008/07/21(月) 19:07:48
126 :
名無しさん@5周年 :2008/07/27(日) 18:43:21
平均5.8回成功するものを24回試行(期待値139.2)して 82回しか成功しなかったのですが確率的?には何%くらいなのでしょうか? 全然ありえる範囲?試行回数が24とあまり多くはないですが 数字苦手なんで暇な方計算お願いします
127 :
名無しさん@5周年 :2008/07/28(月) 14:25:15
【毎日・変態報道】“就活生を脱がす企画も”「毎日」系企業が出す「エロ雑誌」が過激すぎる…週刊文春が報道→雑誌、突然の休刊に★4
http://mamono.2ch.net/test/read.cgi/newsplus/1217218356/ 「毎日」系企業が出す「エロ雑誌」が過激すぎる
週刊文春(7月31日号)P137〜P138より抜粋
http://www.bunshun.co.jp/mag/shukanbunshun/ 7月20日、毎日新聞1面に「お詫び記事」が掲載された。毎日新聞が謝ったのは「ファーストフードで女子高生は性的狂乱状態」等々、
引用も憚られるような<品性を欠く性的な話題>で溢れ返っていた毎日の英文サイトコラム「waiwai」についてだった。
だが、その過激さにおいては「waiwai」を遥かに凌駕する雑誌を「毎日系企業」が発行しているから驚きだ。
「毎日新聞が出資する毎日コミュニケーションズの100%子会社が過激なエロ雑誌を作っているんです」(毎日新聞関係者)
毎日コミュニケーションズ(以下、毎コミ)とは、毎日新聞の関連会社として設立され、同じパレスサイドビルに入居する企業。
毎日新聞社は同社株を9%保有する第3位の大株主で、非常勤監査役に菊池哲郎・毎日新聞常務が名を連ねている。
毎コミといえば、大塚愛を起用したCMが話題の就職情報サイト「マイナビ」が有名だ。リクルートの「リクナビ」と並び、
最近の就活生には欠かせないアイテムだという。
(中略)
就活情報ならぬ、「エロ情報」を発信しているのは、01年に毎コミの100%出資で設立されたMCプレス。
同社は『DVDヤッタネ!』や『DVDデラデラ』などヌード満載のDVD付きグラビア誌4誌を毎月、発行しているのだ。
しかも「就活生を脱がす企画もある」(前出・関係者)という。
早速、確認してみると、『ヤッタネ!』4月号で「就活生を狙え 今はいているパンツに穴を開けていいですか?inマ○ナビ」
という企画が掲載されていた。付録のDVDではリクルートスーツ姿の女の子3人が、あられもない姿に。いくらなんでも、
これはちとヤリ過ぎでは・・・。
128 :
名無しさん@5周年 :2008/07/28(月) 20:38:00
1.43の5乗根ってテスト中にどう求めるのですか・・・?計算機を超えてますよね?
129 :
名無しさん@5周年 :2008/07/28(月) 22:18:09
>>128 一桁目が1、二桁目が(適当に入れて5乗して調べる)
を繰り返せば簡単。
上位4桁ぐらい1分あれば出せる。
ばらついた測定値の平均値について質問させてください。 良く簡易的に、突出した値を無視した残りの測定値の算術平均 を求めている事例があります。この場合、あきらかに測定した1点 がとんでもない値であった場合のみ無視するべきでしょうか? それとも、どんな分布になっても測定結果の最大と最小の値を 機械的にを無視した後、算術平均するのが良いのでしょうか?
x^5=1.43 log(x^5)=log(1.43) 5log(x)=log(1.43) log(x)=log(1.43)/5 x=exp(log(1.43)/5)
132 :
名無しさん@5周年 :2008/10/03(金) 05:09:39
先物投資 シストレに多変量解析を導入するとしたらどのような使い方をしますか? 教えてください。
133 :
名無しさん@5周年 :2008/10/24(金) 19:47:03
数学嫌いの統計初心者です。訪れた統計サイトで、この本が紹介されていたんだが、
検定・推定のしくみを会得するには良書ですか?統計屋の小遣い稼ぎ目的の単なる
絵入り統計読み物だと2520円出費はつらいんだが。
”「統計的検定って、こういうことだったのか」と納得できる本。数式に頼らず統計的方法の
原理を巧妙に説明しています・・・・”
『生物学を学ぶ人のための統計のはなし 〜きみにも出せる有意差〜』 粕谷英一 文一総合出版 (1998/03) ¥2,520
http://software.ssri.co.jp/statweb2/books.html#basic
>>133 自治体の図書館へ行き、統計学の本を、全部読め。
自分が住んでいる自治体の図書館でなくても、
たいていは近隣の自治体の図書館でも借りることができる。
まずは、Web で地元の図書館の利用方法など調べる。
135 :
名無しさん@5周年 :2008/10/27(月) 11:06:04
適当なスレが分かりませんでしたので、ここで質問させてください。 確率積分についてです。 共分散行列 (w11 w12) (w21 w22) をもつ2つのブラウン運動B1とB2があるとき、 int_0^1 B2(r) dB1(r) の期待値はどうなるでしょうか?また、W2(r)=B2(r)-int_0^1 B2(s)ds としたとき、 int_0^1 W2(r) dB1(r) の期待値はどうなるでしょうか? 本をいろいろ調べたのですが、わかりませんでした。 よろしくお願いいたします。 (もし適当な本がありましたらご紹介願います。)
すみません。失礼します。 大学で統計学をとっているのですが、少しわかりにくい所が出てきたので 参考書を買おうか悩んでいます。 何かオススメは御座いますか?
>>136 どのへんがどのようにわからないかによる。
説明してみ。
>>137 標本を作って母集団を予想するというような、推測するための統計を
最近学び始めているようなんですが、少し理解できないところがあって;
できれば、統計学の基礎や確率分布の話、そして予測する統計?を学べる参考書で
いくらか式やそのイメージを持たせてくれて、例題、練習問題があるものが望ましいのですがありますか?
139 :
137 :2008/10/31(金) 08:23:18
授業があるうちは副読本として読むものとして、
せっかく買うんだからその後も使える本がよかろうと思うと、
>>138 の要望にだいたい沿うのは
東京大学出版会の統計学入門あたりか。
140 :
名無しさん@5周年 :2008/10/31(金) 17:17:29
すみません数学板で質問したけど誰も答えてくれなくて こっちで質問させてください BICはlog(標本数) × (パラメーター数)が足されていますよね 標本が増えるほどモデルが劣化するのでしょうか? それって何故ですか?
141 :
136 :2008/10/31(金) 18:46:51
>>139 有り難う御座います。是非参考にさせていただきます!
142 :
名無しさん@5周年 :2008/11/03(月) 09:17:00
>>140 私も同趣旨の質問です。大学の偏差値を検討の対象とした場合に、
受験者数が3万数千人の立命館大学の法学部の偏差値が64であり、
受験者数が4800人の同志社大学の法学部が65である場合、同志社大学の受験者数が3万数千まで増加して立命館の受験者数と同数になったら同志社の偏差値は下がるのでしょうか?
143 :
名無しさん@5周年 :2009/03/28(土) 16:54:52
>>140 めちゃくちゃ遅レスですが。
学習データに対する誤差を小さくするモデルが、予測誤差を小さくするとは限らないわけです。
AICの結果は、不要なパラメータであっても減らせてしまう学習誤差(対数尤度に-1を掛けたもの)を漸近近似を使って見積もると、パラメータ数になることを意味してます。
BICはベイズ的にモデル選択するために周辺尤度を漸近近似すると出てきます。すなわちパラメータ数が大きいほど、ベイズ的には信頼性がないということです。
パラメータ数が増えるほど劣化するのはモデルではなく、有限の学習データで推定した分布のほうなのです。
あ、「標本数が増えたときに」か。 標本数が増えたとき最大対数尤度も増えていくので、モデルが劣化するんじゃなくて、1パラメータあたりlog(標本数)だけ対数尤度を増やせてないと、ベイズ的にはそのパラメータを採用する信頼性はないですよってことでした。 AICは標本数に依らず一定の罰則なので、とにかく推定した予測誤差が小さいモデルを採用しますが、BICはもっと積極的な理由が無ければパラメータを増やさない、みたいな感じです。
146 :
飯村桂 :2009/06/01(月) 00:24:11
「統計学ができないバカ、英語が読めないアフォ」に該当するであろう飯村桂と申します。 自分で計算した検定値が正しいかどうかわからないのです。 簡易表計算ソフト、桂カルクの虫取りを手伝っていただける方いらっしゃいませんか。 計量型の統計処理を目的に作成したソフトです。 作成環境は、Win98 128MB 450MHz, Microsoft Visual Basic 6.0 SP5。 本体は8MB程度ですが、500KB程度の補助ファイルと設定保存等用ファイルの合計で10MBほど使用します。 適当なアップローダーをお知らせいただければLZH圧縮(2.5MBくらい)でUPします。
プログラムを公開するの?
148 :
飯村桂 :2009/06/10(水) 07:15:32
>プログラムを公開するの? 実質的には、桂カードを公開することになるかと思います。 旧バージョンでしたらば某同人誌で公開しております。
149 :
名無しさん@5周年 :2009/06/18(木) 22:57:33
>>145 ベイズ統計って、数値計算ライブラリを要するような複雑な計算が
必要なのですか?
”ベイズ統計学に関連するNAG数値計算ライブラリルーチンの利用方法及びサンプルプログラムを
公開しました。この技術情報にはNAG数値計算ライブラリに含まれる様々な乱数発生、確率分布、
補間法に関するルーチンを組み合わせて事後分布と事前分布を利用する方法が説明されて・・・”
ベイズ統計学に関連するNAG数値計算ライブラリルーチン 2009年05月12日
http://www.news2u.net/NRR200948736.html
150 :
名無しさん@5周年 :2009/06/19(金) 16:09:39
↑ デイトレの広告
153 :
名無しさん@5周年 :2009/07/17(金) 01:15:32
単に、QCASの広告じゃないか
155 :
145 :2009/07/17(金) 09:12:35
久しぶりに来た。
>>149 めちゃくちゃ亀で申し訳ない。
ベイズ推定しなくても確率モデルを扱っているとガンマ関数とかいろいろ近似が必要な特殊関数が出てきます。
また、ベイズ推定するためにはパラメータの事後分布を知る必要があって、確率モデルが簡単なら手計算できるけど複雑になるとできなくなっちゃいます。
するとなんらかの近似が必要なんだけど、そのために乱数を使う方法とかもあります。
いろいろな特殊関数の近似とかいろいろな確率分布からの乱数とか、全部自分で理解して実装するのは大変なので、そういう数値計算ライブラリ使うと楽なんだと思います。
>>112 SPSSを、IBMが買収したようですね。
”米IBMは7月28日(現地時間)、統計解析とデータマイニング向けソフトウェアを開発する米SPSSの
買収で合意したと発表・・・SPSSは統計解析ソフトウェアでは非常に長い歴史を持っており、研究
者や学術研究の分野では広く利用されている。近年ではその技術を利用して膨大なデータ分析と
企業のビジネス改善を行うデータマイニングの分野に進出しており、高い評価を得ている・・・”
米IBM、データマイニングの米SPSSを12億ドルで買収 2009/07/28
http://journal.mycom.co.jp/news/2009/07/28/063/
今月8/28開催JMPer's Meetingでは、医薬系分野での統計解析手法が演題のようですね。
JMPer's Meeting 2009-1
■ 日時:2009年8月28日(金) 14:00〜17:15(受付開始 13:30)
■ 会場:SAS Institute Japan株式会社 本社 プレゼンテーションルーム
■ 演目:16:00-17:00 「医薬品開発のための統計解析」 元東京理科大学教授 芳賀敏郎氏
■ 参加費用:無料(事前登録制)
■ 参加定員:100名(先着順にて受付)
http://www.jmp.com/japan/about/events/jmpers.shtml
161 :
名無しさん@5周年 :2009/09/21(月) 20:44:06
>>149 ベイズ統計学では、主観が訂正されていく?
”値データのみを用いて考えるタイプの統計学を古典統計学と言います。大学などで通常教える
統計学はこれですね。僕自身も学部・大学院と古典統計学を使った議論を教わってきました。
しかし、十分な過去の蓄積がある問題を考える場合にはそれを「主観が入っている」として切り
捨ててしまうのはちょっともったいない気がします。
そこで登場するのがベイズ統計学です。ベイズ統計学では「手元にあるデータが何かを語る」
のではなく、「新しいデータを見たことによって、私たちの主観が訂正されていく」という形で
データをとらえます・・・”
「経済学を信じていい理由ってなんだろう?」 2009年9月4日 飯田泰之
http://business.nikkeibp.co.jp/article/topics/20090901/203943/?P=2
165 :
飯村桂 :2009/12/12(土) 18:22:32
簡易表計算ソフト、桂カルクの虫取りを手伝っていただける方いらっしゃいませんか。
計量型の統計処理を目的に作成したソフトです。
作成環境は、Win98 128MB 450MHz, Microsoft Visual Basic 6.0 SP6。
本体は8MB程度ですが、500KB程度の補助ファイルと設定保存等用ファイルの合計で20MBほど使用します。
DL先。
http://homepage3.nifty.com/iimura-katsura/ ユーザー名「NICANNEL」
パスワード「KATURA」
166 :
名無しさん@5周年 :2009/12/19(土) 16:33:49
167 :
名無しさん@5周年 :2010/01/31(日) 08:53:35
>>160 判別分析法って、MT法とは何が違うのですか?
数量化理論1類での予測式でも、残差が正規分布し残差による回帰診断がやれ
るんだね?
203 :132人目の素数さん:2010/01/22(金) 23:53:26
重回帰分析に詳しい方、お願いします。
説明変数にダミー変数を用いる数量化理論1類において、
構築された回帰式を回帰診断したいのですが、
残差プロットはどう見ても規則性があります。
どこからみても、回帰式の前提である残差のランダム性、均一性、正規性が得られて
いるようには見えません。
数量化理論1類の回帰式では残差による回帰診断は必要ないものなんでしょうか?
204 :132人目の素数さん:2010/01/23(土) 01:03:02
>>203 アイテム・カテゴリが少ないと縞模様になったりするかもしれないが、
誤差に正規性が仮定できるような状態だと回帰診断も普通にできると思う。
統計学なんでもスレッド11
http://science6.2ch.net/test/read.cgi/math/1258355122/203-204
169 :
名無しさん@5周年 :2010/02/07(日) 22:50:09
推論方法としての最尤法の長所と短所を教えてくらはい
171 :
名無しさん@5周年 :2010/03/26(金) 06:13:21
vxc
>>173 7/29の計量生物学講演会で、ベイズ統計講話があるようですね。
日 時:2010年7月29日(木)13:00〜14:35
会 場:キャンパスプラザ京都 第1講義室(5階)
参加費:無料
―プログラム―
13:00〜13:05 挨拶 佐藤俊哉(日本計量生物学会会長、京都大学医療統計学教授)
13:05〜14:35 Bayesian approach to planning and analysis of clinical trials
Professor Andrew P. Grieve(King’s College, UK)
http://mid.ism.ac.jp/stats/msg01138.html