1 :
U-名無しさん :
仮説「ホームは有利とは言えない」
トト1〜69節でその他を除くと
ホーム勝ち429、ホーム負け288、計711である。
仮にホームの勝つ確率を1/2とすると
平均358.5、分散179.25、標準偏差13.38。
ホーム勝ちの平均からのズレは
429-358.5=70.5。
標準偏差σで割ると70.5/13.38=5.27。
仮にこの値を4にしても0.001%
つまり危険率を99.999%にしても仮説は棄却できる。
つまりこういう結果になるのはかなーり
少なく見積もっても0.001%以下である。
よって元の帰無仮説は棄却され
「ホームは有利である」と言える。
みたいな事を語りましょ。
あんまり専門的にしないようにしたいけどね。
2 :
βακα..._〆(゚▽゚*) :02/12/02 11:20 ID:8++uGkd7
意味分からん
711試合に対して勝ちは429event
ガウス分布を仮定して統計誤差の1σは20.7
ホーム有利で無いとした時のexpectationは355.5
そこからのずれは3.5σ
2σ離れたら統計的に有意な差があると見てもいいんじゃねーの?
>仮にホームの勝つ確率を1/2とすると
>平均358.5、分散179.25、標準偏差13.38。
こっちはexactに355.5でいいでしょ。
勝ちがどれだけ離れてるかをみるんじゃない?
結果は同じだけどね。
4 :
1:02/12/02 11:31 ID:s6GroUTy
>>3 まあそうでもいいんだけど
実際は5.62σだったけど
この時の値がわからんかったから
本に載ってた4σを使いますた
5 :
1:02/12/02 11:38 ID:s6GroUTy
今考えてるのが
あるチームAと別のチームBの試合において
Aが勝つ確率を求める
みたいな事です。
例えばこの前の柏ー大阪戦で
年間勝ち点は柏は29、大阪は54。
よって柏の勝つ確率は29/(29+54)
みたいなの。
これはまだ予測の段階なんで色々試す必要が
ありそうだけど。
6 :
:02/12/02 11:42 ID:XDu07YB8
統計的有意差の話をしはじめたらスポーツは楽しめんな。
「磐田とガンバの間には有意な力の差は見られない」
って結論になっちゃう。
>>4 チームごとに見た方が面白いかも。
サンプル減るからこのやり方だと何にも見えなくなるかもしんないけど。
医薬関係者が治験で使ってる検定方法使えば出てくるかな。
奴ら20〜30人のデータ弄って結果だしてるからね(w
totoの為にこの板で講義しておくんなまし。
8 :
:02/12/02 11:48 ID:YTVVTpk4
新予想形態キター…のか?
9 :
:02/12/02 11:55 ID:Vreth/SF
俺としてはむしろ効果的な削減の方法を教えてほしいのだが
10 :
U-名無しさん:02/12/02 12:07 ID:s6GroUTy
>>6 いやそんなことないんじゃない?
大阪54磐田71だからね。1.3倍離れてるし。
11 :
U-名無しさん:02/12/02 12:11 ID:s6GroUTy
でもスポーツを楽しめないっていうのはわかる。
けどさ、今年は初めて降格争いに巻き込まれて
11月中は計算とかしまくりだったからさ、、、
12 :
:02/12/02 12:19 ID:XDu07YB8
>>10 セカンドのみで考えてた。
でも今みたら35と27だから差は出るかな。
計算してみたいが、勝ち点だとやりかたがわからん。
勝ち点だけで見ると大穴わかんないから
チームの1試合あたりの得点と失点、さらにその偏差をみるのは?
これと勝ち負けの結果を比較するとイレギュラーが多いチームとか判りそう。
toto的には、コンスタントにショボイチームは捨てられるし、
爆発出来るチームは大穴として残せる。
14 :
:02/12/02 12:44 ID:XDu07YB8
えーと、暇だから勝ち点で分散分析やってみた。
(13すまん。計算してたから)
・セカンドのみズビロVSガムバ
F=1.43 p=0.24(有意差なし)
・通年でズVSガ
F=4.1 p<0.5(差あり)
15 :
:02/12/02 18:51 ID:1Iwms/zr
統計とはちと離れるが、クラブ単位でレーティングをつけれないかなと
思ってるのだが。
過去の記録はあるわけだし、レーティング算出方法さえ決めれば
統計的に表せると思うのだが。
16 :
U-名無しさん:02/12/02 20:26 ID:Kf6L/l+M
>>15 その算出方法ってのがむずいよな、、、
万人を納得させる物を作るには。
一試合の平均勝ち点とかかな?
17 :
井原正巳:02/12/02 20:28 ID:6LZZZ8Ul
18 :
U-名無しさん:02/12/02 22:48 ID:14T7OIlu
取り敢えず2nd120試合を
磐田35−大阪27で磐田の勝つ確率を35/(35+27)
磐田35−鹿島26で磐田の勝つ確率を35/(35+26)
…
仙台12−札幌9で仙台の勝つ確率を12/(12+9)
としてその総和を取ったら69.79試合になりますた。
が、勝ち点の多いチームが勝っている数は75試合あるので
勝ち点の比よりも勝ち点の多いチームの方が勝ち易い
と思われる。
つまり
蟹12ー袋9で蟹の勝つ確率は12/(12+9)=57%ではなく
(12-α)/(12+9-α)になりそう。
でこのαの割り出しはちと計算がだるいな。
でも92からの19シーズンすべてで出してみたいな。
19 :
U-名無しさん:02/12/03 02:03 ID:EODaTJxI
へ〜
こんなスレ立ったんだ。
トト当てられるようになるかな?
20 :
_:02/12/03 02:17 ID:MlU894dQ
age
俺は馬鹿だから意味わかんねえよ!
誰かもっと解りやすく言ってくれ。スマソ
22 :
U-名無しさん:02/12/03 04:30 ID:9Wl0Lpco
23 :
名無し:02/12/03 04:35 ID:rgmBuQNP
個人的に、一番、勝率を割り出すのに適した手法は
共分散構造分析だと思うけど。ただ、変数の設定が
難しかったな。
少なくとも新聞紙上の専門家の人たちよりは勝率は
完全に上だった。
24 :
名無し:02/12/03 04:42 ID:rgmBuQNP
>>14 勝ち点は、名義尺度だから分散分析は・・・(苦笑)
25 :
:02/12/03 04:48 ID:Cqi1QMAV
チームの構成要素である選手が入れ替わっている以上、チームに対しての検定はちょっとなあ。
エジムンドがいるベルデーといないベルデーじゃ比較する意味すらないし。
こういうのは好きだけどね。
>>18 勝ち点の比を求めてる時点で本質的じゃない気がするな。
やるならもっと原子的な要素に分解しなければ。
それに、勝ち点の比のクラスごとに試合結果を検証しないと意味がない。
しかも、予想に使うなら試合時点の勝ち点でやるべきだし。
しかし、もし、このやり方が完成したとして、レッズに適用してたら悲惨だったね・・・
26 :
:02/12/03 04:58 ID:9oR/vEGB
今、レーティングを出してる最中。
レーティング方式は
レートが同じなら勝てば+16点、負ければ−16点。
レーティング上位が勝った場合の得点をR、レート差をXとして、
R=16*(0.5^(X/200)) (小数点2位を四捨五入)
下位が勝った場合は32-Rね。
問題のVゴル勝ちなんだが、90分勝ちの半分増減で計算してみる。
まだ93年のデータでやってるから出てこないけどね。
ちなみに、PK戦は勝敗ついても引き分け(増減なし)の扱いにしてます。
27 :
:02/12/03 05:03 ID:Cqi1QMAV
>>26 あのさあ、適当に数式を作って大体あってる!!っていうんじゃ確率統計になんないよ・・・
どういうモデルを想定してるのかしらないけどさ。
それは過去の現象にたまたま当てはまるように表面的な数字を掛けたり足してみてるだけでしょ。
28 :
:02/12/03 05:06 ID:9oR/vEGB
サッカーのモデルが分からないからこそ、
数式を作って想定して、適宜修正して見るんじゃないの?
それさえもしないでどうやって数式をみちびきだすのさ。
29 :
:02/12/03 05:08 ID:9oR/vEGB
>>27 あ、ごめん、漏れは厳密な確率統計に当てはめたくてレーティング
やろうとしてるんじゃないから。
なにか単純な2値比較で勝率などの目安ができないかと
模索しているだけなので。
すれ違いならスマソ。
30 :
:02/12/03 05:11 ID:Cqi1QMAV
31 :
:02/12/03 05:18 ID:Cqi1QMAV
>>29 厳密云々じゃなくてさ、勝ち点なんて人間が順位付けのために勝手に決めたルールじゃん。
勝ち点3じゃなくて10だったらどうすんのさ。
勝ち負けを予想したいなら、勝ち負けの要因をベースにレーティングしなきゃ。
シュート数とかでもいいし、選手の年俸とかでもいいし。
ま、俺がやるんじゃないからスジワルでもいいけど。
32 :
:02/12/03 05:32 ID:9oR/vEGB
>>31 べつに勝ち点に依ってレーティングしてないんだが・・・
Jリーグのルールがころころ変わってるから、90分勝ちと延長勝ち、
それにPK&引き分けに分けてるのだが。
勝ち負けの要因が選手の年俸にある?かなりスジワルですね。
33 :
:02/12/03 11:00 ID:T5FMI8z3
>>24 名義尺度の意味がわかっているのかと小一時間、、、。
34 :
U-名無しさん:02/12/03 12:49 ID:Gpz08bGt
漏れはある程度の実力差がある時は
○40%□20%△10%■10%●20%
で計算してる。
例えばこの前なら
G−粕、安ー牛、熊ー札で。
したら降格の確率は
粕10%、牛35%、熊55%だった。
まぁ全部漏れが齢と思った方が勝ったが、、、
35 :
名無し:02/12/03 13:29 ID:rgmBuQNP
>>33 あのなぁ・・・
名義尺度は、仮につけた数字。男性1とか、女性を2とかね。
勝ち点もこれと同じなんだよ。
まぁこの場合は、順序と言ってもいいけどね。2>1>0の
順位付けにはなっているから。
ただし、この際、使えるのはノンパラ。分散分析はダメ。
36 :
:02/12/03 16:26 ID:IBT0Byo8
難しい話はわからないけど、サッカーって他のスポーツと比較して
予想外の事が起きるからくじの対象になるんでしょ?。
確立や統計は客観的に考える分にはいいかもしれないけどね。
37 :
:02/12/03 16:31 ID:T5FMI8z3
>35
おいおい。
特に前半部はそうとうおもしろいぞ。
Jの順位算出においては、引き分け×3が90分勝ち×1と等価なわけだから
ここでは勝ち点は比率尺度だ。
離散量であっても間隔尺度以上なら分散分析は適用可能だ。
(勝敗のつきかたが互いに独立じゃないからダメではあるが)
38 :
:02/12/03 16:33 ID:T5FMI8z3
えーっと、スレよごすのなんなので、私退出いたします。
39 :
:02/12/03 17:55 ID:Cqi1QMAV
>>32 ・・・
だめだこりゃ。
本質を理解しようとする気もないのか。
つか、
>>26っぽいおもちゃなら俺ならExcelで1分で作れるっていうか。
小学生でも考え付くって言うか。
統計じゃないとか言ってる時点でスレ違いだし。
あのー、面白そうなスレなんですけど
算数すら苦手だったもので、標準偏差とか
名義貸しでタイーホとかよくわからないんです。
アタマの良い方、単語の意味まとめておいてくれると
バカでも読めるスレになると思うんですが。
41 :
:02/12/03 18:12 ID:9oR/vEGB
42 :
:02/12/03 18:14 ID:Cqi1QMAV
>>41 あきらめたの?
まだ出来ないんだ。「自信作w」
いや、式の意味は聞かないでおいてあげるよw
43 :
:02/12/03 18:22 ID:/it5vG7r
俺にはよく分からんが、喧嘩しないで協力して、ある答えを出してみてくらないかな?
44 :
:02/12/03 18:32 ID:Cqi1QMAV
>>43 協力する価値があるモデルなりがあるならともかく、小学生レベルの数字合わせを
みんなでやって何がうれしいの?
45 :
:02/12/03 18:47 ID:9oR/vEGB
>>41 スレ違いと言われたので公表はやめたんだが。
煽ってどうするの。
まあそんな態度でスレが続くはずもねえよな。
というわけで退出。
46 :
:02/12/03 18:53 ID:Cqi1QMAV
47 :
:02/12/03 18:59 ID:Cqi1QMAV
49 :
:02/12/03 20:55 ID:S9AQg+hO
つか、9oR/vEGBは、単にレーティングを算出したかっただけで、
それを、予想に使おうとはしてなかったんじゃないかと思うんだが。
まあ、だれでも紙と鉛筆があればできるんだろうが、
俺みたいなど素人だとexcel使っても1時間以上かかりそう。
>>39さん、もし暇なら、excelで作ってどこかにupしてくれると嬉しいな。
50 :
_:02/12/03 21:35 ID:rgmBuQNP
51 :
:02/12/03 22:06 ID:Cqi1QMAV
>>49 っていうかね、正直言うと、俺も昔いろいろそういうことやって遊んでたことあるんだよね。
でね、適当に出したレーティングって、結局「適当」な部分による結果しか出ないわけよ。
だってさ、自分の印象を元に適当に式作ってりゃ、自分のほしい印象どおりのレーティングに
なるに決まってるでしょw
印象があってるかどうかを問題にしてるのにさ・・・
だから、結局のとこは、式が説得力を持つかどうか、最適化したものと主張できるかどうか
くらいしかよりどころがないのよね。で、そういうものを説明するためにいろんなモデルがある
わけ。勝つための要因に分解して、時系列モデルとか分散分析とかするならわかるけど。
その辺すっ飛ばしてるから、意味ないんじゃないのと突っ込みたくなるんですわ。
52 :
:02/12/03 22:24 ID:ot93c04Y
確かに、勝敗パフォーマンスの要因分析をするには、
サッカーはあまりにもアナログ的な要素が多すぎるため、
どのモデルも説得力が持てないのは当たり前だな。
机上の空論化してしまう。
53 :
:02/12/03 22:57 ID:sKfaP4Z2
>>52 確かにそうなんだけど、
>>51が言いたいのは、それでも、モデルとしての信頼性を検証しないこと
には統計的な議論の土台にすら載ってないということじゃないだろうか・・・
極端なことを言えば、勝ち数=レーティングです。
って言ってもいいんだから。
54 :
1:02/12/03 23:22 ID:FLIcA4o2
>>40 例えば10000人くらいが
100点満点のテストを受けたとしましょう。
点数によって棒グラフを作ったとして
平均点が60点とすると形はどうなると思う?
60点が頂点になる山になりそうだよね?
で、60点から+-7点ぐらいの所
つまり53〜67点の人が70%くらい、
60+-21点つまり39〜81点の人が99%くらいに
なる感じだよね。
つづく
55 :
1:02/12/03 23:30 ID:FLIcA4o2
今のは棒グラフだったけど
なめらかな理想的な山ってのを
昔の偉い人(具体的にはガウスさん)が
決めたんだな。
で、平均点をaとすると
山の面積が68%になる範囲がa-b以上a+b以下だった時
このbの事を標準偏差って決めたわけだ。
(ことばじゃうまく言えんな、、、)
ちなみに幅を今の3倍とると、
つまりa-3b以上a+3b以下だと面積は99%になる。
上の例の7点ての標準偏差です。
56 :
1:02/12/03 23:32 ID:FLIcA4o2
長文+連続スマソがわかってもらえたかな、、、?
58 :
:02/12/03 23:34 ID:sKfaP4Z2
59 :
1:02/12/03 23:50 ID:FLIcA4o2
>>58 乙!
40さん、これも見てね。
もひとつ
最後に帰無仮説(きむかせつ)って用語について。
最初にある「ホームは有利じゃない」ってのは
当然漏れの主張したい内容とは逆の事だよね。
でもそれを仮定して、でなんだかんだいって
おかしいとなれば
漏れの主張が正しいってことになるわな。
こんな感じに否定されることが前提になってる仮説を
帰無仮説っていうんだな。
60 :
_:02/12/03 23:54 ID:rgmBuQNP
61 :
_:02/12/03 23:57 ID:rgmBuQNP
62 :
:02/12/04 00:05 ID:CrYp5NgD
1のような場合には二項検定をするのがいいんじゃないか?
いきなり確率を計算できるし。
で、ちょっと計算してみた。
ホーム勝:アウェイ勝が429:288以上に偏る確率は0.000000233(片側)
63 :
1(ちなみに柏サポ):02/12/04 00:14 ID:ftTnlioF
>>62 まぁどっちでもいいんじゃないかな。
結果が変わらんからね。
>>60-61 文盲ですまんが
先に標準偏差を表に出したくなかっただけだが、、、
64 :
:02/12/04 01:14 ID:e//+Qtun
ん?
平均値の差の検定をやりたかったんだろ?
t検定だろ。
>>1でなんでいきなり正規分布なのかも不明だし。
65 :
:02/12/04 13:17 ID:lu05JNI/
名義尺度の二値しかとらない(たぶん引き分けはなしって前提?)ので、
t検定でなく二項検定じゃないかな。
名義尺度に関しては、ID:rgmBuQNPが詳しいらしいw。
66 :
名無し:02/12/04 19:59 ID:KPa7NIYd
>>63 ごめんね、よく読んでいなかった。
>>65 詳しくないけどね。
名義尺度の可能な統計処理
最頻値、関連係数、カイ2乗検定
順序尺度の可能な統計処理
メディアン、四分位偏差、順位相関係数、マン・ホイットニーの検定、符号つき順位、和検定
間隔(距離)尺度の可能な統計処理
平均と標準偏差、ピアソンの相関係数、t検定、分散分析など
比率(比)尺度
あらゆる統計処理が可能
先の分散分析(勝ち点)の場合は、間隔尺度までいかないため、
分散分析も、t検定もダメ。
結局65が言うように、二項検定だろうね。まぁ後は、ID:lu05JNI/
が説明してくれるだろう。詳しいようなので。
スレの流れがようわからんが、
勝ち点は比率尺度じゃないのか?
引き分け×3回=勝ち1回、だろ?
68 :
:02/12/04 21:05 ID:lu05JNI/
>>67 いや、67「は」スレの流れが読めている。勝ち点は比率尺度だとおもう。
名義尺度であらわされた量は、違う値同士を加算したり平均は出来ない(66もいっている)。
(例:男=1、女=2として、42人中15人が男だというデータを
15×1+27×2=39などとしてはいけない)
勝ち点計算に関しては値間の加算をしているので、少なくとも間隔尺度以上。
間隔尺度でなく比率尺度だという理由は67のいうとおり。
ただし、勝ち点は4つの値しかとらんエトセトラの理由で
分散分析が出来ない可能性はあるかもしれんが、詳しいことは知らん。長レス失礼。
69 :
:02/12/04 22:06 ID:lu05JNI/
68だが補足。
「勝ち数の比較」をするにはカテゴリカルな名義尺度なので二項検定、
「勝ち点の比較」をするには分散分析そのほか、といいたかった。
これでいいかな →66?
えらそうに書いといてナンなのだが、実は1の検定方法がよくわからん(恥)。
1=63がいうように二項検定と結果はほんとにかわらんのじゃろか?
70 :
名無し:02/12/04 22:53 ID:f/3y+6Vh
71 :
:02/12/04 23:50 ID:tYGmgFYM
数学板から引っ越してきたスレはココですか?。
72 :
U-名無しさん:02/12/05 01:10 ID:Xm2V0SsX
73 :
名無し:02/12/05 02:38 ID:+fX09Fsd
=70 補足というか、どうでもいいことなんだが
上の70で紹介した、慶應義塾のHPからなんだけど
http://web.sfc.keio.ac.jp/~imai/da00a/ch3/ch3.ppt このHPの名義尺度、順序尺度などの説明は、正しいと思う(9枚目、10枚目)。
しかし、スライド13枚目の7の質問で、14枚目の答えの7が疑問。
生活満足度のアンケートで「大変満足している」を「1」・・満足していないを「4」
とした場合、答えは順序尺度になっている。しかし、通常、この種のアンケートでは
等間隔であることを前提としているはず。よって、間隔尺度とみなすのが通常だと思う
が・・。ただし念のため順序尺度から得点間の間隔を保証するために系列カテゴリー法
という手法がある。
ということで、
>>48 のU名無しサマ、私の知識では教授が泣いてしまうと困るので、補足を
よろしく。サッカーの勝敗の予測に役立つ統計など希望!
74 :
:02/12/05 03:23 ID:s7j+l1En
48ではないが、横レス。既知のはなしならすまん。
73の言う通り、「値間が等間隔である」ことを前提とするのならば、間隔尺度とみなせる。
間隔尺度の方がイイ検定法を使えるので実際そのようにみなすケースもおおい。
ただし、うるさい人は「ほんとに等間隔といえるのか」という疑問をはさんでくるので、
安全策で行きたいときは尺度を一個落として順序尺度とみなす(と教科書に書いてある)。
系列カテゴリー法なんぞはしらん。
尺度のはなしばかりしているとお客さんがこなくなってしまう悪寒。
75 :
:02/12/05 04:08 ID:KgqarH1v
>>74 勝ち点は足し算出来るから間隔尺度でよいと思う。
しかし、現行勝ち点制度が強弱判定において適切だという前提であればの話だが。
私としては、得点数や、シュート数といったデータから主成分・因子分析をやってみてほしいな。
選手の寄与度の観点も面白そうだしな。
76 :
:02/12/05 04:24 ID:s7j+l1En
しかし、まぁ、70の出自がわかりやすいソースの選び方だな。
77 :
:02/12/05 06:29 ID:OICLN5Oo
20%くらいじゃないの?
78 :
名無し:02/12/05 13:32 ID:+fX09Fsd
>>75 いや、だからそういう方法で、主成分・因子分析じゃなく
共分散構造分析で、予測が可能と言っているわけで・・・
79 :
名無し:02/12/05 13:48 ID:+fX09Fsd
>>74 系列カテゴリー法(系列範疇法)は、Method of successive categories
とか、Method of successive intevalsとか呼ばれる手法。専門書には
教科書じゃなく、統計の専門書には載っているはず。分野によるかも知れ
ないが。結構、普通に使っているんだけどな。
ふ〜ん
81 :
:02/12/05 14:49 ID:s7j+l1En
<<これからの展開>>
82〜90でやたら複雑な行列が出てきて、コアサポが思わずうなり声をあげます。
100あたりで78が華麗なるバリマックス回転をみせ、一気にシュートに持ち込むでしょう。
82 :
:02/12/05 14:56 ID:IrCyoRXO
83 :
:02/12/05 15:52 ID:kq0+QojW
84 :
名無し:02/12/05 17:22 ID:+fX09Fsd
>>82-83 データ入れるのが面倒だな。誰かやってくれ。
U-名無しさんあたりが統計詳しそうなので
よろしく。
85 :
名無し:02/12/05 17:33 ID:+fX09Fsd
>>83 >>51-53 で書かれていることを参照。
それと、独立変数も明確にしないとね。だけど、これ考え始めると
大変なのよ。一番、影響しそうなものってなんだろうね?
86 :
:02/12/05 19:24 ID:75ZZ78NK
ここのスレは数学板でも通用しそうだな(w。
87 :
:02/12/05 20:13 ID:eH02fqaJ
単純に通算の成績でいいんじゃないの?
結構相性は重要
今年で言うと市原がなぜか磐田に負けてなかったり、ガンバが神戸に勝てなかったり
通算でもメンバーが代わっても清水は鹿島には強いとか
>>87 そうだね。
>>75 勝ち点は比率尺度だよ。
0.負け、1.引き分け、2.Vゴル勝ち、3.90分勝ち、で、
勝ち点足し算して総勝ち点で争うんだからさ。
> しかし、現行勝ち点制度が強弱判定において適切だという前提であればの話だが。
そこまで突っ込むと議論がまるで進まない。
それにその疑問はよく考えると変。現行の勝ち点制度下でシーズンを戦う以上、
現行の勝ち点制度下で最も勝ち点を稼げるチームが強いと考えるのが当然かと。
つまり現在のルールでは、90分勝ちはVゴル勝ちの1.5倍、引き分けの3倍の価値がある。(=比率尺度)
89 :
名無し:02/12/05 21:26 ID:+fX09Fsd
相性っていうのは、どう考えるといいんだろうね。
チームの戦術か、それともある特定選手の影響かetc.
90 :
:02/12/05 22:05 ID:qgQLZstL
>>88 目的変数はその時点の強さだよね。
〜尺度とかの表面的な言葉にこだわってるバカがいるようだが、比率だろうが
間隔だろうがここでは変わらん。結果の見方を変えるだけでやってることは一緒。
勝ち点は、単にステージごとあるいは降格決定のための順位を決めるための
決まりごととしての指標であって、その時点のチームの強さを表す指標とし
て最適なものではない。
相手に当たる順番とかで途中の勝ち点順位なんかいくらでも操作できるだろ。
長期指標(定性的な評価など)、短期指標(相手関係で較正した最近の成績)、
そういうものを選定して係数を最適化して行けばよいと思われ。
>90
ああ、そういうことをやろうとしてたの?
漏れは
>>1から察するに、「過去何年間の通算成績」とか
「○○vs××の相性」とかにスポットを当てるのかと思ってたのだが。
92 :
:02/12/05 22:42 ID:hWVnWLGF
>>91 そんなの分析したってIIDでもなんでもない統計量からの標本誤差を
勝手に有意差にするだけでしょ・・・
>>1はあってるんだろうけど、細かいこといえばホーム=地元じゃないし。
>>92 でもそういう趣旨なんじゃねーの?
とりあえず数値出してみて、ほーこんな感じか……ってネタとして楽しむみたいな。
そうじゃないんならスマソ。
94 :
_:02/12/06 00:05 ID:qvEdEnRY
なんか段々、レベルが低くなってきたな
95 :
:02/12/06 00:08 ID:KbsokuhF
96 :
1:02/12/06 00:28 ID:qp8cpayk
>>95 スマソ
大学で今少し習った所を応用してみただけなもので、、、
それに名義尺度に興味無かったもので、、、
>>92 じゃあ磐田の鴨池とか札幌の春野とか(柏の柏の葉とか)
を外してみようかな。
結果変わらなさそうだけど。
97 :
:02/12/06 00:50 ID:N/M2mOpK
ホーム、アウェイも考えないと
柏のアウェイの弱さは筆舌に尽くしがたい
98 :
1:02/12/06 00:57 ID:qp8cpayk
>>72>>97 そうそう!
今年のawayは味と国立しか勝ってないんだよ、、、
日立台なら7勝(3敗1分)なのに、、、
99 :
統計の先生:02/12/06 01:07 ID:qvEdEnRY
>>96 だよな。尺度の話をきちんとしていた彼の方が理解している。
一部?もあったが。と、一応、プロの統計屋さんらしいことを
言ってみる。
100 :
かしわ:02/12/06 01:31 ID:xWNWmr/s
>>98 関東圏を離れた成績は札幌の1分以外みんな負け。
統計処理しなくても有意差が出てしまっている罠。
101 :
:02/12/06 03:51 ID:5fcBQaSH
102 :
:02/12/06 11:42 ID:VELWs1UM
>>101 統計処理する前のデータ整理段階がやってないと、手間がかかるなあ。
データ整理ができてる段階っていうのは、たとえば
チーム名:勝ち点:ホーム勝ち:平均観客数:年間予算 ・・・
A 50 8 2万 5億 ・・・
B 60 10 2万2千 8億 ・・・
C 28 3 1万3千 4億 ・・・
・・・
みたいな感じで、興味のあるデータ間の関係がエクセルっぽくしてある感じ。
ここまでできてると、「年間予算が勝ち点と相互につよい関連をもつ」
「観客数と勝ち点はあまり関係がない」みたいな分析ができるわけね。
103 :
U-名無しさん:02/12/07 10:53 ID:dQmTojUr
>>102 勝点、観客動員、総年俸は相関性高そうだね
104 :
//:02/12/07 11:21 ID:9x8HYG/W
>>103 どうしてそうなるのかな?分析データーに関係なく、人気が
あるチームが強いチームとは限らないってのは分かるでしょ?
105 :
:02/12/07 11:26 ID:cunV/7FO
>>104 強いから人気が出るってのも否定できないからなあ。
人気があるから儲かる。儲かるからいい選手を呼べる。で強くなるって言うのも否定できないし。
何でそう自信満々にアタマから否定できるのかわからないなあ。
106 :
103:02/12/07 11:50 ID:dQmTojUr
>>104 ちと書き方がまずかったみたいだね。
相関性高そうだから相関係数求める気が涌いてきた。
やってみる。
って事だ。
107 :
:02/12/07 13:55 ID:Y1DnDGV/
まぁまぁ、そういう議論に対していっていの根拠をあたえるために
統計学があるってわけで。まぁまったりといきましょうや。>103-105
108 :
:02/12/07 14:05 ID:Y1DnDGV/
とりあえずネタの提供として、観客動員スレッドから
データを持ってきて、右端に勝ち点をくっつけてみた。
誰か技術のある御仁、平均観客数と勝ち点との間で相関を取ってみてくれんかな?
チーム名 平均観客数 勝ち点
1位 浦和 26296 35
2位 横浜M 24108 55
3位 FC東京 22173 39
4位 仙台 21862 32
5位 鹿島 21590 53
6位 札幌 19139 15
7位 磐田 16564 71
8位 名古屋 16323 45
9位 東京V 15128 37
10位 清水 14963 41
11位 G大阪 12762 54
12位 柏 11314 32
13位 広島 10941 26
14位 神戸 10467 31
15位 京都 10351 46
16位 市原 7897 41
109 :
:02/12/07 14:22 ID:2+CFSsi4
>>108 技術も何も、Excelに貼り付けてCORREL関数で出すだけじゃん。
0.087
110 :
:02/12/07 14:24 ID:2+CFSsi4
>>108 あとな、データ分析してほしいときは、数値はカンマで区切るのが親切だ。
>>105 > 何でそう自信満々にアタマから否定できるのかわからないなあ。
普段J見てる奴だったらわかるだろ。札幌、仙台は弱いけど動員は上位じゃん。
112 :
:02/12/07 17:29 ID:E92Dw/I7
>>111 統計スレだってわかってる?
一部が当てはまらないからといって決め付けるのがおかしいと言ってるんだろ?
それに、実際、正の相関が出てるじゃんよ。少なくとも逆相関ではない。
113 :
U-名無しさん:02/12/07 21:18 ID:bKg3Zd2F
>>108>>109 乙仮
0.1を下回るのか、、、
マイナスじゃなくてよかったよホント、、、
もしマイナスなら名古屋に2回は行かないかもしれなかったよ。
114 :
:02/12/07 22:02 ID:J5pJAO6m
そんな数値じゃ相関があるとはいえないんじゃ?
115 :
:02/12/08 02:28 ID:5aG/5rF0
>>114 相関があるとはいえない→「明らかに違う(マイナスの相関)」という決め付けは誤り。
116 :
:02/12/08 13:43 ID:9lRZNk38
ホームの人口とかスタジアムが専スタor陸上競技場かとかっていう要因が
いまのところ混入してるんだよね。
そのノイズの部分までちゃんとデータとして処理してやれば、
勝ち点と観客数のあいだの関係もかわってくるもんでしょか?
多変量解析にくわしいヤシ、おしえてくだされ。
117 :
:02/12/08 13:52 ID:z/8yk14z
>>116 他にも、イケメンがいるチームはギャルサポの動員が高い。
ホームタウンの分布の相違(首都圏に集中している等)ことから、
Awayサポの動員の有利不利。
スタの立地やアクセスの良し悪しなどなど。
関係は無くはないだろうが…。
平均観客動員≒人気≠強さ
118 :
:02/12/08 13:56 ID:9lRZNk38
,,,と、、丸投げにしてしまうのも何なので、とりあえず
スタの種類だけでもデータ化してみました。
専用=1、専用以外=0で。レッズ、ぐらは0で。
東スタ・札幌ドーム=0とした。
動員順位,チーム名, 平均観客数, 勝ち点, スタ種
1位, 浦和, 26296, 35, 0
2位, 横浜M, 24108, 55, 0
3位, FC東京, 22173, 39, 0
4位, 仙台, 21862, 32, 1
5位, 鹿島, 21590, 53, 1
6位, 札幌, 19139, 15, 0
7位, 磐田, 16564, 71, 1
8位, 名古屋, 16323, 45, 0
9位, 東京V, 15128, 37, 0
10位, 清水, 14963, 41, 1
11位, G大阪, 12762, 54, 0
12位, 柏, 11314, 32, 1
13位, 広島, 10941, 26, 0
14位, 神戸, 10467, 31, 0
15位, 京都, 10351, 46, 0
16位, 市原, 7897, 41, 0
専用のスタジアムの数自体がすくないから、あんまり
意味がないデータかな、、、
119 :
U-名無しさん:02/12/08 18:21 ID:jJTz8Nuz
>>118 ちゃちゃ入れすまんが
柏は
柏スタ(11回)専用
柏の葉(鹿、磐の2回)兼用
国立(赤、鞠の2回)兼用
で様相が大きく違うってのも要因として入れてほしいな。
あと
エコパ、ズビスタ
さいたま、駒場
味の素、国立
とかもね
120 :
:02/12/08 18:45 ID:9lRZNk38
>>119 118はホームが専用かどうかの1/0にしてあるけど、
専用スタジアム使用回数をデータとして採用した方がよいかもね。
121 :
:02/12/08 21:35 ID:3Bq6evlV
>>115 そんなこと言ってないし、意味わかんないよ。
直近のレスみたけどそのようなことを言ってる人もいないようだし。
俺は単に、
>それに、実際、正の相関が出てるじゃんよ
に違和感感じただけ。
122 :
U-名無しさん:02/12/09 12:07 ID:yLorYh9l
総年俸一覧ってどこにあるんだろ、、、?
123 :
U-名無しさん:02/12/09 23:55 ID:S2yhJSkF
age
125 :
U-名無しさん:02/12/10 23:12 ID:PHerxJfZ
来年から延長無くなるよね?
今年の延長突入率と来年の引き分け率が
大幅に違ってたらおもろいよね。
126 :
U-名無しさん:02/12/11 13:25 ID:H9fTTcc7
>>125 なんか笑ったよ
後半の戦い方に違いあるのかね?
>>125 それは調べてみる価値あるね。
今年延長が多かった磐田がどの程度変貌するのか、とか興味深い。
128 :
U-名無しさん :02/12/11 15:24 ID:RViIUk/0
いやあ、このスレ語っちゃてるね(w
思わずお気に入りにしたよ。
で、totoGOALの必勝法教えれ。3^5だから勝敗は楽勝だよね?
スコアを当てるのが難しいな。
129 :
U-名無しさん:02/12/11 16:41 ID:UO3grK0P
130 :
U-名無しさん :02/12/11 17:26 ID:RViIUk/0
>>129 …多分。5試合の勝敗を当てるって意味ね。
最終的には4^10で約105万通り。
>>128 5試合の勝敗全部当てるのは必須じゃないぞ、2等ならね。
チャチャ入れして申し訳ないが、天気もかなり絡んでくるのでは?
(ちなみに蟹は雨では全く勝ってません。)
133 :
U-名無しさん :02/12/11 17:53 ID:RViIUk/0
>>132 天気かあ…点数で評価しにくいんだよね。
保守
天気のほかに、時間も要素としてあるね。
柏は夜の日立台で強い、とか。
136 :
:02/12/13 01:26 ID:i4xfom9+
仮説のない検証は無意味。だから何?って
137 :
U-名無しさん:02/12/13 01:28 ID:KMlISa8D
>>135 日立台に来たことある?
あそこは観客席から近いし雰囲気が独特だからね。
ヤジとか選手にもろ聞こえらしい。
(今日更新の公式ホムペのレイソルカフェに根引が書いてた)
138 :
U-名無しさん:02/12/14 09:28 ID:qM0nlAA+
age
139 :
U-名無しさん:02/12/14 16:16 ID:+JVTe74C
でもさ
試合って1回やるのに何百万とか経費が掛かるよね?
それを711回も実験をやってくれてるってのは
ある意味すごいね。
140 :
、。、:02/12/15 08:27 ID:p1YRp7Sy
上げ
141 :
U-名無しさん:02/12/15 20:13 ID:8cUC8z6+
試合には関係ないが、、、
選手11*2=22人で
同じ誕生日の人がいる確率は5割を越える、、、
142 :
:02/12/15 20:44 ID:68hFdyWK
要は、因子を並べて強いか弱いかを重回帰分析したいわけだな。
因子として、
観客動員
専用スタジアムの有無
ホームタウンの人口(ここで負がでたらおもしろい)
ホームの年平均気温
同じく降水量
こんなの出してみましょうか。
143 :
U-名無しさん:02/12/16 02:14 ID:Tp3KoZ3P
144 :
:02/12/16 02:16 ID:NUM0tWz/
やるなら独立性とかきちんと見てからやれよ。
このスレ、どうもちょっとかじった奴がわかったようなことを言ってるだけっぽいからな。
145 :
U-名無しさん:02/12/16 03:03 ID:Tp3KoZ3P
>>144 漏れも最近大学で習っただけなんで
違うかもしれんが
3つのパラメーターa,b,cに対して
強さの関数をy=f(a,b,c)で表せるとして
cがa,bで表されても(c=g(a,b)としときまつ)
y=f(a,b,g(a,b)ってなるから
独立じゃ無くてもいいんじゃないかな?
146 :
:02/12/16 03:35 ID:NUM0tWz/
>>145 w
で、そうしたらあんたはaとbのほかにcという要素があると主張すんの?
頼むから頭使ってよ
147 :
U-名無しさん:02/12/16 04:15 ID:Tp3KoZ3P
>>146 ん?
cはあってもなくても
別にそんな事はどうでもいいが、、、?
ある程度正確な回帰式が作れればいいんじゃん?
つか何でそんなに煽ってるの?
むかし、他競技で「某球団は○○○以下」という発言をしたあと連敗したということがあったが。
サッカーで福田が「負けないよ」発言をした後、8勝1分けだった浦和が8戦8敗したけどこのようなことが起きる確立はどれくらいなのかな。
どうも統計屋とギャンブラーでは、データに対するスタンスが違うようだなw
有意差ぐらい嗅覚でわかりそうなもんだが。
漏れが知りたいのは今節+1の試合結果であって、過去のデータの整合性や
長い目で見たら当るかもなんて悠長な話ではないぞ。
ま、素人は順位表をじっくり分析することをお勧めする。
150 :
U-名無しさん:02/12/16 15:10 ID:aEIdLi6C
>>149 スレ違いでは?
あなたはギャンブラーの様だから
トトのスレとかの方が合ってるかも。
それと素人って何の?
ギャンブラーの?統計屋の?
151 :
:02/12/16 18:29 ID:tXyEuvUG
>>147 おいおい・・・
キミに統計処理はムリみたいだね
152 :
U-名無しさん:02/12/17 14:33 ID:ZOCSPev7
誰か新ネタないの?
153 :
U-名無しさん:02/12/17 17:07 ID:UUMuOD90
>>151=
>>39だと思われ。
お前は動こうとしている香具師にいちゃもんばかりつけてないで、
早く統計屋の信頼できる分析みせろや。
155 :
U-名無しさん:02/12/17 17:59 ID:UUMuOD90
>>154 俺は統計屋じゃないから催促してる身。
せっかく誰かが動こうとしているのに潰すんじゃねーよと。
別にそうやって何も出ないまま、ただ概念論だけやっててもいいけどな。
できないのに口挟むなというのなら、みんなレスできんよ。
できるできると言ってても示してないんだから。
156 :
:02/12/17 19:00 ID:go3J5tF8
>>155 あきらかにおかしいものをおかしいと突っ込んでるだけに見えるんだが・・・
俺がおかしいのか?
157 :
U-名無しさん:02/12/17 19:06 ID:UUMuOD90
>>156 だから、おかしいおかしいばかり言って、何も出て来ないじゃないか。
ここは
>>151みたいなのが無知な香具師を叩くだけのスッドレですか?
叩くだけでなにも出さないから勘違いも増えるんだろ。
だから、とりあえず何か出るまでは何も意見しないつもりだったんだが。
自分の認めた物以外が出るのを妨害する自治厨がいるから何も発展しない。
全否定ばかりじゃ誰も何もださねーよ。
それとも、スレ潰しでわざとですか?
158 :
:02/12/17 19:09 ID:go3J5tF8
>>157 何この人。あんた論文とか書いたことないの・・・
何かをまともにやろうとしたら叩かれても大丈夫なやり方でやるに決まってんじゃんよ。
根本的にわかってないヤシが突っ込まれるのは当然だろう。それがいやならこんなとこに
書き込まなきゃいい。
159 :
:02/12/17 19:12 ID:go3J5tF8
つか、やれば?
トンデモな結論に突っ込んであげるからさ。そっちの方が荒れそうだからさきに釘刺してみたんだけど。
ここは学会ですか?知らなかった・・・
叩き上げる場だとばっかり思ってました。
すんませんねぇ。次からはそうスレタイに書いて置いてください。
間違える香具師が漏れ含め沢山いますので。
161 :
:02/12/17 19:18 ID:go3J5tF8
>>160 「確率統計」関係ないスレなんだっけ。
じゃ、どうぞご勝手に無駄な努力をしてくださいw
>>161 (´-`).。oO(誰が確率統計関係ないっていったかなぁ。)
163 :
:02/12/17 19:33 ID:go3J5tF8
>>162 確率統計って一応学問なんだけど・・・
最初から前提も方針も基礎理解もめちゃくちゃで何とかなるなら、何も言わないのでがんがれ!
あー楽しみ。
>>163 (´-`).。oO(気が済みましたか?)
今年のどっかのスポーツ新聞にいろんなデータが出ていて
ジュビロの雨の試合での勝率の低さ、逆にアントラーズ、マリノスの高さ
延長時のエスパルスの勝率の高さとかが目立ってた
166 :
:02/12/17 21:20 ID:llw8ga26
なんか必死なのが一人いるな
167 :
U-名無しさん:02/12/18 04:50 ID:fh//cesx
レーティング作ってた人がいたけど
やっぱ正規分布になるのかな?
結果きぼーん。
168 :
U-名無しさん :02/12/18 07:15 ID:camyrAgZ
つうか、レーティングはとりあえず勝ち点でいいだろ。
チームの優劣決めないとアプセットも定義できないよ?
劣勢チームが勝つのがアプセットなんだけど?
169 :
:02/12/18 15:26 ID:+bA19Wil
チームの強い弱いより選手が入れ替わったり出場停止とかそのときの順位の影響の方が大きい
170 :
U-名無しさん:02/12/19 03:04 ID:blPUFuWf
ゲーム理論とかは違うのかな?
ひとつのプレーに対してナッシュ解はどうこうとか。
171 :
:02/12/19 03:10 ID:UU/edLu6
おか
172 :
:02/12/19 07:25 ID:4cS5437a
>>170 任せた。10年後にサカつく20とかに反映されるのを期待してるぞ!
ここではプレーの選択肢が〜で有利な選択をしたとして、相手がこう来るときはこうだから・・・
みたいな。
173 :
U-名無しさん:02/12/19 11:32 ID:1KgnfKaA
>>26だが、それなりにちょっと勉強してきました。
自分ではチェスで使われているレーティングを
サッカーに応用できないかなと思ってたのだけど
形だけ真似してたみたいですね。
結局、イロ式レーティングというシステムを使って
チームの実力を数値で評価したいのですが、
ご存じの方いませんかねぇ?
174 :
U-名無しさん:02/12/19 14:43 ID:mirfmJUx
ゲーム理論とはちがうかもしれんが
昔アジアの大会の本戦
(W杯みたいに初めはリーグでそのあとトーナメント)で
ーABCD
A×未○○
B未×○○
C●●×○
D●●●×
つまりABの勝ち抜けは決まってるが
順位までは決まってないって状況で
トーナメントの相手が
1位ー開催国で実力も高い国
2位ー弱いチームが偶然1位に
って感じになって
試合始まった時からどっちもowngoalしまくりで
没収試合、CDが決勝へ
ってことがあった気が
175 :
:02/12/19 16:01 ID:H7hxeYx9
176 :
U-名無しさん:02/12/21 00:33 ID:v2Grwpmk
>>174 しみじみだね、、、
どっちも負けたい訳だ、、、
177 :
:02/12/21 17:12 ID:chBcLF9g
> 試合始まった時からどっちもowngoalしまくりで
それってどうやるの?
得点された方のキックで試合再開するんだから、
最初にowngoal作戦に出た方は、二度とボールを奪われることなく
owngoalを量産できるような気がするんだけど……
178 :
174:02/12/21 22:45 ID:C10vziJm
>>175 いや、このレーティングシステムは
勝率に基づくレーティングなので、レーティングを算出すれば、
2チーム間の勝率を予想することができます。
原則として、あるレートのチームに76%の確率で勝てるチームは
レーティングが200点高くなります。
また、標準偏差σ=200点となります。
私もページを読んで得た知識ですが。
179 :
:02/12/23 22:32 ID:uVBhUQ+O
age
181 :
U-名無しさん:02/12/25 19:44 ID:TFJv37Oo
鹿島、清水のナビスコのシードはやりすぎだと思う
A,2/4
B,2/4
C,1/4+ワイルドカード
D,1/4+ワイルドカード
E,1/2(鹿島vs清水)
あたりでいいと思われ
182 :
U-名無しさん:02/12/27 10:30 ID:VDGYbBzS
age
183 :
U-名無しさん :02/12/29 14:56 ID:nQ8olVXp
来年は、各チームの得点力を評価して、スコアを予想するとか
建設的な話をキヴォンヌ
184 :
:02/12/30 18:21 ID:EqUqatMB
ほら結局無理だったろ?
185 :
:02/12/31 20:27 ID:ZorQbIjY
174氏のレーティングは上手くいったのであろうか?
186 :
:03/01/01 17:41 ID:wqOZhHWH
187 :
U-名無しさん:03/01/03 12:17 ID:QqlSNZY/
人口とか降水確率とかのデータのある
サイトを知りたい訳だが、、、
188 :
:03/01/03 12:20 ID:5UJD/CUH
なんだ、この2ちゃんにあるまじき知的なスレは?・・・
189 :
:03/01/03 14:35 ID:203dkIs+
かと思えば意見の対立ですさんだりしてる
せっかくいいスレなんだし、もっとお互いの方法論を尊重しあえよw
学問とデータなんざダメもとの繰り返しだろ…
190 :
U-名無しさん:03/01/03 20:05 ID:b8bkRQIZ
191 :
:03/01/04 02:33 ID:5q+D5MJT
>>189 ダメもとと明らかに間違ってるのとは違うと思うが
192 :
U-名無しさん:03/01/06 02:50 ID:5aQjyJnz
観客動員と勝ち点
負の相関キタ━━━(゚∀゚)━━━!
札幌、浦和の低迷と
磐田のホームの収容人数の少なさが原因か?
193 :
桐蔭がんばれ:03/01/06 02:55 ID:MUfeYAyJ
検定よくは混乱します
194 :
U-名無しさん:03/01/07 00:55 ID:hKaJmFHV
>>192 去年アウェイを含めて全試合行ったが
最終節まで残留争いをしてました。
行かない方がよかったのか?
195 :
:03/01/07 01:23 ID:qMMhOj2W
個別の原因が判明している物事をわざわざ相関係数にして話を混乱させてるのを、
知的だと勘違いしている低能が集まってるスレ
196 :
U-名無しさん:03/01/07 12:19 ID:XqEw5uXF
>>189は神
>>195にはこの歌を捧げよう
戦う〜きみ〜のう〜たを〜
戦わない奴らが〜笑う〜だろ〜
ファイト!
197 :
:03/01/07 15:28 ID:Wo4iCiD9
よあけーまぎわのー吉野家ぁではー
198 :
:03/01/07 20:12 ID:rbr2cg9l
>>196 誰も戦って無いじゃん。素人がちょっと知的ぶりっ子を繰り返していなくなるだけでさ。
199 :
山崎渉:03/01/08 11:56 ID:93g/003D
(^^)
200 :
:03/01/09 17:15 ID:cSZkYkEs
きんきゅうふじょう
ここがうわさのていのしゅうごうすれですか?
202 :
U-名無しさん:
ちと計算しますた
勝ち点と、、、
降水確率との相関係数=0、39
平均気温との相関係数=0、48
市の人口との相関係数=ー0、11 キタ━━━(゚∀゚)━━━!
観客動員との相関係数=0、06