セイバーメトリックス 4

このエントリーをはてなブックマークに追加
307名無しさん@実況は実況板で
>>300-302
RC=A×B÷C を B=RC×C÷A と変形して、
Bの項目と「得点×C÷A」を重回帰分析すれば、Bの係数が算出できるということですか。
ちなみにBの項目を重回帰分析してみました。

             (CORREL)   RC(2002)
単打______ 1.124677450   1.125
二塁打_____ 1.251568861   1.69
三塁打_____ 6.391651263   3.02
本塁打_____ 3.809533828   3.73
四死球−故意四球 0.135680644   0.29
犠打+犠飛+盗塁 0.556087222   0.492
三振______ -0.05358247   -0.04

犠打・犠飛・盗塁を同じ価値として重回帰分析するのも問題がありそうなので分けて分析しました。

             (CORREL)
単打______ 1.100750407
二塁打_____ 1.441342363
三塁打_____ 5.170146113
本塁打_____ 3.646248368
四死球−故意四球 0.143181216
犠打______ -0.46271213
犠飛______ 1.069587646
盗塁______ 1.097360079
三振______ 0.028764845

データ数が足りないのか、三塁打が正しく評価されないし、
単打・二塁打・本塁打のバランスもRC(2002)の係数以上におかしいような気がするので、
あまり参考にはならなそうです。
308名無しさん@実況は実況板で:2008/12/05(金) 00:00:41 ID:8o7VL7iS
RC={(A+2.4×C)×(B+3×C)}÷(9×C)−0.9×C この式の係数の算出方法は、
RC=α(A×B÷C)+βA+γB+δC この形に展開してから重回帰分析して、
α、β、γ、δを算出してから、「出塁能力×進塁能力÷打席」の形に戻したものが、
RC={(A+2.4×C)×(B+3×C)}÷(9×C)−0.9×C
という複雑な計算式ということですか。

どのような方法でこんな複雑な計算式になったのか分からなかったのですが、
こんな調整をしているぐらいだから、それまでの基本形の「RC=A×B÷C」としていたものより
精度が高くなっているだろうと思い込んでいたので、
基本形では得点との相関は調べていませんでした。
検証してみたら1998年版、2002年版ともに基本形の方が相関が高かったです。
ついでにRCの基本バージョンとテニクカルバージョンも載せておきます。
この程度の差だったら、係数を必要最小限に抑えているRC(TECH1)で十分のような気がしますが、
MLBのデータで検証したらどうなるのか気になります。
309名無しさん@実況は実況板で:2008/12/05(金) 00:01:12 ID:D63OkrRZ
1955〜2008年と過去10年間(1999〜2008年)のNPBチーム打撃成績を利用して
各種RCと得点との相関係数(CORREL)を計算しました。

期間          1955〜2008      1999〜2008
データ数       のべ653チーム    のべ120チーム
RC(BASIC)      0.959772999      0.944375613
RC(TECH1).      0.964067185      0.962633313
RC(1998)       0.963854444      0.962364868
RC(1998)A*B/C.   0.965739489      0.962825870
RC(2002)       0.962719865      0.961211389
RC(2002)A*B/C.   0.964397227      0.961543217


RC(BASIC)=(安打+四球)×塁打÷(打数+四球)

RC(TECH1)=A×B÷C
 A=安打+四球+死球−盗塁死−併殺打
 B=塁打+0.26×(四球−故意四球+死球)+0.52×(犠打+犠飛+盗塁)
 C=打数+四球+死球+犠打+犠飛

RC(1998)={(A+2.4×C)×(B+3×C)}÷(9×C)−0.9×C
 A=安打+四球+死球−盗塁死−併殺打
 B=塁打+{0.24×(四球−故意四球+死球)}+0.62×盗塁+{0.5×(犠打+犠飛)}−0.03×三振
 C=打数+四球+死球+犠打+犠飛
※『野球の見方が180度変わるセイバーメトリクス』という本では2002Verと紹介されていますが、
 >>116で1998年版との指摘があったので、区別しやすいようにRC(1998)としておきます。

RC(2002)
 B=(1.125×単打)+(1.69×二塁打)+(3.02×三塁打)+(3.73×本塁打)
  +0.29×(四球−故意四球+死球)+0.492×(犠打+犠飛+盗塁)−(0.04×三振)
※B以外の計算式はRC(1998)と同じ。