>>300-302 RC=A×B÷C を B=RC×C÷A と変形して、
Bの項目と「得点×C÷A」を重回帰分析すれば、Bの係数が算出できるということですか。
ちなみにBの項目を重回帰分析してみました。
(CORREL) RC(2002)
単打______ 1.124677450 1.125
二塁打_____ 1.251568861 1.69
三塁打_____ 6.391651263 3.02
本塁打_____ 3.809533828 3.73
四死球−故意四球 0.135680644 0.29
犠打+犠飛+盗塁 0.556087222 0.492
三振______ -0.05358247 -0.04
犠打・犠飛・盗塁を同じ価値として重回帰分析するのも問題がありそうなので分けて分析しました。
(CORREL)
単打______ 1.100750407
二塁打_____ 1.441342363
三塁打_____ 5.170146113
本塁打_____ 3.646248368
四死球−故意四球 0.143181216
犠打______ -0.46271213
犠飛______ 1.069587646
盗塁______ 1.097360079
三振______ 0.028764845
データ数が足りないのか、三塁打が正しく評価されないし、
単打・二塁打・本塁打のバランスもRC(2002)の係数以上におかしいような気がするので、
あまり参考にはならなそうです。
RC={(A+2.4×C)×(B+3×C)}÷(9×C)−0.9×C この式の係数の算出方法は、
RC=α(A×B÷C)+βA+γB+δC この形に展開してから重回帰分析して、
α、β、γ、δを算出してから、「出塁能力×進塁能力÷打席」の形に戻したものが、
RC={(A+2.4×C)×(B+3×C)}÷(9×C)−0.9×C
という複雑な計算式ということですか。
どのような方法でこんな複雑な計算式になったのか分からなかったのですが、
こんな調整をしているぐらいだから、それまでの基本形の「RC=A×B÷C」としていたものより
精度が高くなっているだろうと思い込んでいたので、
基本形では得点との相関は調べていませんでした。
検証してみたら1998年版、2002年版ともに基本形の方が相関が高かったです。
ついでにRCの基本バージョンとテニクカルバージョンも載せておきます。
この程度の差だったら、係数を必要最小限に抑えているRC(TECH1)で十分のような気がしますが、
MLBのデータで検証したらどうなるのか気になります。
1955〜2008年と過去10年間(1999〜2008年)のNPBチーム打撃成績を利用して
各種RCと得点との相関係数(CORREL)を計算しました。
期間 1955〜2008 1999〜2008
データ数 のべ653チーム のべ120チーム
RC(BASIC) 0.959772999 0.944375613
RC(TECH1). 0.964067185 0.962633313
RC(1998) 0.963854444 0.962364868
RC(1998)A*B/C. 0.965739489 0.962825870
RC(2002) 0.962719865 0.961211389
RC(2002)A*B/C. 0.964397227 0.961543217
RC(BASIC)=(安打+四球)×塁打÷(打数+四球)
RC(TECH1)=A×B÷C
A=安打+四球+死球−盗塁死−併殺打
B=塁打+0.26×(四球−故意四球+死球)+0.52×(犠打+犠飛+盗塁)
C=打数+四球+死球+犠打+犠飛
RC(1998)={(A+2.4×C)×(B+3×C)}÷(9×C)−0.9×C
A=安打+四球+死球−盗塁死−併殺打
B=塁打+{0.24×(四球−故意四球+死球)}+0.62×盗塁+{0.5×(犠打+犠飛)}−0.03×三振
C=打数+四球+死球+犠打+犠飛
※『野球の見方が180度変わるセイバーメトリクス』という本では2002Verと紹介されていますが、
>>116で1998年版との指摘があったので、区別しやすいようにRC(1998)としておきます。
RC(2002)
B=(1.125×単打)+(1.69×二塁打)+(3.02×三塁打)+(3.73×本塁打)
+0.29×(四球−故意四球+死球)+0.492×(犠打+犠飛+盗塁)−(0.04×三振)
※B以外の計算式はRC(1998)と同じ。