WBC選手名鑑の作成に際して、途中でミスに気付きつつも、大会開始の締め切りまで時間が無く、泣く泣く妥協した点の数々をここに書いておきます。また、今回の試みとして「MLB換算」という、だいぶ乱暴な取り組みを行いましたので、それに関する言い訳をツラツラを書いておこうと思います。
また、当サイトに掲載している成績情報は、時間に追われながら独自に集計を行ったもので、間違いやミスが確実に(?)あると思いますので、寛大な心で許して頂ければと思います…。
1.投手成績 FIP
基本的にBaseball-ReferenceからStandard Statsを元に集計しておりますが、FIP(=Fielding Independent Pitching)も独自に計算をしております。FIPでは、数式の中にある定数を、防御率に合わせるように設定する場合と、失点率をベースにする場合があります。当然、防御率をベースにしたFIPよりも、失点率ベースのFIPの方が大きい数値になります。今回、あまり深く考えず失点率をベースに計算していましたが、防御率と比較するならばスケールを合わせる必要がある事に気付かず、気づいた頃には2月末…。という事で、「なんだかFIPの値がFangraphsやBaseball-Referenceと違うぞ」と思われた方は正解です。両者とも防御率ベースのFIPにしています。2022年のMLBで失点率と防御率の違いは0.38ですので、だいたい0.4くらい下がった値だと思って見て頂ければ思います。
2.打撃成績 wRAA
打撃による得点貢献の平均比を表すwRAA(=weighted Runs Above Average)を計算するには、wOBA(=weighted On-Base Average)を計算する必要があるのですが、wOBAを計算するには、各成績に対する係数だったりwOBAスケールってのを計算する必要があります。この係数やwOBAスケールは、リーグやシーズンによって係数が異なります。wRAA算出に際して、同じ係数を使うことも考えたのですが、”打高投低”のリーグもあれば”投高打低”のリーグもあるので同じ係数の使用にはちょっと抵抗がある。一方でリーグ毎の係数算出はとても面倒なので、今回はNPB STATSさんのサイトに記載されている、Run Valueの近似値計算式を使用させて頂いております。なので、MLBやNPBのwRAAが、FangraphsやDeltaの情報と違っていると思いますが、そのような背景です。
3.守備成績 RRF
各選手に守備スタッツのグラフを入れています。MLBでの成績はDRSを、NPB1軍はUZRを使っていますが、それ以外のリーグの守備指標は、日本プロ野球RCAA%Piching RunまとめBlog さんのRFF(=Relative Range Factor)をベースにした守備得点を集計させて頂いています。MLBやNPB以外の海外リーグというのは、ゾーン系守備指標のDRSやUZRといったデータがあることはありません。そこで、ざーっくりその選手の守備が良い/悪い/普通くらいがわかるようになればいいや、という感覚でレンジ系であるRRFの考え方を使用しています。UZRとの相関係数が0.7くらいと聞いたことがあるので、目的と照らし合わせればRRFでも十分と判断しました。しかし、実はRRFの元となる捕殺や刺殺の情報もないリーグがあります。ニカラグアとコロンビアのウィンターリーグ。キューバのセリエ・デ・ナシオナル。オランダのフーフトクラッセ。American Association の外野守備成績。これらにはRFFを計算していません。
そして、最大のミスは、各選手の守備成績グラフの凡例に間違えて「RFF」と書いてしまったことです。もう直す時間がないので、ご容赦ください。
4.MLB換算について
WBCに出場する選手は、有名なメジャーリーガーだけでなく、マイナーリーグや独立リーグだけでなく、各国のウィンターリーグでプレイしている選手もいます。しかし、海外のリーグで圧倒的な成績を残していても、それがどのくらいの成績なのか判断が難しい。特にメキシカンリーグのように超打高投低のリーグもありますが、メキシカンリーグで高い打率だった打者が、3Aに移籍した途端に大幅に成績が下がることも多々あります。そこで、何とかその選手が'22年シーズンで残したスタッツを見る上で、今回MLB以外の成績から目安を設けるためにMLBベースに換算したスタッツを用意しました。
方法はシンプルに、昨シーズン中に異なるリーグでプレイした選手の成績を、移籍前と後で何%増減したかを集計し平均値を求めました。なお、打率や防御率は年度相関の低い部類のスタッツになるので参考にはせず、打者ならばK%,BB%,IsoP、投手ならばK%,BB%と打数から三振与四球分を除いたHR%の成績の増減%を集計することにしました。K%やBB%の増減が分かれば、同じ打席数における三振数や四球数が分かります。さらに、三振が増える分はヒットも減りますし、四球が減る分は打数が増えますので安打かアウトのどちらかが増えることになりますので、いろいろ前提条件をつけた上で、打率/出塁率/長打率を算出してみました。なお、これはProjectionではありません。実際には、その選手のタイプと移籍先のリーグとの相性だったり、成功しやすい/し難いはあると思います。が、その選手が残した成績をMLB基準で見てみることを目的としていますので、そこは深入りしないでおきたいと思います。
おそらくMLB換算のスタッツを見て、違和感を感じられるところも多々あると思います。まず打者成績のHR数。打者成績を見ると「この選手にしてはHR数多く過ぎない?」と思われると思います。また、試合数の少ない投手の一部については「この投手がメジャー基準にしてこのFIPは良すぎない?」と思われるでしょう。これはデータのサンプルサイズが原因だと考えています。本塁打は三振や四球と比べて1年の発生数が少ないため、リーグ移籍前後の増減割合はばらつきが非常に大きい。また、FIPは被本塁打の数が大きな影響を及ぼすので、幸運にも被本塁打がゼロだった場合は、ゼロに何をかけてもゼロになるのでMLB基準でも被本塁打ゼロになってしまう、と。HRや長打関連の基準は、ちょっと改善すべき課題ありですね。
また、サンプルサイズの問題もありました。MLBと3Aの間を行き来する選手は多いですが、MLB↔2A間の異動はもっと少なくなりますし、MLB↔1Aまで行くとほぼゼロ。なので2Aの選手は、2A↔3Aの成績増減を計算し、それに対して集計済の3A(PCL or IL)↔MLBの増減率をかけて集計しました。このように、掛け算に掛け算を重ねる方法のため、MLBから実力的/地理的に遠いリーグほど、サンプルサイズや増減率の精度が怪しくなりますので、もうそこは仕方ないということで割り切って考えていただきたいと思います。
他にも後悔や言い訳が多々ありますが、ネタが尽きないので以上にしたいと思います。
0コメント