2015年03月08日

戦績データの分析1.5(補足編)


前回の記事で戦績データを使ってちょっとした分析をしました。
その際、細かなところはわかる人にだけわかったら良いかと思い、いろいろと説明を省いていました。ただ、勝率の予測式だけがひとり歩きをして誤解を生んでいるようなので補足をしておきたいと思います。体系的な説明は難しいのでQ&A方式でまとめました。


Q.実際の勝率と予測式の勝率が大きくズレるんだけど?

A.
そもそも、この予測式は戦績のどの項目がどのくらい勝率に影響しているかを計算するためのものです。ですので、予測式からでた勝率は「真の勝率」でもなければ、「レーティング」でもありません。その点はまずご理解ください。
大きくズレる理由として、いくつか要因が考えられます。

 1 サンプリングの問題
 2 国・車種の偏り
 3 戦績にはあらわれない要素

まず、サンプリングの問題が大きいです。元となったデータは「戦績データ表示API」の「TOPランク」の項目から集めたものです。これには「Tier10を所持していて、かつ勝率50%以上、直近1ヶ月以内のプレイ」が条件になっています。また、ランクインしているプレイヤーというのもあって、平均勝率61.7%のデータです。なので、戦闘数が少なかったり、高Tierのプレイ数が少なかったり、勝率に差がありすぎると誤差も大きくなる可能性が高いです(実際の勝率が62%よりも高い人は低く予想されがちで、低い人は高く予想されがち)。

2つめに、国・車種の偏りが考えられます。車両ごとのデータではなく、個々のプレイヤーの全体戦績を使って分析をしています。そのため、ソ連専門やドイツ専門のように国を限定して開発していたり、中戦車専門や駆逐戦車専門のように車種が偏っていたりするとズレが大きくなると思われます。

上記の2点に当てはまらない場合は、数値にあらわれない貢献をしているかどうかになります。例えば、チャットでチームのメンバーを誘導したり、アシストダメージを稼いだり、おとり役をこなしたりといった点です。そうしたことをうまくこなせれば、きっと予測式ででた勝率よりも実際の勝率のほうが高くなるでしょう。

誤差が大きいといっても相対的なものなので、大きいのか小さいのか判断しかねると思います。元データで予測式と実際の勝率の誤差を計算したところ、平均が0(計算の性質上当然)、標準偏差が1.30となりました。誤差が±1.3%の範囲におさまる人が全体のおよそ70%、誤差が±2.54%の範囲におさまるのが全体の95%です。国や車種の偏りもなくさらに高Tierでのプレイ・戦闘数もじゅうぶんにあるとして、それでも±2.5%以上の誤差があるならば、数値にあらわれない貢献ができている/できていないと考えても良いと思います。


Q.結局、平均スポット数がいちばん大事なの?

A.
前回の説明は小隊勝利率や与ダメージ、平均スポット数のようにスケールの異なる尺度を一度に扱っていました。予測式では平均スポット数の係数が大きくなっていて、勝率には平均スポット数がいちばん大切なんだと思われたかもしれません。このあたり、私の説明不足です。各項目のスケールを統一して、勝率に対する影響力を数値化したもの(いわゆるt値)を下に紹介しておきます。

 小隊勝利率 12.50
 生還率 13.48
 命中率 2.44
 平均与ダメージ 16.34
 平均スポット数 11.30

この値が大きいほど勝率との関連が強いということになります。もっとも勝率に寄与しているのは平均与ダメージです。他の項目よりも頭ひとつ抜けていますね。小隊勝利率と生還率、平均スポット数はおおよそ同程度と言えそうです。他と比較して命中率はオマケ程度といった印象です。

もし勝率を上げたいと思ったら、与ダメージを上げるのがいちばんなのですが、なかなかそう簡単にはいかないと思います。上の5項目のなかでもっともプレイヤーが操作しやすいのは小隊勝利率です。相応の相手と小隊を組んでプレイすれば勝率も上がり、また同時に腕も磨かれていくことでしょう。それから、平均スポットも与ダメージに比べて少しの意識で上昇が狙える項目だと思います。平均スポット数を1上げるのは難しいですが、0.1や0.2上げることは不可能ではありません。無理をするのはよくありませんが、意識して取り組めば今よりも10戦に1両や2両多く敵を発見できると思います。勝率アップを目指す方はぜひ覚えておいてください。


Q.小隊を組めば他の項目も値が上がるんじゃないの?

A.
小隊を組むと他の項目ももちろん上がる可能性が高いです。ただ、前回の分析手法は各項目間の影響を考慮して計算されています。なので、生還率や与ダメージ、平均スポット数などと“独立して”小隊勝利率は勝率を上昇させます。その値が、小隊勝利率1%あたり、0.05%ということです。
もう少し噛み砕いて説明すると、生還率や命中率、平均与ダメージ、平均スポット数、平均Tierがまったく同じプレイヤーがいたとします。一方は小隊勝利率30%、他方は10%です。その際に、前者は後者よりも1%程度勝率が高くなるということです。もし、小隊を組んで他の項目も上がれば、その1%に上乗せで勝率にもっと差が出ることになります。
小隊相手にどのようなプレイヤーを選ぶのかというのも大事でしょうが、データにない以上分析しようがありませんので、そのあたりはなんとも言えません。


以上、誤解を生みそうなところに補足をしておきました。
本家WoTのレーティングもおそらく基本はこうした計算をもとにして作っていると思われます。もう少し当てはまりが良いように、項目によって非線形のモデルを導入したりいろいろと工夫をしてはいますが。
ラベル:戦績データ
posted by ゾリ at 11:00| Comment(2) | データを読む | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
標準化した分析もされていたのですね。失礼しました。
先の予測式も、各項目の直接見える数値がどのくらい反映されるかを示すものとして便利だと思いますが、項目間の相対的な重みを示すこの分析も、面白いです。
ここにない項目としては、アシストダメージがどのくらい影響するのかが個人的に興味ありますが、API Serviceにないので、分析しようがないですね(多分データを残してないんでしょう)。

ちなみにこのAPI Service、ちょっと面白いです。条件検索はできなさそうなので、データ収集にはロボット(クローラ)を作る必要がありますが(cellbrockさんのサイトでは既に実装されてるようですね)、プログラミングが好きな方ならいろいろ遊べそうです。
Posted by stephen at 2015年03月15日 01:42
>>stehenさん
こんにちは。
アシストダメージもわかればチームへの貢献度やいろいろなスタイルのプレイヤーがわかって面白そうですね。単にプレイして楽しむ以外にも、Blitzの世界についてあーだこーだ話すのも楽しいです(*^_^*)
Posted by zoli at 2015年03月17日 12:01
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

×

この広告は1年以上新しい記事の投稿がないブログに表示されております。