1400

ベイズ統計モデリングでぷよぷよ最強リーガーの「強さ」と「勝負ムラ」を推定してみた

by
Bo_no36
Bo_no36
はじめに
最強リーグ、真剣勝負の連続でとても良かったです。
season1 ~ season3まで見どころ満載で、毎週楽しみに見ていました。

最強リーグの結果について、私なりに面白さを伝えられないかと思い、記事を書きました。
本記事では、ぷよぷよ最強リーグに出場しているぷよらーの「強さ」と「勝負ムラ」について、ベイズ統計モデリングという手法で推定してみました。
※ 技術的な話は極力割愛します。詳しく知りたい人はこちらへ
https://qiita.com/Bo_no36/items/c6ce9e27d4e655a52e62



方法
結果は最強リーグHPのリーグ表にまとめられています。
これはseason1の結果ですが、season1 ~ season3の結果を用いて分析しました。


今回の分析では、ベイズ統計モデリングという手法を用いました。単純な勝率でも各ぷよらーの強さを測ることができますが、ベイズ統計モデリングを使うことで、例えば以下のように勝率とは別の角度からの分析ができます。
・直接対決していないぷよらーでも強さを比較できる
 └ 例:season1出場のレイン選手と、season2出場のSAKI選手
・勝負ムラの大きい or 小さい選手がわかる

「強さ」と「勝負ムラ」は下図のようなイメージで、強さに差がある選手同士でも、調子次第では勝ったり負けたりするランダム性を表現しています。






結果
推定結果の前に、season1 ~ season3の勝率を可視化しておきます。


(敬称略) 勝率はmomokenが0.88、マッキー0.80と圧倒的な勝率を納めています。次いで、ともくん 0.40、delta 0.40、ぴぽにあ 0.32、SAKI 0.30と続きます。


次に、「強さ」・「勝負ムラ」の推定結果に移ります。


「強さ」については、やはりmomokenとマッキーは圧倒的な結果でした。3位~5位について、勝率では「ともくん = delta > ぴぽにあ」とぴぽにあが劣る順位でしたが、推定結果では「ともくん ≧ ぴぽにあ ≧ delta」の順位になっていました。勝率ではぴぽにあが過小評価されていましたが、3人にほとんど差はない推定結果となっています。
また、直接対決のないSAKI・ヨダソウマ・レインでは、SAKIが最も強い結果になっています。確かに、SAKIはseason2に出場し、ぴぽにあ・ともくんに勝っていたのは印象的でした。

「勝負ムラ」も確認します。最も勝負ムラがないのはdeltaです。deltaは試合中でも比較的リアクションが小さく、メンタルの崩れも小さい安定した選手だったように思います。一方、勝負ムラが大きいのはヨダソウマ、レインでした。二人とも勝率では奮わなかったものの、30先では他選手を追い詰めている試合も見られたことから、調子の波が大きいとは推定されたと思われます。

最後に、momokenとマッキーのパフォーマンス(強さと勝負ムラから想定される結果)を可視化してみます。

青線がmomokenで、赤線がマッキーです。二人とも「強さ」にほとんど差がなく、マッキーの方が少しだけ「勝負ムラ」が大きいです。
momokenの方が安定感がありそうですが、どちらが明確に強いと言えそうにはないです。



今後の展望
最強リーグのseason1 ~ 3まで全75連戦(3898試合)を対象にしました。今後、新しい参加者のデータも集まってきたら、ぜひまた分析してみたいです。
また、今回はぷよらーの「強さ」と「勝負ムラ」を推定しましたが、「土台」の強さも推定できたら面白そうだなと考えています。
 例:本人の強さを除外して、純粋にGTRとメリ土台ならどちらが強いのか?

最後まで見て頂きありがとうございました。
ぷよぷよ最強リーグが今後も盛り上がるよう、一視聴者として引き続き応援していきたいです。
 
更新日時:2021/10/03 22:26
(作成日時:2021/10/03 22:06)
コメント( 3 )
w.i
w.i
10月3日 23時34分

Qiita のほうも拝読しました。
入力のデータ形式は一試合一行とのことですが、ある二人が二回連戦して 30-0 と 0-30 だった場合と、一回連戦して 30-29 だった場合の扱いがほぼ同じになりますよね。
直感的には、前者の場合は勝負ムラが大きく評価されるように効いて、後者の場合はこれだけではわからないと思います。
これらが区別できないこの入力形式で、勝負ムラが正しく推定できているのか?という疑問を持ちました。
あまり詳しくないので的外れだったら申し訳無いです。

machine322
Bo_no36
まーがる
Bo_no36
Bo_no36
10月5日 3時12分

コメントありがとうございます!

その考え方は正しいと思います。
w.i.さんのおっしゃる通りですが、ただ、データは既に見ており、そこまで極端では事例は発生していないため、考慮しなくても良いと判断致しました。仮にそこまで大きければ、過分散などを考慮して別のモデルを再度考える必要があると思います。

machine322
w.i
w.i
10月5日 22時5分

ご回答ありがとうございます。
マッキーさんとともくんさんとの試合で実際に 30-8 と 20-30 というのが起こっているので、
この点を考慮したモデルを使った場合に今回の結果がどう変わるのかは気になりました。
興味深い話題をありがとうございました。今後の記事も楽しみにしております。

Bo_no36
コメントするにはログインが必要です
シェア