2846

おいうリーグS級と"momoken vs マッキー 「1000本」先取"の全(?)配ぷよデータを公開してみた

by
低頭ちゃん
低頭ちゃん
公開した配ぷよデータについて
以前の投稿で、ぷよクロとぷよスポの配ぷよについてデータを公開せずに議論したが、その後データを整理しなおしたので改めて公開する。(そこではこの問題について「現状個人的な優先度があまり高くない」と述べたが、より優先度が高い課題というのはもちろん、前々回前回の投稿で扱った、ACぷよ通の配ぷよ分析だったわけである。なお、この機会に、前回投稿時に公開したmomoken連戦祭の配ぷよデータ猪瀬イノ氏のぷよぷよ連鎖シミュレータへのリンクを追加した。)

データは次で公開する。
https://2424study.netlify.com/oius_mm1000_haipuyo/

以前の分析では、投稿で述べた通り、ぷよスポの配ぷよに関してはmomoken氏の連戦動画を約1700本分私の判断で選択して用いたが、今回はその後行われた"momoken vs マッキー 「1000本」先取"の動画を用いた。これは動画品質が一定していて扱いやすいというのが主な理由であるが、試合の選択に関する恣意性を回避するという点でも理にかなっていると言っていいかもしれない。ただ、(これはおいうリーグについても言えることではあるが)データが短期間に行われた長い連戦に偏っていることには一応注意しておくべきだろう。

投稿タイトルに「(?)」をつけたのは、データの精度についてはっきりしたことが言えないからである。私自身はこのデータに一定の信頼を置いているが、その信頼の一部はデータ作成手法を知っていることからきている。しかし私はデータ作成手法を公開するつもりはないので、その点を読者と共有することは出来ない。ただ、以前の記事で書いたことの繰り返しであるが、「私は自分自身の納得のために十分と思われる程度の検証はした」とだけ言っておく。

これらのデータについて、以前行ったように、一致数等に関する分析をしてもよいが、それで新たに信頼度の高い情報が加わるわけではないので省略する。一応、前回用いた「偏り」指標に基づいて、このデータを65536通りの配ぷよデータと比較した結果だけ示しておこう。配ぷよ128手全体による「偏り」、「偏り(組)」に加えて、実戦で問題になりやすい配ぷよ冒頭部分の比較の一例として、冒頭30手の「偏り(区間)」、「偏り(区間、組)」の値も示しておく。括弧内には、それぞれのデータセットと同じ本数のデータを65536通りの一様分布から復元抽出した場合に得られる各種「偏り」とその標準偏差を、モンテカルロ法(試行10000回)で推定した結果を示す。
 
配ぷよセット 偏り 偏り(組) 冒頭30手偏り(区間) 冒頭30手偏り(区間、組)
65536通り配ぷよ 11.397 2.9918 10.063 2.6528
おいうリーグ(3239本) 11.421(11.397±0.026) 2.9979(2.9918±0.0066) 10.082(10.064±0.042) 2.6552(2.6530±0.011)
1000先(1937本) 11.404(11.397±0.034) 2.9954(2.9919±0.0087) 10.032(10.063±0.056) 2.6390(2.6529±0.015)


このデータから法則を見出そうとする人へ
以前の投稿で私は「ぷよクロ、ぷよスポのデータそれぞれに、私が発見できていないなんらかの規則性があるといった可能性は否定できない」と書いたが、その状況は変わっていないから、自分で法則を発見すべく分析する人も現れるかもしれない。そのような人のために一つ注意しておくと、例えばこのデータの全貌を眺めたうえで、なんらかの統計的偏りと思しきものを見出したとして、それを統計的仮説検定によってこのデータ上で検証する、といったことは避けるべきである。バカにするなと言われるかもしれないが、いろいろな事例を見ると、このような基本的な注意が全く無意味とも思えないので念のため書いておく。代わりにどんな手順で分析するのが適切か、といったようなことを書くのはやめておくが、現時点でデータ量が十分というわけでも、追加データの収集が難しいわけでもないのだから、中途半端な信頼度しか得られないような仮説を先走って検証するより、地道にデータ収集を続ける方が有益な場合は多いであろう。
作成日時:2020/03/09 18:01
コメント( 0 )
コメントするにはログインが必要です
シェア