843

ツモの偏りの検定:"たまたま"では片付けられない

by
hides_puyo
hides_puyo
こんにちは、hidesです。


前回の記事はたくさんの閲覧、ありがとうございました。
微妙に前回の続きになってはいますが、引用する時には逐一リンクを貼ってありますので、必要に応じて参照していただければと思います。


今回のテーマは「ぷよスポの配ぷよの偏りは偶然と言えるのか?」です。
ぷよスポに限らず、「あとは連鎖を発火するだけだったのに、発火色が10手以上来なかった!」「試合序盤で特定の1色が大量に来て土台組めないんだけど…」といった色の偏りを経験した方も多いかと思います。配ぷよは(おそらく)ランダムに生成されているので、そういった色の偏りが偶然起こることは当然考えられます。

しかし、前回の記事でも言及した通り、ぷよスポの配ぷよにおいて、1ループ128手中に含まれる256個のぷよは4色に64個ずつ等分されています。この256個のぷよからランダムにぷよを選んでツモが決定されるなら、(偶然による多少の誤差はあっても)4色それぞれの累計個数の比率は1:1:1:1になると予想されます。


果たして、ぷよスポにおける配ぷよの色の偏りは、偶然の範疇なのか?


得られたサンプルの分布」と「仮説から想定される理論上の分布」のズレが偶然によるズレなのか、意味の有るズレなのかを検証するためには適合度の検定というものを行います。適合度の検定では、実際の配ぷよに含まれるそれぞれの色の個数が、仮説から想定される個数とどれだけズレているかを計算し、そのズレの大きさになる確率で仮説の正誤を検証します。


ここで、一般的な検定の考え方を簡単にまとめます。
 ①仮説を立てる
 ②仮説が正しいとした場合、サンプルデータが得られる確率を調べる
 ③その確率がα%以下の場合、「①で立てた仮説が間違っていた」と結論づける

αは好きな値に定めることができますが、5%以下にすることが通例です。
発生確率が5%以下であるようなレアなサンプルなら、そもそも仮説が間違っていたと考える訳です。


ここではサンプルデータが「ぷよスポにおける実際の配ぷよ」、仮説が「ツモの色決定で4色それぞれが選ばれる確率は等しいだろう」となります。


それではさっそく検定結果を見ていきましょう。

「色が偏る」という現象は
 ①特定の1色が大量に来る
 ②特定の2色が大量に来る
 ③特定の3色が大量に来る(=特定の1色が全く来ない)
の3つに分類できます。今回は、それぞれの偏り方に該当しそうなぷよスポの配ぷよを適当に選んで、検定を行いました。そのため配ぷよごとに手数がバラバラになっていますが、ご了承ください。

まずは①の配ぷよにおける検定の結果です。配ぷよのURL


 
Table 1 特定の1色が大量に来る配ぷよの検定結果


13手目から20手目にかけて黄が多く来た配ぷよですね。
表中の赤い数字が大きいほどズレが大きいことを表すのですが、この数字の推移をたどって見ると、20手目をピークにしてズレが大きくなっていることが分かります。

一番右の列には、ズレの大きさに対する検定結果が書いてあります。n.s.とはnot significantの略で、「このズレは偶然でも十分起こりうることだよ」ということを表します。つまり、1-13手目までは「ツモの色決定に偏りがあるとは言えない」ということになります。
しかし、14手目以降に「5%水準で偏りあり」「1%水準で偏りあり」といった表記が見られますね。この5%とか1%が上記のαにあたる数字です。なので「5%/1%水準で~」と書かれている場合、「このズレの大きさになる確率は5%/1%以下で、レアなことだよ」=「ツモの色決定に偏りがあるよ」という結論になります。ちなみに、「偏り有意傾向」はズレの確率が5%より大きく10%以下であることを指します。「仮説は棄却できないけどアヤシイ」くらいのニュアンスです。
21手目からは黄以外の3色が来るようになり、28手目で偏りが解消されたようですね。



次に②の配ぷよにおける検定の結果です。配ぷよのURL


 
Table 2 特定の2色が大量に来る配ぷよの検定結果


なんと10手目まで緑と黄しか来ないという強烈な配ぷよです。
やはり早い段階から色が偏っている、という検定結果になっています。



最後に③の配ぷよにおける検定の結果です。配ぷよのURL


 
Table 3 特定の3色が大量に来る配ぷよの検定結果


こちらは15手目まで紫が1個も来ないという配ぷよです。
②の配ぷよでもそうでしたが、3手目までに2色が4個2個の割合で来る配ぷよは、その時点で「偏り有意傾向」と判定されてしまうんですね。しかしたったぷよ6個分というごくわずかなサンプルにおける検定結果なので、あまりアテにはなりません。
全体の推移を見ると、前2つと比べて検定結果が安定していませんが、「5%水準で偏りあり」とあるので、やはり偏った配ぷよと言えそうです。


念のため、見た感じ色が偏っていなさそうな配ぷよについても検定してみました。
配ぷよのURL


 
Table 4 偏りがなさそうな配ぷよの検定結果


みごとにn.s.だけですね。多少のバラつきはあるものの、この配ぷよにおいては、1手目から49手目まで色が偏っているとは言えないという結論になりました。


以上の結果から、ぷよスポには不自然に色が偏っている配ぷよが含まれていると言えると思います。


さて、ここでもう1つ適合度の検定をしたいと思います。
前回の記事に示した「初手2手の各配ぷよパターンになる確率」を覚えていますか?


 
Table 5(前回の記事より再掲)


ぷよスポ実機にて出現する配ぷよパターンは65536通りです。
…ちなみに理論上の128手の全配ぷよパターンは256!/(64!×64!×64!×64!)通りですが、Excelでもエラーを吐き出すほど膨大な数字です。

ぷよスポに実装されている65536通りの配ぷよが全配ぷよパターンからランダムに選ばれているなら、初手2手の配ぷよパターンの割合はTable 5に示した確率に近いものになっているはずです。

という訳でまた検定をしてみました。

配ぷよのサンプリングにはこちらのサイトを利用させていただきました。1〜65536から数字をランダムに100個選び、その数字に該当する配ぷよの初手2手を集計しました。Table 5の確率を理想度数として、サンプルを集計した実測度数とのズレを検定した結果が以下の通りになります。


 
Table 6


表中の赤い数字はTable 1〜4と同じものを指します。この数字に対する判定は「0.5%水準で偏りあり」でした。つまり、ぷよスポに実装されている65536通りの配ぷよはランダムに選ばれた訳ではない、という結論になります。

しかし、Table 6ではAA ABとAB AA、AA BCとAB CCをそれぞれ勝手にまとめています。初手パターンそれぞれを分けた時の割合(
前回の記事Table 3を参照)ではどうでしょうか。その検定結果は以下の通りです。


 
Table 7


同様に赤い数字の判定をしたところ、「2.5%水準で偏りあり」でした。こちらでもやはり、ぷよスポの配ぷよはランダムに選ばれた訳ではない、という結論になりました。


以上2種類の適合度の検定から、ぷよスポに実装されている配ぷよは完全にランダムに選ばれたものとは考えにくい、と言えると思います。ランダムでないなら、ぷよスポの65536通りの配ぷよは意図的に選ばれた、ということになります。

あくまで推測ですが、例えばAA AAパターンは理想度数と比べて実測度数が多いことから、全消し戦が発生しやすいように意図的に増やしている可能性が考えられます。前回の記事で書いた「(AA AAパターンの理想度数が)感覚より少ない」という印象にも合致しますね。また、理想度数においては2色パターン(AA BB, AB AB, AA AB, AB AAパターン)の出現確率が3色パターン(AA BC, AB CC, AB AC)の約半分となっていますが、実測度数においてはほぼ同程度の出現数になっています。これも2色パターンを意図的に増やしているのかもしれません。

ですが、1つの配ぷよにおける色の偏りについてはどんな意図があるのか見当がつきませんでした…。参考として、
こちらの記事では1つ前のツモの類似度から色の偏りを説明しようとしていました。


以上で本記事における検証は全てです。手前味噌ながら、興味本位から始めた割には一連の話として上手くまとめられたと思います。
ここまでお読みいただきありがとうございました。
更新日時:2019/11/14 15:10
(作成日時:2019/11/14 11:41)
コメント( 2 )
w.i
w.i
11月16日 22時40分

> 今回は、それぞれの偏り方に該当しそうなぷよスポの配ぷよを適当に選んで、検定を行いました。
とありますが、偏っている配ぷよを選んで検定したら、偏っているという結論になるのは当たり前ではないでしょうか。

わかりやすそうな例で言うと、
「コインを 10 回投げたら全部表だった。偏っていなかったらこれが起こる確率は 1/1024 なので偏っていると判断する。」
というのは仮説検定の考え方として正しいですが、
「コインを 10 回投げることを 100000 回行った。その中には 10 回全部表という、1/1024 でしか起こらない観測結果があった。」
からは何も言えないです。100000 回の中には 100 回弱くらいは 10 回全部表があるでしょう。

同様に今回の場合を見ると、例えば Table 1 の 15 手目で 5%水準で有意となっていますね。
p 値が書いてないので手元で計算しましたが 0.030 でした。
ここで言えるのは「配ぷよの生成がランダムであるという仮説のもとで、このくらい偏る確率が 3%くらい」ということですね。
配ぷよがランダムであるかどうかの検定を、ここで選んだ一つの配ぷよパターンのみから判断しようとする場合は、
5%水準で有意なので偏っている、と結論することになります。
が、この配ぷよパターンはあなたが 65536 の中から恣意的に選んだ一つに過ぎないです。
65536 通りの中には、3%しか起こらないレベルで偏っているパターンが 2000 個くらいはあるでしょう。
この一つをもとに、全体の配ぷよパターンに偏りがあると主張することはできないです。

w.i
w.i
11月16日 22時55分

続いて後半の話ですが、
こちらの記事( https://puyo-camp.jp/posts/85832 )で引用されているマジありさんのツイートツリーを読むと、
初手2手の配ぷよは甘口ツモで上書きされたものとなっています。
つまり初手2手の配ぷよは単純に3色から選ばれています(実は厳密ではありません)。
子軸を区別すると初手2手のパターンは
AAAA, AAAB, AABA, AABB, AABC, ABAA, ABAB, ABAC, ABBA, ABBB, ABBC, ABCA, ABCB, ABCC
の 14 通りで、
発生する確率は、AAAA だけ 1/27 で他の 13 パターンは 2/27 となります。

これは、hides さんの前の記事で前提とされている、「4色をランダムに配置したものから ABCD に該当するものを除いたものから選ぶ」とは異なります。

また、上でこっそり「厳密ではありません」と言ったとおり、
実際には配ぷよ生成の初期化とシャッフルのプロセスに起因するズレがあります。
ABCA が他より多くなるなどです。
これについては長くなりそうなので、1本記事を書くかもしれません(きちんとやろうとしてますが結構たいへん)。

ところで前の記事で、
> 1 ループ中に含まれるぷよ計 256 個は 4 色に 64 個ずつ等分されています。
とありましたが、
上記引用先の解説では、128 手4色均等になるように作られたあと、初手2手だけ甘口ツモに上書きされるので、
実際には均等になっていないです。各色の 128 手での出現回数は 60~68 となります。
よかったら数えてみてください。
(均等でないこと自体は、初手2手の偏りの話には関係がないです。)

先行研究にはちゃんと当たりましょう!という話でした。

コメントするにはログインが必要です
シェア