ツモの偏りについて

主に「ぷよぷよ通ルール」の中辛の場合について考察します。
ここでは「ツモの偏り」および「配ぷよ（ツモ生成）の偏り」を定義して実例で計算してみますが、数学的な議論がされます。
なるべく専門的な記号などは使わないようにしましたが、興味ない人は前半の「偏り」を計算する部分は読み飛ばしてもらって、後半の表のあたりから読んでください。

「ツモの偏り」を定義するために、まず「同色距離」というものを、次に同じ色のぷよが来るまでの距離で定義します。
例えばあるツモの最初が「r, g, b, y, y, b, g, r, ...」で始まるとすると、「同色距離」は「7, 5, 3, 1, ... 」で始まります。
この「同色距離」が「平均的である」、つまり４に近いほど（中辛４色の場合）ツモの偏りは少ないと判断します。
ここで、「ツモの偏り」を「同色距離の分散」で定義します。
例えば「r, g, b, y, r, g, b, y, ...(以下ループ)」のツモの同色距離は「4, 4, 4, 4, 4, 4, 4, 4... 」で偏りは０。
「r, r, g, g, b, b, y, y, ...(以下ループ)」のツモの同色距離は「1, 7, 1, 7, 1, 7, 1, 7,... 」で偏りは９です。
これは同色距離の平均からの散らばりを示すもので、あくまで一つの数値的評価ですが、ここではこれが小さいほど「普段我々が感じるツモの偏り」は少ないと考えます。

上の定義の注意点をいくつか述べます。
例えば、ツモ「r, g, b, r, g, b, ...」は３色ツモとして偏りを計算すると０ですが、４色ツモとしてみるととても偏っていると感じます。
ツモの偏りを比較する際、同色距離の平均が等しいということを仮定の上で比較できます。
甘口と中辛など、色数が異なる場合は比較できません。
ある特定の区間の偏りを評価する場合は、「「同色距離」は前後の距離を平均したものを使う」等の修正をしたほうがいいでしょう。

次に「配ぷよの偏り」を「ツモの偏りの平均」で定義します。
これは個々のツモの偏りを計算する必要はなく、ツモが確率的に与えられるものとしてその分散が求められればいいです。
以下いくつかの配ぷよについて「配ぷよの偏り」を計算します。ここでは配ぷよが４色の場合を仮定しますが、同様の計算は３色や５色などでも可能です。

配ぷよ１：　ランダム
配ぷよ２：　１２８手色均等
配ぷよ３：　１６手色均等
配ぷよ４：　４手色均等
配ぷよ５：　２手色均等

配ぷよ１～５を上で定義しますが、初手数手を３色以内にする補正は行わないものとし、ｎ手色均等ではツモはループするものとします。
なお、同色距離の平均は配ぷよ１～５全てで等しく４になります。
詳しい証明は割愛しますが、n手色均等では各色ごとの同色距離の総和は１ループで2nになるので、簡単に計算できます。

配ぷよ５の偏りはすぐに計算できます。
配ぷよ５のツモは「色１, 色２, 色３, 色４」がループするため、同色距離は全て４で、全てのツモの偏りは０になります。
よって偏りは０です。

配ぷよ１～４の偏りは、分散＝ (二乗の期待値) - (平均の２乗) を利用します。
平均は全て４とわかっていますので、同色距離の二乗の期待値が分かれば分散が分かります。
同色距離の二乗の期待値 E(X^2) は

です。

配ぷよ１の場合、同色距離が k になる確率は、別の色が (k-1) 回でた後、同じ色が出る確率なので、

です。
よって、

です。よって偏りは12です。

配ぷよ４の場合、８コのぷよがループしそのうちのそれぞれ２コが同じ色になるので、
同色距離は７以下で、同色距離がkになる確率はｋによらず７分の１です。
よって、

です。よって偏りは4です。

配ぷよ２の場合、同色距離がｋになる確率は、
「２５６コのぷよがあって、最初にぷよを１コ引く。次にk回引いて初めて最初と同じ色のぷよを引く確率」です。
例えば同色距離が１になる確率は (63 / 255) で、
2になる確率は (192 / 255) * (63 / 254)、
3になる確率は (192 / 255) * (191 / 254) * (63 / 253) になります。
同色距離がkになる確率は、下降階乗冪 FP(X, n) = X * (X - 1) * ... * (X - n + 1) を用いて、
(63 / 193) * (FP(193, k) / FP(255,k)) になります。
同色距離は最大で１９３なので、

です。これを Wolfram Alpha さんに
63 / 193 * Sum[k^2 * FactorialPower[193, k] / FactorialPower[255, k] , {k, 193}]
と聞いてみると、1796 / 65 = 27.6308... と返ってきます。よって偏りは11.63 とします。

配ぷよ３の場合も、 Wolfram Alpha さんに
7 / 25 * Sum[k^2 * FactorialPower[25, k] / FactorialPower[31, k] , {k, 25}]
を聞いて同様にして計算できます(76 / 3 = 25.3333...)。よって偏りは9.33 とします。

以上で配ぷよ１～５の偏りが計算できました。
ここで、配ぷよ０として、低頭ちゃんさんの記事ぷよスポの配ぷよで引用されているマジありさんのツイートにあるツモ生成について考察します。
配ぷよ０は128手色均等に近いものになっていますが、初手２手が３色へ置き換えられています。
その分偏りはわずかに大きくなると思いますが、シャッフル部分のアルゴリズムは単純なシャッフル（フィッシャー–イェーツ等）ではありません。
このシャッフルが「均等に」シャッフルできるものだとは私は思いませんが、もしシャッフルが足りないのなら最初は均等なツモ「r, g, b, y, r, g, b, y, ...」からシャッフルさせているので、偏りは小さくなるでしょう。
この配ぷよの偏りを、低頭ちゃんさんの記事セガぷよの配ぷよデータを公開してみましたで公開されているデータを用いて計算機で計算しました。
冒頭で述べたように同色距離の平均が異なると比較はできません。
初手の置き換えによって平均はわずかに異なると思いますが、ほぼ４に等しいので４とします。
アルゴリズムの公開は行いませんが、配ぷよ０の偏りは 11.396746039390564 になりました。
128手色均等と比較してみると偏りは少なくなっていて、やはり均等なシャッフルになっていないように思います。
（w.i さんの記事初手がゾロの確率は 1/3 よりちょっと小さいくらい。にてシャッフル部分に関して詳しく書かれていました。やはり理想的なシャッフルではないようです。）

以上を表にまとめると、次になります。

配ぷよ	偏り
ぷよスポ（仮）	11.40
ランダム	12.00
128手色均等	11.63
16手色均等	9.33
4手色均等	4.00
2手色均等	0.00

ぷよぷよ用語辞典によると、
ぷよぷよクラシックや20thより前のセガ通などでは16手色均等で、コンパイル時代のぷよぷよ通やセガの20th通などでは128手色均等だそうです（初手の置き換えはあります）。
個人的には、128手色均等の配ぷよは計算資源が限られていたころの名残で、ツモ補正をかけることは重視していないのはないかと思います。
16手色均等は明確に補正しようとしている意図が感じられますが、128手は基本引ききることのない手数です。
今回の結果からもあまり変わっていないように思います。

配ぷよ０（ぷよスポ（仮））についてですが、完全なランダムよりも偏っていないという結果になりました。
しかし、初手２手の３色への置き換えにより「序盤のツモは偏りやすい」です。
さらに、配ぷよ０の初手２手の３色への置き換えは少し特殊なアルゴリズムになっています。
簡単に説明すると、４色のぷよ列「r, g, b, y, r, g, b, y, ...」と３色のぷよ列「r, g, b, r, g, b, ...」を同時に同じ順番でシャッフルをして、その後初手２手部分を３色のものに置き換えるという操作がされています。
これは本来置き換えが必要ない「r, r, r, b, g, g, y, y, ...」が「g, g, g, y, g, g, y, y, ...」等に置き換えられてしまうことが考えられます。
甘口と中辛で対戦する際などに初手を揃えることが目的だと思いますが、単純にＡＢＣＤツモの場合のみ置き換える等よりも偏りは顕著になるでしょう。
また、128手引ききることはほぼないので、実際には表の数値よりも偏りを感じるでしょう（後半に発火色が来なかった等はほとんど関係ないです）。
「序盤のツモは偏りやすい」ことはつまり、序盤の全消しが増え、「全消し」、「速攻」、「連結土台」が強くなることになります。
ＡＣぷよ通の配ぷよは初手３手が３色になるよう補正されています。これが配ぷよ０と同様のアルゴリズムが使われていると仮定すると（まったく同じである必要はありません）、ＡＣぷよ通の序盤の偏りはより強く、「ＡＣぷよ通ではぷよスポよりも全消し・速攻・連結土台が強い」ということになります。
全消し・速攻に弱い先折りＧＴＲは相対的に弱くなります。
あくまで理論上なのでどれだけプレイに影響するかはわかりませんが、ぷよクロ以降の先折りＧＴＲの隆盛との関係はもしかしたらあるのかもしれません。

ツモ生成にあたって、良いツモ生成アルゴリズムというものはプレイヤーの主観にゆだねられるので考えるのは難しいですが、一方で絶対に生成してはいけない「ダメツモ」が存在することは意識しなければならないと思います。
「ダメツモ」とは例えば「rr, rr, gg, gg, bb, bb, yy, yy, ...(以下ループ)」のように少ない手数での全消しが続いてしまうツモのことです。
ぷよぷよには引き分けは一応ありますが、将棋のような「千日手」の概念はないので、同一盤面が永遠に続いてしまう恐れがあります。
上のような極端な例はマージン制度などでは差がつけられないでしょう。
128手色均等などでこの「ダメツモ」が生成される確率は非常に低いと思われますが、０ではありません。
一方で、「ダメツモ」を絶対に生成しないような実用的なアルゴリズムを見つけることは難しいと思います。
現在使われているであろうツモが65536通りしかない理由の一つはこれかもしれません。
セガ（あるいはコンパイル）はそれら全てが「ダメツモ」でないことを確認したのではないでしょうか。
大部分はプログラムによってコンピュータに判定させられるので、膨大な作業というわけでもないと思います。

多くのプレイヤーが「欲しい色が来ない」状況が少なくなってほしいと願っていると思います。
例えば冒頭で定義した「同色距離」がそれなりに低い上限で抑えられていればそのような状況がなくなりますが、少し考えてみたところそういった条件は強すぎるもので、ツモ補正が強くなりすぎるかもしれません。ツモ補正が強すぎるのもまたゲームをつまらなくさせるでしょう。
バランスの問題であって、ツモ生成による簡単な解決方法はなさそうです。

今回はツモの偏りを定義してみました。
ツモの偏りと勝率に相関があったりしたらおもしろいですが、データ収集は困難ですね。

余談ですが128手色均等での特定の色のゾロの確率は 1 / 16 ではなく (64 / 256) * (63 / 255) = 63 / 1020 です。
大きな違いではありませんが、個人的な感想としては「128手中ゾロは 128 / 16 = 8 手ずつ、非ゾロは128 / 8 = 16 手ずつ」の「ツモ均等」だったら
確率的にきれいでよかったんじゃないかと思います（非ゾロは軸ぷよが２色等確率になっているとなお美しいですね）。

（追記）2019-11-26 17:30
余談に誤りがあったので修正しました。

更新日時：2019/11/26 17:30
（作成日時：2019/11/26 01:35）

つみさんの他の投稿を見る

人気の投稿

飛車ぷよで飛車さんとの会話まとめ