ナッシュ均衡とポケモン -不意打ちは8回押すべきか

たんぐすです

まずナッシュ均衡ってなんやねんって人のためにナッシュ均衡とは

ゲーム理論における非協力ゲームの解の一種であり、いくつかの解の概念の中で最も基本的な概念である
ナッシュ均衡は、他のプレーヤーの戦略を所与とした場合、どのプレーヤーも自分の戦略を変更することによってより高い利得を得ることができない戦略の組み合わせである。ナッシュ均衡の下では、どのプレーヤーも戦略を変更する誘因を持たない。

(うぃきぺでぃあそのまま)

まあ要するにリスクリターンに従って行動選んだほうがいいよってことですね。
その場その場でナッシュ均衡も変動しますが、俯瞰的に見ると下手に深読みしないほうがいいねって感じ。
結果として均衡しちゃいます。
(裏の選択肢だと思っていることが実は表かもしれないことは頭に入れておこう)

ナッシュ均衡を語るに当たってポケモンの外でナッシュ均衡の例を見て見ます。

また、これらの例は登場人物がナッシュ均衡を理解しており全員が合理的な判断をする前提で話をしています。

まずは囚人のジレンマです。
これは2人それぞれが合理的な選択をした結果、2人が望まない結果になってしまう例です。
細かいことはネットサーフィンして学んできた方がわかりやすいと思うので割愛します。
軽く説明すると2人が協力するのが一番いいという状況でも、相手が裏切ることを考えると自分も裏切って最悪のケース〜みたいな感じです。

ナッシュ均衡が全体にとって最適であることをパレート最適と言います。

囚人のジレンマも非協力(対戦)ゲームと関係があるようでないようでって感じですね。


ここで一度ポケモンの話に移ります。

誰でも1度は経験したことがありそうなガブリアスクチートの不意打ちじゃんけんです。

不意打ちを受けると倒れてしまうガブリアス地震を受けると倒れてしまうクチートが対面しています。
ここでガブリアスがとりうる選択肢は地震と剣の舞でしょうか。クチートは不意打ちと外れない技なんかということで。

自分がガブリアス側、クチート側になって考えて見てください。


不意打ちのppは8なので9ターン目までいくとガブリアスが勝ちます。それをクチートはわかっているので、8ターン目になんかを打ちます。ガブリアスもそれをわかっているので...とやると1ターン目にたどり着いてクチートは技を打てなくなって一種のパラドクスになります。
ナッシュ均衡的な説明をすると、クチートが不意打ち、ガブリアスが剣の舞を押す。裏切ると自分が損をする。そんな感じです。

ここでナッシュ均衡のもう一つの例である美人投票ゲームの説明を

ある美人にたくさんの人が1〜100点で点数をつけます。
全員の点数の0.7倍の点数を書いた人が勝ちというゲームです。

あなたなら何点をつけるでしょうか。

1〜100なので真ん中が50くらいで、人がたくさんいるので平均は50、なのでその0.7倍の35点がいいかもしれません。
でもその35点の0.7倍がいいかもしれません。
、、、
とやっていくとナッシュ均衡においては1点をつけることにたどり着きます。

ちなみに実際にやったときは30点前後になったらしいです。
35まではいけてもその先へは進みにくいです。
1点をつけることが合理的であっても、全員がナッシュ均衡のもとに動くという前提がなければ正解にはなりません。このようにナッシュ均衡は動きます。

では本題に戻ります。
ガブリアスクチートの不意打ちじゃんけん、個人的には7回"は"不意打ちを押すべきだと思います。
失敗してもリスクがなく、8回目になってしまっても1/2のゲームができます。
もちろんガブリアス側だったら7回"は"押すべきだと思います。クチート側の心理としてもリスクがない不意打ちを読むことになります。
また、ナッシュ均衡を無視してくるガブリアスもいたり、補助技を持っていないガブリアスもいると思うのでなおさらクチートは不意打ちを押すべきです。
また、ナッシュ均衡的には8回押すべきなのかもしれませんが、正直8回目は1/2だと思います。
ちなみに、美人投票ゲームの結果が30前後になったことから、一般的な人は途中でナッシュ均衡を裏切るみたいですね。

あくまでナッシュ均衡に従った選択のため、相手のナッシュ均衡を裏切る、という選択ももちろんあります。ですが、レートをある程度上げる、という目的であればナッシュ均衡に従うべきだと思います。

ナッシュ均衡という言葉を知らなくても、レートが高い人は無意識に実践していると思っています。

ポケモンというゲームは伏せられている情報があったり、再戦もたくさんあると思うので、一概にナッシュ均衡絶対神であるとは言いません。
見えないナッシュ均衡を操れるようになると勝てるかもしれませんね。

ナッシュ均衡に従う、相手のナッシュ均衡を裏切るという視点も持って見て欲しいです。

これは他のゲームにも応用できるので是非。


なお、ぼくはポケモンが下手です。


f:id:wtungs810:20170725193633j:plain

もちべ

自分よりうまい人と戦うのがうまくなれます

自分よりへたなひとと戦うと勝てるため楽しいです


ふれんずに負けるのがモチベの減りも少ないし
自分より少しうまいふれんずを作りましょう



ぼくはいまさかさがたのしい

黄泉

講義がわからなくて暇なので筆をとりました(むしろ筆を置いた)

えあぷがわーきゃーいうのでよろしくおねがいします



最近シングルバトルを少しだけやってるんですが、なんとなく動かして理由付けしてない行動がたまにあるなと思ったので反省も込めてぼくのぽけもん論を


自分は、ぽけもんにおいて一般ピーポーから初級者にグレードアップしたのが格ゲーよりも遅かったので、ぽけもんも格ゲーの考え方に寄せられています

(別に格ゲー上手くないしむしろセンスない方だと思いますが)


格ゲーって簡単にいうとぱんちとかきっくとか波動拳とか出して相手のHPをなくすゲームな訳です

相手のHPも自分のHPも攻撃力、防御力も数値できっちり決まっています
(相手の防御がうまいとかは考慮しないものとする)

キャラクターを動かすのが人である。という部分を一度取り除いてしまえば、リスクリターンが手にとってわかります。

もちろんキャラクターを動かすのが人のため、リスクリターンは多少動きますが、ほとんど変わりません。
理由はまた後述

じゃあポケモンはどうか(ルールは任意)
相手のポケモンは6匹(1ではない)
相手のポケモンの道具もわからない
相手のポケモンの技もわからない
相手のポケモンのステータスもわからない
(は??????????)

ってなるわけですよ

相手の体力も攻撃力もわからないゲーム聞いたことねえ!(ある程度は決まってるけども)

しかし、実はマッチングした時点で神様は体力や攻撃力をわかっています

例えばね
2vs2で
ギャラドスペリッパーvsカプコケコライチュウ

とかだったら
ギャラドスペリッパーのHPは1+1かもしれないし
カプコケコライチュウの攻撃力は無限+無限かもしれない
(数学オタクの皆さんごめんなさい)

次の例
テッカグヤローブシンvsフシギバナカプテテフ

とかだったら、
テッカグヤのHPが1万だとしてローブシンは2000くらいしかないかもしれない
ローブシンの攻撃力も20くらいしかないような気がする

あくまで例なので数値に意味はないですが、そういうことです(丸投げ)

もう一つ
カプテテフカプテテフカプテテフカプテテフカプテテフドリュウズvsローブシンボルトロス

とかだったら、ローブシンのHPも攻撃力も低い、それでもドリュウズを倒せるのがローブシンだけなので(きあいだまボルトロスマンは静かに!)この試合において価値がめちゃくちゃ高いです

HPは1しかなくてもその1を守りきらなければいけない試合ということですね。(まあ6vs2じゃ勝てないけどもね)

その点格ゲーは数値が目に見てわかりますね(2度目)

で、ポケモンが強い人は無意識かもしれないけど試合ごとにポケモンの価値を理解していてそういうプレイができる人だと思っています。

(まあここに運を絡めると大半ぶっ壊れるんだけど)


最近の勝率5割しかなさそうですが、6、7割勝つだけなら壁は低いはずなのでぼくも頑張ります。

(書くことあった気がしたけど忘れた)

プリティプリマ

f:id:wtungs810:20170625171052j:plain

供養

オオスバメルチャブルメタです
唯一出した試合でルチャブルを綺麗に倒せたんですが

10万麻痺からの3連痺れでベトン突破されて萎えてやめました

ヒヤッキー強かった

プリティなポケモン全然いないのでやゆよ