470 : Super Ramvok

Ramvok というゲーム一回分について考えよう:

ゲーム終了までの最大のターン数を tt で表す。 t=0t= 0 ならば、ゲームは即座に終了する。 それ以外のとき、それぞれの ii 回目のターンに、プレイヤーはサイコロを一つ投げる。 投げたあと、i<ti < t ならば、プレイヤーは出たサイコロの目と同額の賞金を受け取ってゲームを終えるか、出た目を捨てて次のターンに挑戦することができる。 i=ti=t のときは、出た目を捨てることはできず賞金を受け取らなければならない。 ゲーム開始前に、プレイヤーは tt を決めて、ある定数 cc に対して前金 ctct を支払う必要がある。 c=0c = 0 ならば、(前金は0となるので)tt として無限大を選ぶことができる。 偏りのない dd 面のサイコロとコスト定数 cc が与えられ、Ramvok を最適に行った時に一回のゲームでプレイヤーが受け取ることになる期待利益 (すなわち純利益) を R(d,c)R(d,c) としよう。 例えば R(4,0.2)=2.65R(4,0.2) = 2.65 となる。 プレイヤーはどんな前金でも支払えるだけの十分な資金を持っていると仮定する。

ここで Super Ramvok というゲームを考えよう:

Super Ramvok では, Ramvok を繰り返し行うが, 若干の変更点がある。 それぞれのゲームのあと、サイコロを変更する。 変更の手順は次の通り: サイコロを一度だけ投げる。普通の面が出たとき、その面を白く塗りつぶす。 前に塗りつぶされた面が出たときは、元の目に戻す。 この変更が行われた後、次の Ramvok ゲームを開始できる。(そしてゲームの最中、それぞれのターンで、サイコロは塗りつぶされていない面が出るまで投げ直す。) プレイヤーは常にどの目が空白でどの目がそうでないかを把握している。 サイコロのすべての目が空白になった時点で Super Ramvok のゲームは終了となる。

偏りのない dd 面のサイコロ(開始時はすべての目が見えている)とコスト定数 cc が与えられ、Super Ramvok を最適に行った時に一回のゲームでプレイヤーが受け取ることになる期待利益を S(d,c)S(d,c) としよう。 例えば S(6,1)=208.3S(6,1) = 208.3 となる。

F(n)=d=4nc=0nS(d,c)\displaystyle F(n) = \sum_{d = 4}^n \sum_{c = 0}^n S(d,c) とする。

F(20)F(20) を計算し、最も近い整数に四捨五入せよ。

(cは整数で考えればよい?)

最終更新