WOO logo

Решение для игры в покер со случайными числами

Правила

  1. Двум игрокам выдается случайное число, взятое из равномерного распределения от 0 до 1.
  2. Игрок 1 может оставить свой номер или заменить его новым случайным числом.
  3. Игрок 2, зная о решении игрока 1, также может поменяться номером или остаться при своем первоначальном номере.
  4. В итоге побеждает тот, чей итоговый результат будет выше.

Вопросы

  1. Какова оптимальная стратегия для каждого игрока?
  2. Предположим, оба игрока следуют оптимальной стратегии. Какова вероятность выигрыша для каждого игрока?

Ответы

  • Игрок 1 должен поменяться местами, если значение меньше 0,567364, в противном случае — остаться на месте.
  • Если игрок 1 меняет игрока, то игрок 2 должен сменить игрока, если значение меньше 0,5, в противном случае — остаться.
  • Если игрок 1 стоит, то игрок 2 должен поменяться местами, если значение меньше 0,660951, в противном случае — стоять.
  • Вероятность выигрыша игрока 1 = 0,494333.
  • Вероятность победы игрока 2 = 0,505667.
  • Предположим, каждый игрок делает ставку на одно число. Тогда ожидаемое значение для игрока 1 равно -0,011333.

Решение

Очевидно, что если игрок 1 меняет ход, то игрок 2 должен сменить ход, если значение меньше 0,5, в противном случае он остается на месте.

В противном случае, игрок 1 должен остановиться, если его исходное число превышает определенное число. Назовем это число x.

Если игрок 1 стоит, то игрок 2 может предположить, что у игрока 1 достаточно сильное число. Игроку 2 нужно действовать агрессивно, чтобы попытаться его обыграть. Его стратегия должна заключаться в том, чтобы сменить карту при достижении определенного числа, назовем его y, если игрок 1 стоит.

Для решения подобных задач необходимо найти точки безразличия, x и y. Это делается путем приравнивания ожидаемого значения для состояния покоя и состояния переключения.

В оставшейся части этого решения я буду рассчитывать ожидаемое значение с точки зрения игрока 1, предполагая, что оба игрока ставят по одной единице.

Давайте сначала решим уравнение относительно x.

Ожидаемое значение при стоянии = y*(2x-1) - (1-y)

Ожидаемое значение при попадании = 0,5 * 0 + 0,25 * 0 + 0,25 * -1 = -0,25.

Далее, приравняйте эти ожидаемые значения друг к другу:

y*(2x-1) - (1-y) = -0.25
2xy - y - 1 + y = -0,25
2xy - 1 = -0,25
2xy = 0,75
xy = 3/8

Далее, давайте найдем ожидаемое значение, если у игрока 2 значение y, и он встает после того, как встает игрок 1:

(yx)/(1-x) + (1-y)/(1-x) * -1 = (x-2y+1) / (x-1)
Далее, давайте найдем ожидаемое значение, если у игрока 2 значение y, и он нажимает кнопку после того, как игрок 1 встает:

(1 / (1-x)) * [(1-x)^2 * 0 + x * (1-x) * -1] =
(1 / (1-x)) * [x^2 - x] =
x * (x-1) / -(x-1) =
-x

Далее, приравняйте эти ожидаемые значения друг к другу:

(x-2y+a) / (x-1) = -x
x² - 2y + 1 = 0
x³ - 2xy + x = 0

Далее, замените xy на 3/8.

x³ + x - 0,75 = 0
4x³ + 4x - 3 = 0.

На этом этапе можно использовать решатель кубических уравнений, чтобы получить x = 0,567364.

Зная, что xy = 3/8, вы можете подставить указанное выше значение вместо x, чтобы получить y = 0,660951.

Затем нужно просто перебрать все возможные варианты выпадения чисел от двух до четырех, чтобы вычислить вероятность выигрыша каждого игрока. Это можно сделать с помощью геометрии или математического анализа. Простите, если я оставлю эту часть читателю. Вот ответы:

Вероятность выигрыша игрока 1 = 0,494333.
Вероятность победы игрока 2 = 0,505667.
Предположим, каждый игрок делает ставку на одно число. Тогда ожидаемое значение для игрока 1 равно -0,011333.

Для тех из вас, кому необходим точный ответ:

Пусть z = (3/8 + (307/1728)^(1/2))^(1/3) ~ 0,926962
Тогда x = z - 1/(3z) ~ 0,567364
Тогда y = 3/(8x) ~ 0,660951
Тогда ожидаемое значение игрока 1 = 3x/8 + y(y-1) ~ -0,011333

Спасибо Джо Шипману за сообщение о проблеме.