Решение для игры в покер со случайными числами
Правила
- Двум игрокам выдается случайное число, взятое из равномерного распределения от 0 до 1.
- Игрок 1 может оставить свой номер или заменить его новым случайным числом.
- Игрок 2, зная о решении игрока 1, также может поменяться номером или остаться при своем первоначальном номере.
- В итоге побеждает тот, чей итоговый результат будет выше.
Вопросы
- Какова оптимальная стратегия для каждого игрока?
- Предположим, оба игрока следуют оптимальной стратегии. Какова вероятность выигрыша для каждого игрока?
Ответы
- Игрок 1 должен поменяться местами, если значение меньше 0,567364, в противном случае — остаться на месте.
- Если игрок 1 меняет игрока, то игрок 2 должен сменить игрока, если значение меньше 0,5, в противном случае — остаться.
- Если игрок 1 стоит, то игрок 2 должен поменяться местами, если значение меньше 0,660951, в противном случае — стоять.
- Вероятность выигрыша игрока 1 = 0,494333.
- Вероятность победы игрока 2 = 0,505667.
- Предположим, каждый игрок делает ставку на одно число. Тогда ожидаемое значение для игрока 1 равно -0,011333.
Решение
Очевидно, что если игрок 1 меняет ход, то игрок 2 должен сменить ход, если значение меньше 0,5, в противном случае он остается на месте.В противном случае, игрок 1 должен остановиться, если его исходное число превышает определенное число. Назовем это число x.
Если игрок 1 стоит, то игрок 2 может предположить, что у игрока 1 достаточно сильное число. Игроку 2 нужно действовать агрессивно, чтобы попытаться его обыграть. Его стратегия должна заключаться в том, чтобы сменить карту при достижении определенного числа, назовем его y, если игрок 1 стоит.
Для решения подобных задач необходимо найти точки безразличия, x и y. Это делается путем приравнивания ожидаемого значения для состояния покоя и состояния переключения.
В оставшейся части этого решения я буду рассчитывать ожидаемое значение с точки зрения игрока 1, предполагая, что оба игрока ставят по одной единице.
Давайте сначала решим уравнение относительно x.
Ожидаемое значение при стоянии = y*(2x-1) - (1-y)
Ожидаемое значение при попадании = 0,5 * 0 + 0,25 * 0 + 0,25 * -1 = -0,25.
Далее, приравняйте эти ожидаемые значения друг к другу:
y*(2x-1) - (1-y) = -0.25
2xy - y - 1 + y = -0,25
2xy - 1 = -0,25
2xy = 0,75
xy = 3/8
Далее, давайте найдем ожидаемое значение, если у игрока 2 значение y, и он встает после того, как встает игрок 1:
(yx)/(1-x) + (1-y)/(1-x) * -1 = (x-2y+1) / (x-1)
Далее, давайте найдем ожидаемое значение, если у игрока 2 значение y, и он нажимает кнопку после того, как игрок 1 встает:
(1 / (1-x)) * [(1-x)^2 * 0 + x * (1-x) * -1] =
(1 / (1-x)) * [x^2 - x] =
x * (x-1) / -(x-1) =
-x
Далее, приравняйте эти ожидаемые значения друг к другу:
(x-2y+a) / (x-1) = -x
x² - 2y + 1 = 0
x³ - 2xy + x = 0
Далее, замените xy на 3/8.
x³ + x - 0,75 = 0
4x³ + 4x - 3 = 0.
На этом этапе можно использовать решатель кубических уравнений, чтобы получить x = 0,567364.
Зная, что xy = 3/8, вы можете подставить указанное выше значение вместо x, чтобы получить y = 0,660951.
Затем нужно просто перебрать все возможные варианты выпадения чисел от двух до четырех, чтобы вычислить вероятность выигрыша каждого игрока. Это можно сделать с помощью геометрии или математического анализа. Простите, если я оставлю эту часть читателю. Вот ответы:
Вероятность выигрыша игрока 1 = 0,494333.
Вероятность победы игрока 2 = 0,505667.
Предположим, каждый игрок делает ставку на одно число. Тогда ожидаемое значение для игрока 1 равно -0,011333.
Для тех из вас, кому необходим точный ответ:
Пусть z = (3/8 + (307/1728)^(1/2))^(1/3) ~ 0,926962
Тогда x = z - 1/(3z) ~ 0,567364
Тогда y = 3/(8x) ~ 0,660951
Тогда ожидаемое значение игрока 1 = 3x/8 + y(y-1) ~ -0,011333
Спасибо Джо Шипману за сообщение о проблеме.