Для лучшего понимания этого вопроса вы можете проверить: -
1) https://math.stackexchange.com/questions/3100336/how-to-calculate-the-probability-in-this-case
Джон играет в игру против мага. В этой игре изначально естьN 'идентичных коробок перед ним, и одна из них содержит волшебную таблетку - после употребления этой таблетки он становится бессмертным.
Он должен определить, в какой коробке находится таблетка.Ему разрешено выполнять не более «М» ходов.На каждом ходу он может выполнить одно из следующих действий:
1)
Выберите один из прямоугольников, которые перед ним равномерно случайным образом, и предположите, что в этом блоке находится таблетка.Если предположение верно, игра заканчивается, и он получает таблетку.В противном случае, после этого предположения, маг добавляет K пустых коробок перед собой таким образом, что Джон не может определить, какие коробки были добавлены;коробка, которую он угадал, также остается перед ним, и он также не может отличить эту коробку от других коробок в последующих ходах.
2) Выберите число X, такое, что X является положительным кратным K, но строго меньшечем текущее количество ящиков перед Джоном.Затем маг удаляет X пустых коробок.Конечно, Джон не должен выполнять этот ход, если текущее количество боксов ≤K.
Если Джон играет оптимально, какова будет максимальная вероятность того, что он получит таблетку?«N» всегда меньше, чем «K».
Пример: - Пусть M = 3, поэтому разрешено 3 хода.K = 20, N = 3.
В своем первом движении Джон выбирает ящик с вероятностью, x = 1/3, (было добавлено 20 коробок (20 + 3 == 23), затем во второмдвигаться, он снова выбирает коробку снова, с вероятностью на этот раз, y = 1/23 * (2/3). Здесь, 2/3 обозначает вероятность неудачи в первом движении.
В третьемдвигаться, он делает то же самое с вероятностью, z = 1/43 * (22/23) * (2/3).
Таким образом, общая вероятность = x + y + z = l1
Допустим, в приведенном выше случае во втором ходу он решает убрать 20 ящиков и больше ничего не делать, тогда новая окончательная вероятность равна = 1/3 + 0 (ничего не делается во втором ходу!) + 2/ 3 * (1/3) = l2. Теперь, когда l2> l1, поэтому 'l2' является ответом на наш вопрос.
По сути, мы должны определить, какая последовательность ходов даст максимальную вероятностьКроме того,
P (победа) = P (игра заканчивается на 1-м ходу) + P (игра заканчивается на 2-м ходу) + P (игра заканчивается на 3-м ходу) = (1/3) +0+ (2/3) * (1/3) = 5/9
Учитывая, N, K, M, как мы можем узнать максимальную вероятность?Нужно ли применять динамическое программирование?