У меня есть набор примеров, каждый из которых снабжен данными о функциях. Примеры и функции описывают настройки эксперимента в произвольной области (например, количество переключателей, количество выполненных дней, количество участников и т. Д.). Некоторые функции являются фиксированными (то есть статическими), в то время как другие я могу установить вручную (т.е. переменные) в будущих экспериментах. Каждый пример также имеет функцию «вознаграждение», которая представляет собой непрерывное число, ограниченное от 0 до 1, что указывает на успех эксперимента, определенный экспертом.
На основании этого примера и с учетом набора статических функций для будущего эксперимента, как бы я определил оптимальное значение для конкретной переменной, чтобы максимизировать вознаграждение?
Кроме того, у этого процесса есть формальное имя? Я провел некоторое исследование, и это похоже на регрессионный анализ , но я все еще не уверен, что это то же самое.