Изучение оптимальных параметров для максимизации вознаграждения - PullRequest
0 голосов
/ 05 апреля 2011

У меня есть набор примеров, каждый из которых снабжен данными о функциях. Примеры и функции описывают настройки эксперимента в произвольной области (например, количество переключателей, количество выполненных дней, количество участников и т. Д.). Некоторые функции являются фиксированными (то есть статическими), в то время как другие я могу установить вручную (т.е. переменные) в будущих экспериментах. Каждый пример также имеет функцию «вознаграждение», которая представляет собой непрерывное число, ограниченное от 0 до 1, что указывает на успех эксперимента, определенный экспертом.

На основании этого примера и с учетом набора статических функций для будущего эксперимента, как бы я определил оптимальное значение для конкретной переменной, чтобы максимизировать вознаграждение?

Кроме того, у этого процесса есть формальное имя? Я провел некоторое исследование, и это похоже на регрессионный анализ , но я все еще не уверен, что это то же самое.

1 Ответ

1 голос
/ 06 апреля 2011

Процесс называется « план экспериментов ».Существуют различные методы, которые можно использовать в зависимости от количества параметров и от того, можете ли вы проводить вычисления между испытаниями или если вам нужно заранее выбрать все виды лечения.

  • fullfactorial - попробуйте каждую комбинацию, метод грубой силы
  • дробный факториал - исключите некоторые комбинации в шаблоне и используйте регрессию для заполнения отсутствующих данных
  • Plackett-Burman , поверхность отклика - более сложные методы, компенсирующие статистические усилия для экспериментальных усилий
  • ... и многие другие.Это активная область статистических исследований.

После того, как вы построили регрессионную модель на основе данных в своих экспериментах, вы можете найти оптимальное решение, применяя обычные методы численной оптимизации.

...