Question

Я работаю над рейтингом онлайн-контента на основе отзывов клиентов для моего проекта колледжа. Для этого я связываю каждый контент с предыдущим альфа- и бета-параметром и обновляю их на основе полученных отзывов. Поскольку я моделирую все больше и больше испытаний, значения альфа- и бета-параметров продолжают расти. Я хочу, чтобы моя модель была более реагирующей на недавнее поведение клиентов, поэтому в своих обновлениях я убиваю предыдущие параметры с коэффициентом 0,9 и суммирую альфа, бета за последний день (как неоднородное линейное разностное уравнение первого порядка).

Из-за затухания модель забывает, что некоторый контент был неоптимальным, и пытается снова исследовать его, что приводит к некоторому циклическому поведению c. Есть ли лучший способ решить эту проблему? Я попытался просто посмотреть данные за последний месяц, чтобы построить свой дистрибутив, но это тоже кажется "забывчивым" Как предотвратить слишком большое увеличение альфа / бета, при этом гарантируя, что модель реагирует и не забывает неоптимальные стратегии?

Sanit · Answer 1 · 13 февраля 2020

Какие бы изменения вы ни внесли в свою модель, всегда найдется компромисс между ее реактивностью и объемом памяти. Модель не сможет сохранить все и при этом догнать поведение клиента. Например, если модель сохраняет все, она не найдет причин попробовать другое оружие, даже если поведение клиента изменилось. С другой стороны, чтобы оставаться реактивной, модель должна продолжать пробовать неоптимальные руки, чтобы проверить, не стало ли одно из них оптимальным, даже если это может вызвать дополнительное сожаление. Обратите внимание, что в нестационарной настройке невозможно будет выполнить так же, как и стационарные настройки.

Вы пробовали оба стандартных способа придания большего веса новым данным: дисконтирование (с коэффициентом 0,9) и учитывая данные только за последние n дней. Если вы обнаружите, что использование этих значений параметров дает вам модели, которые слишком забывчивы, вы можете попробовать увеличить коэффициент скидки или число n (дни, которые вы считаете).

По мере увеличения этих По параметрам ваши модели станут менее забывчивыми и менее реактивными. Вам нужно найти ценности, которые работают для вас. Кроме того, возможно, не удастся одновременно достичь того уровня реактивности и забывчивости, на который вы надеетесь.

Надеюсь, это поможет!

Обновление альфа- и бета-параметров для бета-дистрибуции с большим количеством отзывов

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Обновление альфа- и бета-параметров для бета-дистрибуции с большим количеством отзывов

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы