Предположим, у меня есть система выбора кандидатов для генерации пар продукт / пользователь для рекомендации. В настоящее время для того, чтобы удерживать планку качества для рекомендованного продукта, мы обучили модель оптимизации для клика по ссылке, обозначив как модель pClick (product, user), результат этой модели - оценка (0,1 ) представляет вероятность того, что пользователь нажмет на рекомендуемый продукт.
Для нашего начального продукта запуска мы установили вручную выбранный порог, скажем T для всех пользователей. Для всех пользователей, только когда порог пройдет T, мы отправим пользователю рекомендацию.
Теперь мы понимаем, что это не оптимально: некоторые пользователи меньше заботятся о качестве рекомендаций, в то время как некоторые другие имеют высокую планку качества рекомендаций. , А персонализированный порог вместо глобального T может помочь нам улучшить общую релевантность.
Цель состоит в том, чтобы вывести пороговое значение для каждого пользователя, если предположить, что у нас есть обучающие данные для активности каждого пользователя. и атрибуты пользователя / продукта.
Вопрос: как мы должны моделировать эту проблему с машинным обучением? Любая ссылка или документы высоко ценится.