Как лучше всего учиться в Reinforcement, RNN или других, чтобы предсказать лучшее действие, которое мы должны предпринять, чтобы максимизировать продажи? - PullRequest
0 голосов
/ 09 июля 2019

У меня есть набор данных, состоящий из нескольких функций:

customerId, actionDay1, SalesDay1, actionDay20, SalesDay20, actionDay30, salesDay30.

Действие может быть:

  • вызов

  • 1012 E-mail * ** * 1013

  • лицо 2 лицо

  • ничего

продажи: сумма продаж в $ 1024 *

Моя цель здесь - предсказать лучшее действие, которое мы должны предпринять в любой день (1, 20 или 30), чтобы продать больше.

некоторые клиенты предпочитают электронную почту, некоторые предпочитают звонить каждый раз, другие предпочитают, чтобы с ними не связывались для покупки.

шаблон отличается для каждого клиента. Моей первой мыслью было применить усиленное обучение к этой проблеме, но я обнаружил некоторые трудности в создании правильной среды, а также функции вознаграждения. обучение с подкреплением будет работать без данных, и модель будет отличаться для каждого клиента. Я хотел бы иметь модель, которая может приблизиться к поведению всех клиентов, использующих мой набор данных.

Кто-нибудь имеет представление о том, как я могу подойти к этой проблеме, используя обучение с подкреплением или что-то другое, как Recurrent Neural Net?

1 Ответ

0 голосов
/ 16 июля 2019

Усиление обучения будет проблемой для вас использовать в данный момент. Особенно, если вы хотите просто выбросить данные в нейронную сеть, ожидая результатов. RL, даже если он реализован должным образом, время от времени терпит неудачу из-за многочисленных причин, связанных со стохастикой, когда агент обнаружил в вашем коде эксплойт / недостаток и теперь максимизирует свое вознаграждение, и --- tl; dr RL имеет тенденцию быть умным.

Начните с установки базовой линии с помощью многослойного персептрона (MLP).

Поле имеет эмпирический характер, поэтому настройте процесс для правильного эксперимента:

Укажите вашу проблему. Соберите данные. Чистые данные. Запустите данные с помощью общих алгоритмов для вашей проблемы. Проверьте результаты. Учитесь и работайте, чтобы улучшить свои результаты. Представить результаты клиенту.

...