Модель прогнозирования оттока для модной онлайн-компании - PullRequest
0 голосов
/ 06 марта 2020

Я работал над индивидуальным проектом с набором данных компании онлайн-моды. Я стремлюсь построить модель прогнозирования оттока. Чтобы сделать это, я установил критерии оттока таким образом, чтобы клиент получал отток с 12-месячным бездействием. Но у меня путаница, когда я решаю график данных, по которым я буду тренировать свою модель. Поскольку периоды оттока определяются клиентом c, я не могу установить указанный c интервал даты. Мой набор данных - между 2015 и мартом 2018 года, и я подумал, что было бы неплохо выбрать типового клиента, у которого есть транзакция в 2016 году. Затем я взял последнюю доступную дату в наборе данных, которая когда-нибудь наступит в марте 2018 года, и посмотрю 12 месяцев назад, чтобы определить, кто пошел отток. Затем я взял тех клиентов, которых я выбрал, которые совершили транзакцию в 2016 году, и взял все их данные транзакции во время доступных данных (2015-2018). Я также добавил в модель функцию проверки, имеет ли клиент транзакцию в течение последних 3 месяцев в виде двоичной переменной. Однако я чувствую, что здесь есть ошибка. Я - самоучка, и я не смог найти подходящего руководства для построения модели на inte rnet. Большинство моделей прогнозирования оттока не достаточно подробно говорят о подготовке данных. Я надеюсь, что кто-то поделится своими ценными идеями со мной

...