Как нарезать набор данных для прогнозирования оттока - PullRequest
0 голосов
/ 12 февраля 2020

У меня есть набор данных с поведением пользователей за 30 месяцев. Для каждого пользователя существует одна строка в месяц, независимо от того, кто он - отток или нет. Каждая строка имеет атрибут 'User ID', 'Month' в формате 'GGMM' и статус Churned = 'C' или не Churned 'N'. Все возможные ситуации представлены на скриншоте.

Dataset

Очевидно, что мне нужно удалить все строки, когда пользователи уже отработали в течение 30 месяцев, а также все месяцы, в которых находится пользователь статус оттока после первого оттока. Но все же набор данных не готов к дальнейшему анализу. Есть ли идея, как нарезать набор данных и подготовить его для прогнозирования оттока в следующем году.

...