У меня есть набор данных с поведением пользователей за 30 месяцев. Для каждого пользователя существует одна строка в месяц, независимо от того, кто он - отток или нет. Каждая строка имеет атрибут 'User ID
', 'Month
' в формате 'GGMM
' и статус Churned = 'C
' или не Churned 'N
'. Все возможные ситуации представлены на скриншоте.
Очевидно, что мне нужно удалить все строки, когда пользователи уже отработали в течение 30 месяцев, а также все месяцы, в которых находится пользователь статус оттока после первого оттока. Но все же набор данных не готов к дальнейшему анализу. Есть ли идея, как нарезать набор данных и подготовить его для прогнозирования оттока в следующем году.