как подготовить время до значения события в случае продольных данных для анализа выживаемости - PullRequest
0 голосов
/ 01 августа 2020

У меня есть данные о продольных транзакциях розничного магазина, где каждая строка представляет собой транзакцию, выполненную отдельным лицом. Я хотел бы провести анализ выживаемости, чтобы проанализировать, как долго клиент будет совершать транзакции, прежде чем откатится. Здесь я определяю отток как человека, который не совершал никаких транзакций в за последние 3 месяца с текущего времени . Я планирую использовать модель пропорциональной опасности Кокса, для нее требуется параметр tenure или time_to_event . Как правильно представить срок владения в этом случае оттока для данных ниже

Ниже приведен образец данных

Id.    Visit_date.       Amount.   Tenure     Churn     Age     Income
1.     04/03/2020        500        ?           No      40      56K
1.     05/03/2020        300        ?           No      32      60K
1.     05/23/2020        800        ?           No      28      90K
1.     07/04/2020        700        ?           No      40      56K
2.     02/03/2020        500        ?          Yes      43      50K
2.     01/12/2020        300        ?          Yes      60      90K
3.     03/23/2020        800        ?           No      18      80K
4.     07/04/2020        700        ?           No      20      40K

Как правильно указать Значение Time_to_event или Tenure для модели CoxPH?

...