Я занимаюсь классификационной проблемой, в которой я пытаюсь предсказать, будет ли заправляться автомобиль на следующий день.
Данные состоят из даты, идентификатора для каждого автомобиля, расстояния до пункта назначения
Мне нужна переменная с задержкой на 3 дня, а не на 3 строки на car_ID - так как каждый car_ID присутствует не каждый день.Поэтому задержка должна основываться на дате, а не на строках.
Если в истории менее 3 дней, результат должен быть -1.
В настоящее время у меня есть этот кусоккода, который отстает от каждой строки на 3 дня
data['distance_to_destination'].groupby(data['car_ID']).shift(3).tolist()
Но это только отставание по количеству строк, а не по количеству дней.
Чего я хочу добиться, так это столбца "lag_dtd_3":
date car_ID distance_to_destination lag_dtd_3
01/01/2019 1 100 -1
01/01/2019 2 200 -1
02/01/2019 1 80 -1
02/01/2019 2 170 -1
02/01/2019 3 500 -1
03/01/2019 2 120 -1
05/01/2019 1 25 80
05/01/2019 2 75 170
06/01/2019 1 20 -1
06/01/2019 2 30 120
06/01/2019 3 120 -1