У меня есть набор данных, содержащий 4 столбца. Я хотел бы получить последнюю запись из time
столбца для col1
и col3
, для col1 = 1
последняя запись 2018-05-01 23:34:00
и для col1 = 2
последняя запись 2018-05-01 05:48:00
посмотреть, если разница между последними запись и вторая до последней записи (например, для col1 = 1
это 2018-04-30 01:58:00
) больше 24 часов или нет. Это также интерес для col2=2
.
Если это так, я хочу получить значение в col2
, соответствующее последней и второй-последней записи, и изменить значение в col2
, соответствующее второй-последней записи времени, на null
.
Вот часть данных:
time col1 col2 col3
2018-04-29 02:12:00 1 50 3
2018-04-30 01:58:00 1 40 3
2018-05-01 23:34:00 1 11 3
2018-04-29 02:02:00 2 10 4
2018-05-01 05:48:00 2 25 4
Вывод, который я хотел бы получить:
col1 col2 col3
1 [11, Null] 3
2 [25, Null] 4
Как я могу отфильтровать значение в col2 и сделать его похожим на приведенный выше, учитывая 4 столбца, которые у меня были изначально?