У меня есть фрейм данных:
DF:
1,2016-10-12 18:24:25
1,2016-11-18 14:47:05
2,2016-10-12 21:24:25
2,2016-10-12 20:24:25
2,2016-10-12 22:24:25
3,2016-10-12 17:24:25
Как сохранить только последнюю запись для каждой группы? (есть 3 группы выше (1,2,3)).
Результат должен быть:
1,2016-11-18 14:47:05
2,2016-10-12 22:24:25
3,2016-10-12 17:24:25
Попытка также сделать его эффективным (например, до финиша sh в течение нескольких коротких минут на умеренном кластере (100 миллионов записей), поэтому сортировку / упорядочение следует выполнять (если они требуются) наиболее эффективным и правильным способом.