привет, у меня есть pandas фрейм данных (около 1000 строк), который можно суммировать следующим образом:
Date Distance
0 2014-08-13 5.9
1 2014-08-17 10.7
2 2014-08-13 6.2
3 2014-08-20 13.7
4 2014-08-13 8.8
5 2014-08-17 10.9
Я хотел бы отбросить строки, когда Дата идентична и разница расстояний между двумя ряды меньше 0,5. Мои данные не упорядочены
В этом микро-случае результат, который я ищу, возвращает этот фрейм данных:
Date Distance
0 2014-08-13 5.9
1 2014-08-17 10.7
3 2014-08-20 13.7
4 2014-08-13 8.8
индекс 2 был удален, поскольку он совпадает с датой индекса 0 и разница между двумя расстояниями была меньше 0,5.
индекс 5 был удален, это та же дата, что и индекс 1, а разница между двумя расстояниями была меньше 0,5
Я своего рода невежественный способ эффективного решения этой проблемы. Спасибо за вашу помощь !
Редактировать : Я не был достаточно понятен с моим предыдущим примером. это не по сравнению с первым расстоянием (или наименьшим) определенной даты. это между любыми двумя расстояниями определенной даты.
Этот пример может быть более явным:
Date Distance
0 2014-08-13 5.9
1 2014-08-17 10.7
2 2014-08-13 6.2
3 2014-08-20 13.7
4 2014-08-13 8.8
5 2014-08-17 10.9
6 2014-08-13 3.3
7 2014-08-13 3.6
8 2014-08-13 3.5
9 2014-08-13 1.7
он должен вернуть:
Date Distance
0 2014-08-13 5.9
1 2014-08-17 10.7
3 2014-08-20 13.7
4 2014-08-13 8.8
6 2014-08-13 3.3
9 2014-08-13 1.7