Как идентифицировать дубликаты временных меток и удалить дубликаты с NA - PullRequest
0 голосов
/ 26 сентября 2019

У меня есть следующий фрейм данных, я ввел дополнительные временные метки, чтобы я мог вставлять NA там, где не было доступной временной метки.Однако не все временные метки в исходных данных были равны: 52 секундам, поэтому дубликаты не возникали на расстоянии одной секунды или около того.

Я хотел бы иметь возможность найти случаи, когда для данного заданного есть две записиминуты, а затем пометьте эти строки как отбрасываемые или хранящиеся в отдельном столбце.

Это будет основано на keep = данных, доступных в столбцах значений (вход, выход), drop = строка с nas.

             datetime        output     input         m 1       m2
1   2012-01-01 12:00:52        NA        NA        24.42250    24.37881
62  2012-01-01 12:00:53     24.92     20.93        24.92000    24.92000
2   2012-01-01 12:01:52        NA        NA        24.60500    24.55069
63  2012-01-01 12:01:53     24.35     21.23        24.35000    24.35000
3   2012-01-01 12:02:52        NA        NA        24.78750    24.72320
64  2012-01-01 12:02:53     24.81     22.35        24.81000    24.81000
4   2012-01-01 12:03:52     24.97     22.18        24.97000    24.97000
5   2012-01-01 12:04:52        NA        NA        25.05500    24.98035

...