У меня есть набор данных, df, со следующими данными:
starttime endtime ID Diff
1/10/2020 9:05:00 PM 1/10/2020 9:05:10 A 10
1/10/2020 9:05:00 PM 1/10/2020 9:05:10 A 10
1/10/2020 9:06:00 PM 1/10/2020 9:06:10 B 10
Желаемый результат:
starttime endtime ID Diff
1/10/2020 9:05:00 PM 1/10/2020 9:05:10 A 10
1/10/2020 9:06:00 PM 1/10/2020 9:06:10 B 10
Если вы заметили, одна из строк из группы A была удалена, поскольку это был точный дубликат:
1/10/2020 9:05:00 pm 1/10/2020 9:05:10 A 10
Это код, который я использую, однако я не уверен относительно того, что включать в скобки, или если это правильно:
df.drop_duplicates(subset=None, keep=False)
Любые предложения приветствуются.