Question

У меня есть набор данных, df, со следующими данными:

starttime               endtime              ID  Diff  
1/10/2020 9:05:00 PM    1/10/2020 9:05:10    A    10
1/10/2020 9:05:00 PM    1/10/2020 9:05:10    A    10
1/10/2020 9:06:00 PM    1/10/2020 9:06:10    B    10

Желаемый результат:

starttime               endtime              ID Diff
1/10/2020 9:05:00 PM    1/10/2020 9:05:10    A  10
1/10/2020 9:06:00 PM    1/10/2020 9:06:10    B  10

Если вы заметили, одна из строк из группы A была удалена, поскольку это был точный дубликат:

1/10/2020 9:05:00 pm    1/10/2020 9:05:10    A   10

Это код, который я использую, однако я не уверен относительно того, что включать в скобки, или если это правильно:

df.drop_duplicates(subset=None, keep=False)

Любые предложения приветствуются.

lsabi · Answer 1 · 21 января 2020

Попробуйте посмотреть в документах. Если вы не можете понять, что является наиболее подходящим для вашего случая, то спросите еще раз, предоставив контекст (например, пример).

Ссылка для pandas 0,25

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.drop_duplicates.html

Удалить повторяющиеся строки в Pandas (возможно, по группам)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Удалить повторяющиеся строки в Pandas (возможно, по группам)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов