Pandas Функция drop.duplicate не работает должным образом - PullRequest
0 голосов
/ 26 февраля 2020

В настоящее время я работаю с различными фреймами данных, которые я должен объединить. Один из моих фреймов данных содержит много дубликатов в ключе переменной слияния, поэтому я использовал drop.duplicate для их удаления. Я проверил форму своего фрейма данных до (у него было 531 строка) и после (167 строк). Так что я предположил, что это сработало! Но используя value.counts [ключ слияния], он не возвращает 1 для каждой записи моего ключа переменной слияния. Как я могу объяснить это и исправить это?

Для лучшего понимания вот мой код: df_stores.drop_duplicates (subset = 'Store ID', keep = 'first')

df_stores [ 'Store ID']. Value_counts (). Sort_index (ascending = True)

Большое спасибо за ваши ответы!

1 Ответ

1 голос
/ 26 февраля 2020

Точно так же это легко доступно для других. Я пишу ответ Есть два способа:

1. df_stores.drop_duplicates(subset = 'Store ID', keep = 'first', inplace= True)

Примечание. Не используйте его везде, так как в некоторых случаях он выдает предупреждение

2. df_stores = df_stores.drop_duplicates(subset = 'Store ID', keep = 'first')

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...