Я пытаюсь использовать Pandas.drop_duplicates (), рассматривая только определенное подмножество, но получаю ошибку KeyError: Index(['days'], dtype='object')
Индекс выглядит следующим образом: id, event_description, attribute1, attribute 2, attribute 3, days, days_supply, days_equivalent
Я хочучтобы игнорировать атрибут 2 и атрибут 3, поэтому я выполнил следующее
df = df.drop_duplicates(subset=['id', 'event_description', 'attribute1', 'days', 'days_supply', 'days_equivalent'])
, которое возвращает:
eyError Traceback (most recent call last)
<ipython-input-4-3f7da32b380f> in <module>
7
8 df = df.drop_duplicates(subset=['id', 'event_description', 'attribute1', 'days',
-> 9 'days_supply', 'days_equivalent'])
10
11 print(df)
/anaconda3/lib/python3.6/site-packages/pandas/core/frame.py in drop_duplicates(self, subset, keep, inplace)
4892
4893 inplace = validate_bool_kwarg(inplace, "inplace")
-> 4894 duplicated = self.duplicated(subset, keep=keep)
4895
4896 if inplace:
/anaconda3/lib/python3.6/site-packages/pandas/core/frame.py in duplicated(self, subset, keep)
4949 diff = Index(subset).difference(self.columns)
4950 if not diff.empty:
-> 4951 raise KeyError(diff)
4952
4953 vals = (col.values for name, col in self.items() if name in subset)
KeyError: Index(['days'], dtype='object')
После удаления days
удаление дубликатов выполняется без изъянов, но янужно убедиться, что я считаю days
.Что ошибка требует, чтобы я исправил?