Мой набор данных выглядит примерно так:
Я пытаюсь 2 функции, чтобы очистить df - сначала удалить все равные комбинации в df - это означает, что если одинаковые идентификаторы комбинируются вместе, как строки 1 и 3, это удаляет это, но потом, когда я пытаюсь вторую функцию, которая затем удаляет любые дубликаты в каждом столбце - он работает без ошибок, но фактические дубликаты не удаляются?
def remove_dup_combos(df):
u = df.filter(like='id').values
m = pd.DataFrame(np.sort(u, axis=1)).duplicated()
df = df[~m]
return df
def remove_dups(df):
df = df = df.drop_duplicates(['id1', 'id2'])
return df