У меня есть df, который выглядит следующим образом:
Id column2 column3 column4 column5
1 1 1 1 nan
1 1 nan nan 1
Я хочу отбросить дубликаты через столбец Id
и сохранить данные в столбцах, где Id
содержит данные, как мне это сделать??
new df:
Id column2 column3 column4 column5
1 1 1 1 1
В настоящее время я использую эти строки кода без успеха в сохранении строк с данными:
1. df = df.drop_duplicates(subset='Id',keep='last')
2. df = df.loc[df.notnull().sum(1).groupby(analysis.Id).idxmax()]