У меня есть файл с примерно 10 м строк.Каждая строка, скорее всего, уникальна, но я сортирую файл по столбцу 1, затем 2, затем 3.
Column 1 = CODE
Column 2 = DATE
Column 3 = AMOUNT
Я хочу сохранить только первую строку до следующей даты и так далее.Ниже приведен пример того, что у меня есть и что мне нужно для вывода.
Original:
COL1 COL2 COL3
ABA 2019-01-01 100
ABA 2019-01-01 111
ABA 2019-01-02 140
ABA 2019-01-02 150
ABA 2019-01-03 200
ABA 2019-01-03 220
Ouptut needed:
COL1 COL2 COL3
ABA 2019-01-01 100
ABA 2019-01-02 140
ABA 2019-01-03 200
Любой, кто сможет мне помочь.Пытался
a.drop_duplicates(subset[data.columns[0],data.columns[1],data.columns[2]], keep='first')