У меня есть CSV-файл, который имеет следующий формат:
Username,Name,Phone,Email,Country,Login
John23,John Doe,99999999,johndoe@yahoo.com,Italy,1585589097.787715
John23,John Doe,99999999,johndoe@yahoo.com,Italy,1585652050.037622
Я хочу удалить строки, содержащие повторяющееся «Имя пользователя», и просто сохранить строку с наибольшим значением в «Логин».
Сейчас у меня есть следующее, но оно удаляет только идентичные строки:
#remove duplicates and generate new csv
from more_itertools import unique_everseen
with open('jornalnoticias.csv','r') as f, open('jornalnoticias_full.csv','w') as out_file:
out_file.writelines(unique_everseen(f))