Как отсортировать строки CSV по одному столбцу с помощью PANDAS python - PullRequest
0 голосов
/ 23 сентября 2019

В настоящее время в моем проекте я пытаюсь отсортировать строки листа CVS по единственному столбцу, я использую PANDAS, и я видел несколько примеров, размещенных по всему Интернету, однако, пытаясь реализовать это самостоятельно, я не смогto.

db = pd.read_csv(databasefile, skip_blank_lines=True, names=['ExampleOne','ExampleTwo','ExampleThree','ExampleFour'], header=1)
db.drop_duplicates(inplace=True)

db.sort_values(by=['ExampleOne'], ascending=[True])

db.to_csv(databasefile, index=False)

В приведенном выше коде я подумал бы, что я превращаю CSV в кадр данных для использования PANDAS, в этом кадре данных я отбрасываю любые дублирующиеся строки и сортирую по столбцу ExampleOne.В конце концов я отправляю эту информацию обратно в CSV.Однако при просмотре CSV после выполнения кода без ошибок данные не сортируются ни в каком порядке.

Ссылка на базу данных CSV

Вот CSV в текстовом форматеформат, первые 60 или около того строк отсортированы, но это потому, что ранее в этом процессе я объединяю несколько CSV вместе в один CSV.

Спасибо за чтение!Я был бы признателен за любую помощь или предложения, которые кто-нибудь попросил бы меня попробовать, так как эта проблема меня расстраивает.Еще раз спасибо за чтение!

1 Ответ

0 голосов
/ 23 сентября 2019
databasefile = r"path"
databasefile2 = r"path"
db = pd.read_csv(databasefile, skip_blank_lines=True, names=['ExampleOne','ExampleTwo','ExampleThree','ExampleFour'], header=1)
print(db['ExampleOne'])
db.drop_duplicates(inplace=True)
db2 = db.sort_values(by=['ExampleOne'], ascending=[True],inplace=True)
db.to_csv(databasefile2, index=False)

Вот решение вашей проблемы.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...