pd.read_csv читает меньше строк, чем ожидалось - PullRequest
0 голосов
/ 18 февраля 2020

Я использую pandas для чтения CSV-файла, заранее я уже знаю, что файл имеет 13 000 строк, а pandas читает только 9500 без каких-либо ошибок ... но вот когда я использую ' to_csv () 'и откройте файл с помощью excel, он содержит 13 000 строк, поэтому я не понимаю, что здесь происходит ...

raw_data = pd.read_csv(file
                   ,delimiter='|'
                   ,sep='|'
                   ,low_memory= False
                  )

Ответы [ 2 ]

0 голосов
/ 19 февраля 2020

Я использовал этот пост, чтобы исправить мою проблему, и это сработало

Не читать все строки при импорте CSV в pandas dataframe

Если кто-то может объяснить, почему это происходит, и поэтому мне нужно использовать параметр "цитирование", я буду благодарен.

0 голосов
/ 18 февраля 2020

Однажды у меня была похожая проблема, и я никогда не задумывался над тем, почему он добавил дополнительные строки, хотя я обнаружил, что, используя to_xlsx(), а затем повторно сохраняя его to_csv(), он не добавляет дополнительные строки.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...