Почему вывод csv не идентичен оригиналу в pandas - PullRequest
0 голосов
/ 14 января 2020

Я открываю файл данных csv1.txt (в формате CSV) в Windows ОС. При открытии в блокноте Windows. это как:

john|mary|joe34|25|332|21|4321|42|25

Я использую эти коды в блокноте Jupyter для выполнения read_csv и to_csv в pandas:

import pandas as pd
df = pd.read_csv('csv1.txt', header=None)
df.to_csv('csv2.txt', header=False, index=False)

Затем, когда я открываю csv2.txt , это выглядит так:

john|mary|joe
34|25|3
32|21|43
21|42|25

Есть ли способ сделать csv2.txt идентичным csv1.txt?

1 Ответ

0 голосов
/ 14 января 2020

Вы, вероятно, должны предоставить соответствующие line_terminator - to_csv, например, предполагая, что вы читаете CSV-стиль unix в Windows, ввод, вероятно, обрабатывается универсальными символами новой строки, а затем при записи Pandas использует os.linesep, который является "полным" переводом строки windows, а не unix стиль '\n'. Что-то в этом роде.

Помимо этого, предоставление соответствующей контекстной среды, как правило, полезно для получения ответов: «Когда вы ее открываете, это похоже на:« когда читатель не знает, какая у вас ОС, что вы подразумеваете под «откройте его», каково фактическое (необработанное) содержимое файла и т. д. c ...

...