Панды не читают CSV, так как пишут - PullRequest
0 голосов
/ 29 мая 2019

Я создал фрейм данных и хотел экспортировать его в формате CSV.я использовал метод df.to_csv().

Когда я прочитал созданный мной CSV-файл, он плохо анализируется, и у меня есть некоторые значения столбцов, смешанные между собой.

Я попытался изменить кодировку, а также разделитель, но это не решает мою проблему.

вот пример моего кадра данных до экспорта в виде CSV:

                                           societe  ...     cluster
    6                      ACTION AIR ENVIRONNEMENT  ...  aquavalley
    7                                    AD NUCLEIS  ...  aquavalley
    8                                        AD'OCC  ...  aquavalley
    9                                     ADEQUABIO  ...  aquavalley
    10                              ADICT SOLUTIONS  ...  aquavalley

, затем я использую для экспортаэто:

csv_df.to_csv(r"path.csv", sep="\t")

и читать это:

pd.read_csv(r"path.csv", sep="\t", engine='python')

и я получаю что-то подобное

    7                                    AD NUCLEIS  ...  aquavalley
    8                                        AD'OCC  ...        None
    215 Rue         34000 Mont...    contact@cc.com  ...        None         
    9                                     ADEQUABIO  ...  aquavalley

Ответы [ 3 ]

0 голосов
/ 29 мая 2019

Вы можете попробовать добавить аргумент index в to_csv:

df.to_csv(r"path.csv", sep="\t", index=False)

Или проблема может заключаться в том, что ваши поля содержат вкладки, поэтому в этом случае я бы предложил вам изменить разделитель

0 голосов
/ 29 мая 2019

Спасибо за ваши быстрые ответы. Я решил свою проблему.

Я думал, что избавился от возврата каретки '\ r' и новой строки '\ n' с помощью df.replace ('\ r', ''), но это не сработало (до сих пор не знаю почему) так что они все еще были здесь, когда я думал, что их нет.

Вместо этого я использовал:

df.replace(to_replace=[r"\\t|\\n|\\r", "\t|\n|\r"], value=[" "," "], regex=True)

и после избавления от него у меня нет проблем.

Еще раз спасибо за вашу помощь.

0 голосов
/ 29 мая 2019

попробуйте прочитать как pd.read_csv("path.csv")

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...