Метод Pandas read_csv не может правильно получить символ «œ» при использовании кодировки ISO 8859-15 - PullRequest
0 голосов
/ 05 мая 2019

У меня есть некоторое чтение с пандами в CSV-файл, который включает специальный символ «œ». Я сделал некоторые исследования, и похоже, что этот символ был добавлен в стандарт кодирования ISO 8859-15.

Я пытался указать этот стандарт кодирования для методов pandas read_csv, но он неправильно получает этот специальный символ (вместо этого я получил '☐') в результирующем фрейме данных:

df= pd.read_csv(my_csv_path, ";", header=None, encoding="ISO-8859-15")

Кто-нибудь знает, как я могу получить правильный символ 'œ' (или даже лучше строку 'oe') вместо этого?

Спасибо большое:)

Ответы [ 2 ]

0 голосов
/ 05 мая 2019

У кого-нибудь есть подсказка?Я справился с проблемой, вручную переписав этот специальный символ перед чтением моего csv с пандами, но это не отвечает на мой вопрос: (

0 голосов
/ 05 мая 2019

На самом деле я только что попытался записать кадр данных, чем получаю с помощью кодировки read_csv и ISO-8859-15 (с использованием метода pd.to_csv и кодировки "ISO-8859-15") испециальный символ 'œ' правильно появляется в результирующем csv-файле ...:

df.to_csv(my_csv_full_path, sep=';', index=False, encoding="ISO-8859-15")

Таким образом, похоже, что pandas правильно прочитал специальный символ в моем csv-файле, но не может отобразить его в кадре данных...

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...