В какой кодировке открыть файл utf-8 csv в Python, который правильно открывается в Excel с Windows (ANSI) - PullRequest
0 голосов
/ 18 октября 2018

У меня есть экспорт базы данных в формате csv, кодированный UTF8.Когда я открываю его в Excel, при открытии мне нужно выбрать Windows (ANSI), чтобы правильно отображались специальные символы (например, é, è, à).Если я использую Python pandas для открытия CSV-файла с указанием кодировки UTF8, он, похоже, неправильно декодируется (символы é, è, à отображаются неправильно):

StŽphanie
FrŽdŽrique
GŽraldine

Как правильно читатьэтот файл с Python пандами?Большое спасибо

Ответы [ 2 ]

0 голосов
/ 22 октября 2018

Решением было использование кодировки latin1 в моем случае:

Stéphanie
Frédérique
Géraldine
0 голосов
/ 18 октября 2018

Это кодировка Windows-1252, называемая Python "cp1252".ANSI является неправильным;это совершенно не связано с организацией.

Попробуйте:

with open("filepath.csv", encoding="cp1252") as f:
    pandas.read_csv(f)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...