Как читать CSV-файлы с кодом MBC c в Python на Linux? - PullRequest
0 голосов
/ 28 апреля 2020

Я пытаюсь читать файлы CSV с кодировкой Западной Европы (windows)

df = pd.read_csv(FileName,encoding='mbcs', usecols=[1],header=4)

Этот код хорошо работает на Windows, но не на Linux 18.04. (Ошибка: неизвестная кодировка: mbcs) Действительно, в кодеках python документации у нас есть информация:

mbcs is for Windows only: Encode the operand according to the ANSI codepage (CP_ACP).

есть ли другой способ / имя для декодирования моих файлов в python на Linux? (У меня есть тысячи файлов, поэтому я не могу сохранить как в Excel)

1 Ответ

0 голосов
/ 28 апреля 2020

Если в ваших системах используется кодировка Западной Европы для Windows, кодировка mbcs (кодовая страница ANSI) равна cp1252. Поэтому вы должны использовать:

df = pd.read_csv(FileName,encoding='cp1252', usecols=[1],header=4)

в обеих системах, чтобы иметь совместимую кодовую базу.

...