Возникли проблемы с кодированием на входе и выходе - PullRequest
0 голосов
/ 09 декабря 2018

Итак, я читаю фрейм данных, содержащий текст на другом языке, используя функцию read_excel(file, encoding='utf-8') в pandas, так как мне предоставляется файл Excel.

То, что приходит через Excel, выглядит следующим образом:

Avez-Vous, персонал, находящийся в полном составе, уполномоченный агентом по изучению вопросов и источников, изюминка кельконка, с 12-ти летними месяцами?

выводится с использованием to_csv(name, encoding='utf-8'), например так:

Avez-vous, stafflement ou avec une autre personre personne, emprunté de l'argent de n'importe quelle источник, за исключением quelconque, au cours des 12 DERNIERS MOIS?

Где я ошибаюсь с кодировкой символов?Как мне убедиться, что он остается в исходном формате?Это потому, что CSV рассматривается как текстовый файл?Спасибо!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...