Итак, я читаю фрейм данных, содержащий текст на другом языке, используя функцию read_excel(file, encoding='utf-8')
в pandas, так как мне предоставляется файл Excel.
То, что приходит через Excel, выглядит следующим образом:
Avez-Vous, персонал, находящийся в полном составе, уполномоченный агентом по изучению вопросов и источников, изюминка кельконка, с 12-ти летними месяцами?
выводится с использованием to_csv(name, encoding='utf-8')
, например так:
Avez-vous, stafflement ou avec une autre personre personne, emprunté de l'argent de n'importe quelle источник, за исключением quelconque, au cours des 12 DERNIERS MOIS?
Где я ошибаюсь с кодировкой символов?Как мне убедиться, что он остается в исходном формате?Это потому, что CSV рассматривается как текстовый файл?Спасибо!