Нечитаемые символы из Python в CSV-файл - PullRequest
0 голосов
/ 28 сентября 2018

Я студент лингвистики и загружаю твиты на итальянском для своей диссертации, я читал предыдущие ответы на похожие проблемы, но ни одна из них не работала для меня: после загрузки, если я читаю их в терминале PyCharmмои твиты отлично читаются, но когда я открываю файл csv, неважно, какая программа, LibreOffice (я использую Ubuntu 18.04), Excel 2010, Txt, такие символы, как «é è à» и т. д., визуализируются какСтрока Юникода.Я пробовал каждый урок здесь и в других местах, но у меня нет успеха, есть идеи, что я могу сделать?Большое спасибо

1 Ответ

0 голосов
/ 28 сентября 2018

Можно попробовать два варианта.

  1. Использовать Sublime Text (бесплатная пробная версия): откройте файл CSV, затем Save with encoding...и выберите «UTF-8»

  2. Импорт (а не открытие) в Excel : открыть пустой лист.Затем Import, выберите CSV File.В следующем помощнике выберите «UTF-8» в качестве источника.

enter image description here

...