Специальные символы в файле CSV (utf-8) отображаются как? на новом ноутбуке, но не на старом (оба с Excel 2016) - PullRequest
1 голос
/ 16 марта 2020

Я регулярно экспортирую файлы CSV из Shopware и редактирую их в Excel (Windows 10 + Office 2016). Специальные символы выглядят искаженными (например, -), но я могу исправить это с помощью макроса «найти и заменить». Раздражает, но работает.

Однако я только что получил новый ноутбук с Windows 10 + Office 2016, но там специальные символы отображаются в виде белых вопросительных знаков на черных бриллиантах (��). Когда я открываю те же файлы на старом P C, я по-прежнему получаю старые добрые искаженные (но исправимые) специальные символы.

Я проверил все настройки, которые могу придумать, но не могу найти никакой разницы между 2 ПК. У кого-нибудь есть идеи, что может быть причиной и как это исправить?

Спасибо!

Ответы [ 2 ]

1 голос
/ 21 марта 2020

Преступником была необязательная бета-настройка в панели управления / Часы и регион / Административный / Изменить язык системы => Бета-версия: используйте Unicode UTF-8 для поддержки языков во всем мире. После того, как я снял флажок, �� исчез, и все вернулось к норме.

Region Settings

Следующая часть решения - открыть файлы CSV с помощью текстового редактора, например Блокнота, и сохраните их в кодировке UTF-8 с BOM. После этого специальные символы правильно отображаются в Excel, что устраняет необходимость в «найти и заменить».

UTF-8 with BOM

Большое спасибо Марку Толонену + Скомиса для направления меня в правильном направлении.

1 голос
/ 17 марта 2020

«Искаженные символы» в старом ноутбуке представляют собой данные файла в кодировке UTF-8, декодированные как (вероятно) Windows -1252 кодирование. Похоже, что новый ноутбук использует другую кодировку по умолчанию.

Если вы экспортируете свои CSV-файлы как UTF-8 с BOM, и Excel будет отображать их должным образом без «поиска и замены». Если в Shopware нет возможности экспортировать как UTF-8 с BOM, вы можете использовать редактор, такой как NotePad ++ , чтобы загрузить CSV в кодировке UTF-8 и повторно сохранить его как UTF-8 w / BOM.

Кодировка UTF-16 также должна работать, если это опция экспорта.

...