Кодировка UTF8 не может быть декодирована - PullRequest
0 голосов
/ 16 ноября 2010

Я получил XML-файл, который полон строк utf-8 с французского языка.Вот некоторые сообщения:

«Нет сомнений в том, что профессор точно, без всякого использования»

Как видите, акценты терпят неудачу,Я попытался преобразовать файл с помощью iconv, но, похоже, он не распознается как UTF-8 (когда файл использует эту кодировку).Что я могу сделать?

Спасибо!

1 Ответ

0 голосов
/ 26 февраля 2011

Попробуйте открыть файл в блокноте Windows и посмотрите, как он выглядит.Если все выглядит хорошо, то проблема, вероятно, где-то еще (например, отправляете ли вы данные в браузер и не указываете UTF-8?).

Если в блокноте это тоже выглядит неправильно, попробуйте следующее (Я скопировал ваши данные в файл и смог «исправить», выполнив это):

  • Открыть в Блокноте
  • Файл -> Сохранить как -> Выбрать «ANSI» иСохранить
  • Открыть новый файл в Блокноте
  • Файл -> Сохранить как -> Выбрать UTF-8 и Сохранить

Этот конечный файл должен правильно открыться в Блокноте ибыть закодирован как UTF-8 с трехбайтовой подписью UTF-8.

...