Как преобразовать неизвестный / смешанный файл кодировки в UTF-8 - PullRequest
1 голос
/ 08 декабря 2011

Я использую извлечение файла XML из удаленной службы, которая должна быть UTF-8, поскольку заголовок <?xml version="1.0" encoding="UTF-8"?>.Однако некоторые его части, по-видимому, не являются UTF-8, так как при загрузке в расширение XMLReader PHP выдает какую-то ошибку «Не UTF-8 как ожидается» при разборе определенных частей документа (частей, которые выглядят какони были скопированы напрямую из MS Word).

Я ищу идеи для решения этой ошибки.Есть ли какая-нибудь программа, которую я могу использовать, чтобы "исправить" файл любых кодировок не-uft8?Решение PHP или любое другое решение подойдет

1 Ответ

0 голосов
/ 08 декабря 2011

В зависимости от того, какую кодировку вы конвертируете из , быстрые и легкие безопасные строки utf-8, функция utf8_encode - ваш друг, но только для кодировки iso8859-1, Кроме того, ваш текст не может быть уже UTF-8, иначе у вас есть хорошие шансы искаженного текста.

См. Справочную страницу для получения дополнительной информации:

// Usage can be as simple as this.
$name = utf8_encode($contact['name']);

С другой стороны, если вам нужно конвертировать из любой другой кодировки, вам, возможно, придется взглянуть на incov () функцию .

Удачи

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...