Проблема с кодировкой php xml - PullRequest
0 голосов
/ 05 декабря 2011

Привет, ребята, после 5 часов исследований и пробуя все, я так отчаялся, что пишу здесь. У меня есть XML-файл от третьей стороны. Когда я пытаюсь разобрать его с SimpleXMLElement, он просто говорит, что строка не в допустимом формате XML, и я также обнаружил, что это происходит из-за кодировки ANSI, которую имеет файл XML. Я попытался преобразовать файл в UTF-8 -> он читается парсером, но все мои кириллические символы теряются, заменяются бессмысленными символами. Затем в notepad ++ я скопировал содержимое, создал файл с кодировкой utf8 и вставил содержимое -> все было в порядке и было прочитано парсером. Я попытался сделать это с помощью кода, но безрезультатно -> я получаю содержимое файла, создаю файл с первыми байтами, байтами файла UTF-8, выводю содержимое, а когда я его открываю -> бессмысленные символы вместо кириллицы. Помогите мне, пожалуйста, мне действительно нужно преобразовать этот файл в UTF-8, действительный для синтаксического анализатора XML, или не могли бы вы подсказать мне другой способ анализа файла из XML в массив.

Ответы [ 2 ]

0 голосов
/ 05 декабря 2011

Вам необходимо выяснить, в какой кодировке находится оригинальный XML-файл, затем вы можете использовать iconv для преобразования его в UTF8.

0 голосов
/ 05 декабря 2011
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...