Question

Привет, ребята, после 5 часов исследований и пробуя все, я так отчаялся, что пишу здесь. У меня есть XML-файл от третьей стороны. Когда я пытаюсь разобрать его с SimpleXMLElement, он просто говорит, что строка не в допустимом формате XML, и я также обнаружил, что это происходит из-за кодировки ANSI, которую имеет файл XML. Я попытался преобразовать файл в UTF-8 -> он читается парсером, но все мои кириллические символы теряются, заменяются бессмысленными символами. Затем в notepad ++ я скопировал содержимое, создал файл с кодировкой utf8 и вставил содержимое -> все было в порядке и было прочитано парсером. Я попытался сделать это с помощью кода, но безрезультатно -> я получаю содержимое файла, создаю файл с первыми байтами, байтами файла UTF-8, выводю содержимое, а когда я его открываю -> бессмысленные символы вместо кириллицы. Помогите мне, пожалуйста, мне действительно нужно преобразовать этот файл в UTF-8, действительный для синтаксического анализатора XML, или не могли бы вы подсказать мне другой способ анализа файла из XML в массив.

Marijn van Vliet · Answer 1 · 05 декабря 2011

Вам необходимо выяснить, в какой кодировке находится оригинальный XML-файл, затем вы можете использовать iconv для преобразования его в UTF8.

Valhallen · Answer 2 · 05 декабря 2011

Попробуйте посмотреть

http://php.net/manual/en/function.utf8-decode.php и http://php.net/manual/en/function.iconv.php

Проблема с кодировкой php xml

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Проблема с кодировкой php xml

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов