Я использую PHP SimpleXML для работы с файлами XML на моем сервере. Мне нужно только прочитать содержимое XML (мне не нужно его изменять), поэтому я остановился на простом и удобном в использовании SimpleXML. Но у SimpleXML возникают проблемы при чтении определенного файла XML, потому что в нем есть очень странные символы. Я получаю следующие ошибки:
Warning: simplexml_load_file() [function.simplexml-load-file]: data/data.xml:348: parser error : PCDATA invalid Char value 3 in C:\xampp\htdocs\VMP\xintel\analyzer.php on line 54
Warning: simplexml_load_file() [function.simplexml-load-file]: Jardin al fte. Hall de recepcion, amplio living comedor. ocina comedor diario c in C:\xampp\htdocs\VMP\xintel\analyzer.php on line 54
У меня нет контроля над тем, что входит в XML-файл, поэтому я не могу остановить добавление этих символов в файл. Кроме того, я не знаю, как решить эту проблему. Файл должен быть закодирован в utf-8. Поэтому я попробовал такие вещи, как декодирование из UTF-8 в ISO-8859-1 и наоборот, но ничего не происходит.
Может ли кто-нибудь мне помочь? Должен ли я попытаться изменить кодировку? Должен ли я попытаться удалить эти символы? Что-нибудь? * * 1006
Редактировать: Стангр-символы - это все символы рисования прямоугольников (см .: http://en.wikipedia.org/wiki/Box-drawing_characters)