Можно ли использовать xsltproc для анализа XML-файлов без UTF 8? - PullRequest
0 голосов
/ 16 июля 2009

Я написал скрипт оболочки bash, который читает каталог и анализирует все XML-файлы в нем в цикле for. Я беру каждый XML-файл и передаю его в xsltproc вместе с таблицей стилей xsl. Проблема заключается в том, что некоторые xml-файлы не имеют символов UTF 8, и анализатор не может открыть эти файлы. Выдается ошибка синтаксического анализатора, говорящая о том, что ожидается кодировка UTF 8.

Есть ли какая-либо опция, в которой я могу указать моему xsltproc обработать эти файлы.

Еще один вариант заключается в том, что я могу попросить мой xsl прочитать только те теги, которые мне нужны, а не весь файл xml? так работает xsl или я тоже ошибаюсь

Пожалуйста, помогите мне

1 Ответ

1 голос
/ 25 августа 2010

Если вы можете идентифицировать файлы не-UTF-8 и знать кодировку, в которой они находятся, то обрабатывайте эти файлы с помощью

iconv -f [encoding] -t UTF-8 < [file] | xsltproc ...

вместо простого вызова xsltproc должен сделать ya.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...