Существует ли модуль perl, который заменит коды символов HTML / XML фактическими символами? - PullRequest
0 голосов
/ 21 апреля 2011

У меня есть строка с кодами символов XML (например, &, < и т. Д.).Мне было интересно, есть ли модуль, который я могу использовать для автоматической замены этих кодов символов действительными.

Я знаю, что могу написать простое регулярное выражение поиска / замены, но тогда мне придетсяуверен, что я не пропускаю никаких кодов символов;это похоже на тот тип вещей, который будет обрабатываться каким-либо существующим модулем.

Спасибо!

Ответы [ 2 ]

8 голосов
/ 21 апреля 2011

Гул ... Ваш HTML или XML-парсер должен делать это за вас.

Для HTML вы можете использовать HTML :: Entities .

Для XMLопределения сущностей основаны на схеме и на самом документе, поэтому он действительно должен быть частью процесса синтаксического анализа XML.Единственные именованные сущности, о которых знает сам XML, это &, <, >, ' и ", но в документе XML может использоваться любой из бесконечного диапазона возможных сущностей.

3 голосов
/ 21 апреля 2011

Звучит так, будто вы ищете HTML::Entities из HTML::Parser.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...