Если HTML-код не находится внутри конструкции CDATA или иным образом не закодирован, то вы можете сделать небольшой взлом.
Перед обработкой с помощью XML :: Simple найдите содержимое тега <my_html>
, который предположительно является подозрительным для HTML, и передайте его через кодировщик сущности HTML ("<" => "& lt '" и т. Д.), Например HTML: : Сущности. Затем вставьте закодированное содержимое вместо исходного содержимого тега <my_html>
.
Это ОЧЕНЬ хакерский, ОЧЕНЬ легкий сделать неправильно, если вы не знаете на 100%, что вы делаете с регулярными выражениями, и делать это не следует.
Сказав это, это решит вашу проблему.