HtmlCleaner не обрабатывает ссылки на символы - PullRequest
1 голос
/ 19 сентября 2019

В проекте, над которым я работаю, используется очень старая (2.1-gr12) версия HtmlCleaner для получения информации из файлов HTML.Мы обнаружили, что HtmlCleaner не декодирует ссылки на символы, такие как &amp;, ни в текстовом содержимом элемента HTML, ни в значениях атрибутов HTML!Например, атрибут test <span test="foo&amp;bar">stuff &amp; more stuff</span> будет интерпретирован как foo&amp;bar, а содержимое будет интерпретировано как stuff &amp; more stuff.

Не поддерживает ли HtmlCleaner символьные ссылки?Было ли это добавлено в более поздней версии, или нам нужно установить некоторые настройки?

...