В проекте, над которым я работаю, используется очень старая (2.1-gr12) версия HtmlCleaner для получения информации из файлов HTML.Мы обнаружили, что HtmlCleaner не декодирует ссылки на символы, такие как &
, ни в текстовом содержимом элемента HTML, ни в значениях атрибутов HTML!Например, атрибут test
<span test="foo&bar">stuff & more stuff</span>
будет интерпретирован как foo&bar
, а содержимое будет интерпретировано как stuff & more stuff
.
Не поддерживает ли HtmlCleaner символьные ссылки?Было ли это добавлено в более поздней версии, или нам нужно установить некоторые настройки?