Как настроить nekohtml parser для правильного закрытия тега привязки? - PullRequest
1 голос
/ 13 октября 2011

Я использую анализатор nekohtml для анализа моего HTML-кода. Иногда моя ошибка при использовании якорного тега была написана так.

<a href="http://abc.com"><a href="http://abc.com">abc</a></a>

После анализа nekohtml я хочу, чтобы содержимое было исправлено следующим образом.

<a href="http://abc.com"></a><a href="http://abc.com">abc</a>

Для этого, пожалуйста, помогите настроить разбор nekohtml.

Обновление:

После того, как я попробовал с настройками как

parser.setFeature ("http://cyberneko.org/html/features/balance-tags", true);

бесполезно. я не даю результат, как я ожидал. он возвращает тот же контент HTML, как я дал

1 Ответ

0 голосов
/ 13 октября 2011

Необходимо установить функцию balance-tags, которая указывает, должен ли анализатор NekoHTML пытаться сбалансировать теги в проанализированном документе.

config.setFeature( "http://cyberneko.org/html/features/balance-tags", true );

из документов:

  • Балансировка тегов исправляет многие распространенные ошибки, добавляя отсутствующие родительские элементы, автоматически закрывая элементы с дополнительными конечными тегами и исправляя несбалансированные встроенные теги элементов. Для обработки документов HTML как XML эта функция не должна быть отключена. Эта функция предоставляется в качестве повышения производительности для приложений, которые заботятся только о внешнем виде определенных элементов, атрибутов и / или содержимого независимо от плохо сформированной структуры документа.
...