Документация по jTidy и TagSoup - PullRequest
6 голосов
/ 15 декабря 2010

Я ищу документацию (официально документацию, если это возможно) для библиотек TagSoup и jTidy.

Я хочу использовать эти библиотеки для манипулирования html-файлами «tagoup», которые включают в себя теги xml с различными пространствами имен, смешанными между тегами html (html, xhtml или html5).

Я тестировал HTMLCleaner, NekoHTML и Jericho, но я не нахожу документацию для jTidy и TagSoup, кроме простейших примеров для очистки файла.

Мне нужна документация о манипулировании содержимым, замене тегов, извлечении информации и т. Д. *

Спасибо

Примечание: После проверки всех вариантов я использовал StAX / Woodstox :

1 Ответ

2 голосов
/ 15 декабря 2010

Может помочь ответ на похожий вопрос в группе Google TagsSup-Friends:

Документация для TagSoup

Вы, вероятно, уже видели их,Javadoc для JTidy доступен здесь: http://jtidy.sourceforge.net/apidocs/index.html

...