Question

Я использовал Cobra до сих пор из-за того, как легко это было, но, к сожалению, у него были некоторые проблемы с несколькими тестами. Кто-нибудь предлагает проверенную и проверенную библиотеку?

Я безуспешно пробовал встроенную Cobra и HTMLCleaner.

Pascal Thivent · Answer 1 · 27 ноября 2009

TagSoup действительно отлично подходит для работы с дерьмовым HTML / XHTML.

Иерихон (и NekoHTML ) также хороши для анализа недопустимого HTML.

TagSoup и Jericho: проверено и опробовано. NekoHTML: обратная связь от надежного источника.

Ms2ger · Answer 2 · 28 ноября 2009

Я предлагаю Парсер Validator.nu , основанный на алгоритме парсинга HTML5. (В настоящее время Mozilla заменяет свой собственный анализатор HTML).

peter.murray.rust · Answer 3 · 28 ноября 2009

[Отвечая на заголовок - общий вопрос и комментарии не состоят]

JTidy (http://jtidy.sourceforge.net/) - это порт HTMLTidy Дейва Раггетта. Это очень полезно, хотя я думаю, что разработка могла замедлиться / прекратиться.

Pavel Minaev · Answer 4 · 27 ноября 2009

Mozilla HTML Parser выглядит довольно интересно. По определению, он должен быть таким же хорошим, как и сам движок Gecko, который, вероятно, удовлетворит ваши потребности.

Jim Garrison · Answer 5 · 27 ноября 2009

Взгляните на Saxon (нет, я не связан с продуктом, просто довольный пользователь).

Какие-нибудь хорошие HTML-парсеры Java?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 5 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Какие-нибудь хорошие HTML-парсеры Java?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 5 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов