Получение DOM-представления веб-страницы на Java, а не только Source - PullRequest
0 голосов
/ 26 января 2012

Возможно ли получить представление Dom страницы, например, то, что вы видите в chrome при нажатии на элемент inspect, по сравнению с исходным представлением.Мне нужно получить доступ к этому через Java, и в настоящее время я могу просто получить источник.

Спасибо, ребята.

Ответы [ 2 ]

0 голосов
/ 26 января 2012

HTML может быть грязным.В прошлом я использовал TagSoup для анализа HTML и генерации XML в виде потока событий SAX, а затем использовал JDOM для построения DOM-подобного дерева в памяти.версия XML, которая работала хорошо.Затем вы можете использовать другие библиотеки, такие как Saxon , чтобы выполнить xpath, xslt или xquery для этого дерева XML.

0 голосов
/ 26 января 2012

ИМХО, вам тоже нужно перейти по ссылкам ... поэтому, когда у вас есть источник, вам нужно его проанализировать.Затем вы можете вставить содержимое ссылок (например, CSS или скрипт) в исходный DOM.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...