Как преобразовать веб-страницу в XML-документ, используя Java? - PullRequest
0 голосов
/ 14 декабря 2009

Предполагается, что веб-страница закодирована с правильными тегами. Как я могу преобразовать его в файл XML? Я думаю, что большинство веб-страниц можно рассматривать как дерево dom ... Как я могу преобразовать его в файл XML?

1 Ответ

0 голосов
/ 14 декабря 2009

JTidy читает HTML и представляет его как DOM. Если у вас есть HTML в качестве DOM, вы сможете обработать его и записать в формате XML.

Чтобы вывести DOM, см. Пример кода здесь и, в частности, XMLSerializer.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...