Разбираем HTML и получаем все узлы - PullRequest
0 голосов
/ 13 марта 2012

Мне нужно проанализировать HTML-файл в Java. В отличие от XML нет повторяющихся тегов. Поэтому мне нужен код, который может анализировать html-файл и охватывать все узлы, он включает в себя вложенные теги и т. Д. HTML-код не исправлен. Другими словами, учитывая любой HTML-код, мне нужно охватить все теги в HTML.

Ответы [ 2 ]

1 голос
/ 13 марта 2012

попробуйте этот HTML Parser http://htmlparser.sourceforge.net/samples.html

0 голосов
/ 13 марта 2012

Я думаю, тебе нужно это ...

var els=document.getElementsByTagName("*");
for(var i=0;i<els.length;i+)document.write(els.nodeName+"<br />");
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...