Извлечь содержимое div из htmlsource в строку (Java) - PullRequest
2 голосов
/ 07 мая 2009

Я пытаюсь извлечь содержимое специального тега div (определяемого его именем класса) из строки, содержащей источник HTML. Я думаю, что регулярные выражения Java не так просты в использовании, как в perl, верно?

Кто-нибудь делал это раньше и может дать мне кусок кода? возможно, dom-browsing - хорошее решение, но я не нашел ни одного учебника, соответствующего моей проблеме.

Ответы [ 2 ]

1 голос
/ 09 мая 2009

Вы можете использовать HTML Parser или другую библиотеку HTML для разбора из этого списка .

0 голосов
/ 08 мая 2009

Исходя из ваших комментариев, звучит так, как будто у вас есть общий случай ("сканер"), и, таким образом, вы фактически анализируете файл XML. Если исходной страницей является xhtml, то у вас есть множество вариантов в различных библиотеках XML. (JDom, например).

...