JQuery как lib в Java - PullRequest
       4

JQuery как lib в Java

5 голосов
/ 22 октября 2010

Я ищу простую легковесную библиотеку Java, которая разбирает HTML.Я много смотрел и есть много вариантов там.Но я не могу найти что-то простое.Я действительно хотел бы иметь что-то вроде pyquery в Python, кроме как в Java.Мои требования: быстрый, простой в использовании и легкий.

Зачем мне это нужно?Не уверен, что это имеет значение, но мне нужно проиндексировать части HTML-документов.Поэтому я надеюсь, что смогу быстро выбрать часть этого документа, а затем проанализировать его.

Ответы [ 5 ]

6 голосов
/ 22 октября 2010

Я использовал HTMLParser в прошлом.Я не был очень доволен этим.Я нашел tagoup и jsoup.Мне очень нравится jsoup .Пока не использовал его широко, но вы можете сделать что-то вроде:

Elements resultLinks = doc.select("h3 > a"); // direct a after h3
2 голосов
/ 22 октября 2010

попробуй заводной. У него есть несколько «slurpers», которые являются DSL для чтения в разметке, такой как XML и HTML, а также JSON. здесь например.

1 голос
/ 22 октября 2010

Используйте tagsoup для нормализации HTML в xhtml и XOM для анализа полученного документа.Это не так сложно.

XPath упростит выбор, подобный селекторам CSS.

0 голосов
/ 06 июля 2017

Посмотрите на Джерри, который выглядит очень многообещающе http://jodd.org/doc/jerry/

0 голосов
/ 22 октября 2010

Если вам нужна библиотека, похожая на jQuery, как следует из заголовка вашего вопроса, вам следует просмотреть GWT .

GWT позволит вам изучить DOM вашей страницы. Попробуйте учебник, и через 30 минут вы будете уверены, что хотите узнать больше или нет ...

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...