Разбор HTML Оффлайн - PullRequest
1 голос
/ 11 мая 2010

Существуют ли HTML-парсеры, которые анализируют HTML-документы в автономном режиме, т.е. хранятся на вашем компьютере? Если да, кто-нибудь может назвать несколько хороших, пожалуйста?

ОБНОВЛЕНИЕ: Ха, NVM нашел ответ, кто-нибудь сможет привести пример этого в html Иерихоне?

ОБНОВЛЕНИЕ2: Я думал, что нашел ответ, но я ошибаюсь, принял InputStream для FileInputStream: (

Ответы [ 3 ]

4 голосов
/ 11 мая 2010

Вот некоторые из них, которые вы можете посмотреть:

0 голосов
/ 11 мая 2010

Nutch имеет HTML-анализатор в качестве подкомпонента. Javadoc здесь .

0 голосов
/ 11 мая 2010

Как насчет HTML Parser .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...