Как получить информацию с веб-страницы на Java? - PullRequest
1 голос
/ 16 июня 2011

Кто-нибудь знает быстрый способ получения информации с веб-страницы на Java? Например, если я смотрю на страницу, подобную этой: http://www.ncbi.nlm.nih.gov/pubmed/?term=10952317, и я хочу извлечь список слов под заголовком «Условия MeSH», как мне поступить?

У меня есть кое-что, что может прочитать источник, но оно полно HTML-тэгов и тому подобного ...

Любая помощь очень ценится!

Ответы [ 2 ]

3 голосов
/ 16 июня 2011

Как уже упоминалось здесь, бесчисленное количество раз, прежде чем взглянуть на JSoup , библиотеку HTML для синтаксического анализа Java.Или написать свой (не рекомендуется).

0 голосов
/ 16 июня 2011

Возможно TagSoup для вас.

...