Извлечение ссылок из документа jsoup, содержащего некоторую строку в другую строку - PullRequest
1 голос
/ 09 марта 2012

Я использую jsoup , чтобы извлечь ссылки с веб-сайта.Я хочу извлечь только одну указанную ссылку, содержащую некоторые ключевые слова.Я хочу получить ссылки, содержащие ключевое слово «скачать».как это сделать.у меня есть следующий код

Document doc = Jsoup.parse( new URL("http://www.examplesite.com)); 
Element link = doc.select("a").first();

Ответы [ 2 ]

3 голосов
/ 09 марта 2012

См. здесь для синтаксиса селектора.

Вы можете проверить текст в узле с помощью :contains, например, Element link = doc.select("a:contains(Download)").first();. Если вы хотите, вы можете использовать :matches для регулярных выражений.

Вы получаете адрес ссылки методом attr, например, String linkaddress = link.attr("href");.

0 голосов
/ 19 января 2017

Вы можете использовать это

elements with attributes that start with [attr^=value],end with [attr$=value],contain the value [attr*=value] e.g. [href*=/path/]

Вы хотите получить ссылки, содержащие определенное слово, используйте это

org.jsoup.select.Elements links = doc.select("[href*=download]");
...