Ява читать веб-страницу с помощью URL - PullRequest
0 голосов
/ 14 декабря 2010

как читать следующую страницу с тем же URL-адресом

URL-адрес страницы содержит много страниц, которые я прочитал на первой странице, используя

URL(url).openStream()

, но это просто чтение первой страницы

например, на этом сайте я прочитал первую страницу, как я могу прочитать вторую culture.gov.uk/news/news_stories/6832.aspx

Ответы [ 2 ]

1 голос
/ 14 декабря 2010

На следующей странице будет ссылка.

Вы можете проанализировать HTML и собрать все ссылки, а затем отфильтровать, какая ссылка является следующей для этой страницы, а затем прочитать ее таким же образом.

Вот пример, в котором будут перечислены все ссылки с данной страницы. - используя JSOUP

Примечание. Для некоторых сайтов делать это, безусловно, нелегально.

0 голосов
/ 14 декабря 2010

Вам понадобится схема URL для подкачки. Например, это может быть url + "?page=" + page. Это зависит от сайта. Обратите внимание, что соскоб не всегда законно .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...