Получение данных с другого сайта с помощью JSOUP - PullRequest
0 голосов
/ 25 октября 2018

По сути, мне нужен стол со всеми возможными книгами, которые существуют, и я не хочу этого делать, потому что я очень ленивый человек xD.Итак, мой вопрос ... могу ли я использовать сайт, который я имею в виду, и так же, как отключить остальную часть этого сайта (которая мне не нужна) и оставить только часть поиска (возможно, внести какие-то изменения вмакет) ... затем сделайте поиск, найдите книгу и сохраните в моей базе данных только те данные, которые имеют для меня смысл.Это возможно?Я слышал, что JSOUP может помочь.Итак, я просто хочу несколько советов.(спасибо за чтение).

сайт: http://www.isbn.bn.br/website/consulta/cadastro

1 Ответ

0 голосов
/ 25 октября 2018

Да, вы можете сделать это с помощью Jsoup, основная проблема в том, что URL-адрес, которым вы поделились, использует JavaScript, поэтому вам нужно будет использовать Selenium для принудительного выполнения JS, или вы также можете получить URL книги и проанализировать ее.

Способ анализа сети с помощью Jsoup:

Document document = Jsoup.connect("YOUR-URL-GOES-HERE")
                         .userAgent("Mozilla/5.0")
                         .get();

. Вы извлекаете весь HTML-документ в документе, чтобы вы могли получить любой элемент, содержащийся в элементе, с помощью селекторов CSS, например, еслив HTML, который вы хотите получить в Интернете, вы можете использовать:

Elements elements = document.select("title");

И это для каждого HTML-тега, из которого вы хотите получить информацию.Вы можете проверить Jsoup Doc и проверить некоторые из объясненных примеров: Jsoup

Надеюсь, это поможет вам!

...