Как определить пользовательский агент ответа HTML? - PullRequest
0 голосов
/ 22 мая 2019

Я использую Jsoup connect to url и получаю HTML из этого URL, и я хочу определить, какой пользователь-агент ответа HTML.Пожалуйста, научи меня, если знаешь!

1 Ответ

0 голосов
/ 22 мая 2019

Чтобы выяснить, отвечает ли веб-сервер, к которому вы подключаетесь, содержимому HTML в зависимости от агента пользователя, я не вижу другого пути, кроме проб и ошибок.

Вот как установить user-agent в JSoup:

Response response= Jsoup.connect(location)
       .ignoreContentType(true)
       .userAgent("Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36")  
       .referrer("http://www.google.com")   
       .timeout(10000) 
       .followRedirects(true)
       .execute();

Document doc = response.parse();

Я добавил также некоторые другие полезные модификации запроса, такие как установка реферера, тайм-аут и т. Д. Для получения подробной информации об этих методах см. Документацию Jsoup: https://jsoup.org/apidocs/org/jsoup/Connection.html

Если вы хотите попробовать разные строки нашего пользовательского агента, я бы порекомендовал посмотреть, что там в дикой природе. Коллекцию можно найти здесь: http://www.useragentstring.com/pages/useragentstring.php

...