Вы не получаете никаких ссылок, потому что в карте сайта нет элементов с тегом a
. URL-адреса в карте сайта находятся в теге loc
. Используйте Elements liens = dom.getElementsByTag("loc");
Возможно, вы ошиблись тем, что получаете в браузере. При использовании браузера вы получаете два запроса. Один для загрузки sitemap.xml и второй для получения main-sitemap.xsl, который содержит информацию для браузера о том, как отображать XML-файл.
Jsoup этого не делает. Используйте System.out.println(dom.html())
, чтобы увидеть, как выглядит документ, загруженный Jsoup.
Используйте вкладку сети в вашем браузере, чтобы увидеть, какие элементы были загружены, чтобы отобразить данные.