JSoup Failed Scrapping URL-адрес изображения из Google Shopping - PullRequest
0 голосов
/ 17 сентября 2018

Я попытался получить URL изображения из результатов поиска Google Shopping.Мой код для получения URL изображения выглядит следующим образом:

Element image = el.getElementsByClass("TL92Hc").get(0);
System.out.println(image.attr("src"));

Я получил устаревшую версию значения src, как показано ниже:

data:image/gif;base64,R0lGODlhAQABAIAAAP///////yH5BAEKAAEALAAAAAABAAEAAAICTAEAOw==

Я знаю, что длинаURL-адрес изображения, созданного в Google Покупках, очень и очень длинный (около 12047 символов).

Есть ли что-нибудь, что может сделать Jsoup НЕ осуждающим результат?

1 Ответ

0 голосов
/ 17 сентября 2018

Он не усекается, так как заканчивается ==, как и большинство строк base64. Также это действительное изображение размером 1x1 px (оно открывается в браузере при вставке data:image/gif;base64,R0lGODlhAQABAIAAAP///////yH5BAEKAAEALAAAAAABAAEAAAICTAEAOw== в адресную строку.

Так что я предполагаю, что эта страница содержит более одного изображения с классом TL92Hc, или это изображение является только заполнителем, а реальное изображение динамически загружается с помощью JavaScript.

...