Исключите "URL без изображения" с помощью jsoup java - PullRequest
0 голосов
/ 29 мая 2020

У меня есть следующий код, который отлично работает, чтобы получить URL-адрес изображения с веб-страницы, а затем загрузить его. Но где-то изображение не найдено и хранит фиктивный png. Я хочу, чтобы, если "Нет изображения", он не должен загружать изображение и пропускать его.

        Document document = Jsoup.connect(webpageURL).userAgent("Mozilla/17.0").get();
        Elements elements = document.select("div.img-container.ratio-11-10");

        for (Element e : elements) {
            Element imageElement = e.getElementsByTag("img").first();

            String imageURL = imageElement.attr("abs:src");
            InputStream inputStream = new URL(imageURL).openStream();

            Files.copy(inputStream, Paths.get("src/main/resources/" + ID + ".jpg"));
         }

Пример HTML кода, из которого я извлекаю imageURL

img src = "https://www.bbcgoodfood.com/sites/default/files/styles/recipe/public/sites/all/themes/bbcw_goodfood/images/dummy-content/member-recipe-icon.png" alt = "Изображение отсутствует" title = "Изображение недоступно">

Как я могу изменить свой код, чтобы он пропускал, если существует сообщение «Нет изображения»? спасибо

1 Ответ

1 голос
/ 29 мая 2020

После получения imageElement проверьте значение атрибута и перейдите к следующему элементу:

if(imageElement.attr("alt").equals("No image available")){
    continue;
}
...