Как я могу найти тег HTML с помощью pseudoElement :: before в jsoup - PullRequest
0 голосов
/ 21 марта 2020

Я буду читать ссылки img с веб-сайта с помощью jsoup. При поиске кода HTML я нахожу ссылки в элементе :: before (https://developer.mozilla.org/en-US/docs/Web/CSS/ :: before ), например

::before 
<span>
<img src="https://link.png" alt=""> 
</span>

My Java Code:

import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.select.Elements;

public class JavaApplication6 {

    public static void main(String[] args) throws IOException {

            String link = "https://www.panasonic.com/de/consumer/foto-video/lumix-kompaktkameras/dmc-lx100.html";

            Document docHauptseite = Jsoup.connect(link)
                    .userAgent("Mozilla/5.0 (Windows NT 6.1; WOW64; rv:40.0) Gecko/20100101 Firefox/40.1")
                    .referrer("http://www.google.com")
                    .followRedirects(true)
                    .get();


            Elements sImages = docHauptseite.getElementsByClass("thumb-block");
            System.out.println("sImages count = " + sImages.size());

            Elements sImagesFeatures = docHauptseite.getElementsByClass("featureslide650image");
            System.out.println("sImagesFeatures count = " + sImagesFeatures.size());



    }
}

Я не получил результатов в классе = "thumb-block". Если я посмотрю на код HTML, то увижу:

<div class="thumb-block">
::before
    <span>
        <img src="https:link" alt="DMC-LX100 Premium-Kompaktkamera Bild für Miniaturansicht 2">
    </span>
</div>

В результате jsoup я не получил тегов, которые начинаются с элемента :: before. Кто-нибудь знает, как я могу это исправить с помощью jsoup?

Большое вам спасибо

1 Ответ

0 голосов
/ 22 марта 2020

Хорошо. Я прочитал еще немного информации.

Содержимое добавляется в html -код с помощью JavaScript. Jsoup не поддерживает JavaScript. Так что это невозможно с Jsoup.

Я попробую его с другим инструментом, например, Selenium.

Спасибо.

...