Jsoup не соскочит всю HTML с веб-страницы - PullRequest
2 голосов
/ 16 февраля 2020

В настоящее время у меня есть экземпляр объекта Document. Объект Document использует метод connect JSoup для получения запроса Http. Когда я вызываю метод. html () в экземпляре do c и печатаю результат, кажется, отсутствуют теги. При сравнении моего вывода с исходным кодом в моем браузере (FireFox), кажется, отсутствуют элементы (более конкретно, например, видео на YouTube будет иметь тег div с атрибутом класса "html5 -video-container" ").

Для справки я использую следующий исходный код:

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import java.io.IOException;

public class JsoupTester {

public static void main(String[] args){

    try {
        Document doc = Jsoup.connect("https://m.youtube.com/watch?v=ycPr5-27vSI").userAgent("Mozilla/5.0 (iPhone; CPU iPhone OS 8_3 like Mac OS X) AppleWebKit/600.1.4 (KHTML, like Gecko) FxiOS/1.0 Mobile/12F69 Safari/600.1.4").get();
        System.out.println(doc.html());

    } catch(IOException e) {
        e.printStackTrace();
    }

}

}

...