Невозможно разобрать HTML с помощью JSoup - PullRequest
0 голосов
/ 03 ноября 2019

Я хочу получить данные HTML с веб-сайта, чтобы загрузить видео 480p. Но это не работает. Я использую Async Class для этой цели. Вот мой метод doInBackground:

@Override
        protected Void doInBackground(Void... voids) {
            try {
              //  DOWNLOAD_URL="http://topvideodownloader.com/?url=https%3A%2F%2Fwww.dailymotion.com%2Fvideo%2Fx7nctdj"
                Log.i("DownloadActivity", DOWNLOAD_URL);
                Connection.Response response = Jsoup.connect(DOWNLOAD_URL)
                        .ignoreContentType(true)
                        .userAgent("Mozilla/5.0 (Windows NT 6.1; WOW64; rv:64.0) Gecko/20100101 Firefox/64.0")
                        .referrer("http://www.google.com")
                        .timeout(12000)
                        .followRedirects(true)
                        .execute();
                Document doc = response.parse();
                Log.i("DownloadActivity",doc.toString());
//                title = doc.select("div.title").text();
//                Log.e("Main", title);
//                String atag= doc.select("a.vd-down btn btn-default btn-download").attr("href");
//                matag = atag;
//                Log.e("Main", matag);
            } catch (Exception e) {
                e.printStackTrace();
            }
            return null;
        }

Но метод извлекает полный HTML. Он выбирает только первые несколько строк. Я также пытался получить с

Document doc = Jsoup.connect(DOWNLOAD_URL).userAgent("Mozilla/5.0 (Windows; U; WindowsNT 5.1; en-US; rv1.8.1.6) Gecko/20070725 Firefox/2.0.0.6").get();

Но с помощью этого метода. Он не принес ни одной строки.

Я не знаю, что я делаю не так ?? Пожалуйста, помогите мне. очень ценится

1 Ответ

0 голосов
/ 03 ноября 2019

попробуйте

class TestAsync extends AsyncTask<Void, Integer, String> {
    String TAG = getClass().getSimpleName();

    protected void onPreExecute() {
        super.onPreExecute();
        //show progress bar
    }

    protected String doInBackground(Void...arg0) {
          try {
              //  DOWNLOAD_URL="http://topvideodownloader.com/?url=https%3A%2F%2Fwww.dailymotion.com%2Fvideo%2Fx7nctdj"
                 Document doc = Jsoup.connect(DOWN_URL)
                .header("Accept-Encoding", "gzip, deflate")
                .userAgent("Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20100101 Firefox/23.0")
                .maxBodySize(0)
                .timeout(0)
                .get();

                Log.i("DownloadActivity",doc.toString());
//                title = doc.select("div.title").text();
//                Log.e("Main", title);
//                String atag= doc.select("a.vd-down btn btn-default btn-download").attr("href");
//                matag = atag;
//                Log.e("Main", matag);
            } catch (Exception e) {
                e.printStackTrace();
            }
            return "success";

    }

    protected void onPostExecute(String result) {
        super.onPostExecute(result);
        if(result.equals("success"))
         //stop progress bar
    }
}
...