Java простой запрос GET возвращает полный SPA вместо XML - PullRequest
0 голосов
/ 24 октября 2019

Я хочу сделать простой парсер REST.

У меня проблема с получением информации от https://www.tumblr.com. Я хочу получить файл XML с полной историей сообщений пользователя, которую можно получить с помощью https://[user -name] .tumblr. ком / апи / чтения .

Проблема в том, что я получаю HTML-файл с (возможно) формой принятия файлов cookie (полный SPA) вместо XML, который можно отобразить в браузере.

Код, который я использую для этой задачи:

          final String uri = "https://gandalf-57.tumblr.com/api/read";
          URL url = new URL(uri);
          HttpURLConnection conn = (HttpURLConnection) url.openConnection();

          conn.setDoOutput(true);
          conn.setRequestMethod("GET");
          conn.setRequestProperty("Accept", "application/xml;");
          conn.setUseCaches(false);
          conn.setAllowUserInteraction(false);

          InputStreamReader in = new InputStreamReader(conn.getInputStream());
          BufferedReader br = new BufferedReader(in);
          String output;
          while ((output = br.readLine()) != null) {
              System.out.println(output);
          }
          in.close();
          conn.disconnect();

РЕДАКТИРОВАТЬ:

HTML-файл, который я получаю, является телом этого сайта: https://www.tumblr.com/privacy/consent?redirect=https%3A%2F%2Fgandalf-57.tumblr.com%2Fapi%2Fread

...