Как извлечь HTML-контент из WebView (в виде строки) - PullRequest
36 голосов
/ 10 марта 2011

Как получить весь контент HTML, отображаемый в данный момент в WebView?

Я нашел WebView.loadData(), но не смог найти противоположный эквивалент (например, WebView.getData ())

Обратите внимание, что меня интересует получение этих данных для веб-страниц, которые я не могу контролировать (т.е. я не могу внедрить функцию Javascript в эти страницы, чтобы она вызывала интерфейс Javascript в WebView).

Ответы [ 6 ]

33 голосов
/ 06 февраля 2013

Вы можете достичь этого через:

final Context myApp = this;

/* An instance of this class will be registered as a JavaScript interface */
class MyJavaScriptInterface
{
    @SuppressWarnings("unused")
    public void processHTML(String html)
    {
        // process the html as needed by the app
    }
}

final WebView browser = (WebView)findViewById(R.id.browser);
/* JavaScript must be enabled if you want it to work, obviously */
browser.getSettings().setJavaScriptEnabled(true);

/* Register a new JavaScript interface called HTMLOUT */
browser.addJavascriptInterface(new MyJavaScriptInterface(), "HTMLOUT");

/* WebViewClient must be set BEFORE calling loadUrl! */
browser.setWebViewClient(new WebViewClient() {
    @Override
    public void onPageFinished(WebView view, String url)
    {
        /* This call inject JavaScript into the page which just finished loading. */
        browser.loadUrl("javascript:window.HTMLOUT.processHTML('<html>'+document.getElementsByTagName('html')[0].innerHTML+'</html>');");
    }
});

/* load a web page */
browser.loadUrl("http://lexandera.com/files/jsexamples/gethtml.html");

Вы получите всю HTML-контнет в методе processHTML. и он не сделает еще один запрос на веб-страницу. так что это также более эффективный способ сделать это.

Спасибо.

17 голосов
/ 10 марта 2011

К сожалению, сделать это нелегко.

См. Как получить содержимое веб-страницы из WebView?

Вы можете просто сделать запрос HttpRequest.на ту же страницу, что и ваш WebView, и получите ответ.

11 голосов
/ 09 июня 2016
webView.evaluateJavascript("(function(){return window.document.body.outerHTML})();", 
      new ValueCallback<String>() {
          @Override
          public void onReceiveValue(String html) {

          }
      });
2 голосов
/ 09 июля 2016

Добавьте это к своему коду:

private String getUrlSource(String site) throws IOException {
    //GNU Public, from ZunoZap Web Browser
    URL url = new URL(site);
    URLConnection urlc = url.openConnection();
    BufferedReader in = new BufferedReader(new InputStreamReader(
    urlc.getInputStream(), "UTF-8"));
    String inputLine;
    StringBuilder a = new StringBuilder();
    while ((inputLine = in.readLine()) != null)
    a.append(inputLine);
    in.close();

    return a.toString();
}

, тогда давайте скажем вам, что бы получить исходный код Google:

getURLSource("http://google.com");
1 голос
/ 03 декабря 2014

Вы можете перехватить HTTP-запросы, сделанные WebView, а затем изменить HTML-код, включив в него все функции JavaScript, которые необходимы для взаимодействия со страницей HTML. Вы перехватываете HTTP-запросы через метод WebViewClient shouldInterceptRequest ().

Используя этот механизм, вы можете получить доступ к загруженной странице, загрузив ее самостоятельно, изменив ее перед передачей в WebView, и даже кэшируйте ее локально, если хотите.

0 голосов
/ 08 марта 2013

вы можете передавать данные через JavaScriptInterface из веб-просмотра .. Я сделал это.сохраните данные в статическую переменную, затем обработайте под приложением Android

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...