вернуть все HTML HTML-страницы - PullRequest
0 голосов
/ 06 января 2010

Мне нужен весь HTML для данного объекта HtmlPage.

Какое свойство я должен использовать?

Ответы [ 2 ]

3 голосов
/ 06 января 2010

В HtmlUnit HtmlPage реализует интерфейс Page; это означает, что вы можете использовать Page#getWebResponse(), чтобы получить весь веб-ответ, возвращенный для генерации HtmlPage, и оттуда это легко (WebResponse#getContentAsString()). Вот метод, который делает то, что вы хотите ...

public String getRawPageText(WebClient client, String url)
        throws FailingHttpStatusCodeException, MalformedURLException, IOException {
    HtmlPage page = client.getPage(url);
    return page.getWebResponse().getContentAsString();
}

Или, используя HtmlPage объект, который вы уже выбрали:

public String getRawPageText(HtmlPage page) {
    return page.getWebResponse().getContentAsString();
}
1 голос
/ 06 января 2010

Самый быстрый способ сделать это - HtmlPage.asXml - он может быть не идеальным, так как он может не совсем соответствовать тому, что вы увидели бы, если бы вы делали «Просмотр источника» в обычном браузере , но я обнаружил, что это очень полезно для разработки и отладки кода HtmlUnit.

...