Как мы можем скачать HTML-страницу, используя JAVA? - PullRequest
4 голосов
/ 27 июля 2010

Как мы можем загрузить страницу HTML, используя JAVA ??

Ответы [ 3 ]

10 голосов
/ 27 июля 2010

Вот код:

public static String savePage(final String URL) throws IOException {
    String line = "", all = "";
    URL myUrl = null;
    BufferedReader in = null;
    try {
        myUrl = new URL(URL);
        in = new BufferedReader(new InputStreamReader(myUrl.openStream()));

        while ((line = in.readLine()) != null) {
            all += line;
        }
    } finally {
        if (in != null) {
            in.close();
        }
    }

    return all;
}

Теперь вы можете обрабатывать одну строку за другой в цикле while.

2 голосов
/ 27 июля 2010

Если вы можете использовать Groovy , который компилируется в байт-код Java, вы можете получить страницу следующим образом:

String text = new URL("http://google.com").text
2 голосов
/ 27 июля 2010

Если у вас есть больше требований, таких как аутентификация, вы можете использовать HttpClient

...