Есть ли что-то похожее на WebClient.DownloadString в Java? - PullRequest
5 голосов
/ 20 января 2010

Я хочу скачать html исходный код сайта, чтобы разобрать некоторую информацию. Как мне сделать это в Java?

Ответы [ 2 ]

8 голосов
/ 20 января 2010

Просто присоедините BufferedReader (или что-либо, что читает строки) из InputStream URL, возвращенного из openStream ().

public static void main(String[] args)
        throws IOException
{
    URL url = new URL("http://stackoverflow.com/");
    BufferedReader reader = new BufferedReader(new InputStreamReader(url.openStream()));

    String s = null;
    while ((s = reader.readLine()) != null)
        System.out.println(s);
}
0 голосов
/ 20 января 2010

Вы можете использовать классы Java напрямую:

URL url = new URL("http://www.example.com");
URLConnection conn = url.openConnection();
InputStream in = conn.getInputStream();
...

, но более рекомендуется использовать Apache HttpClient , так как HttpClient будет обрабатывать множество вещей, которые вам придется делать самостоятельнос родными классами Java.

...