В последнее время я поигрался с библиотекой Java Jsoup, пытаясь лучше понять работу с веб-страницами (получение данных с веб-сайта). Но может показаться, что в коде мне удалось собрать воедино только часть функций. Это проблема с моим кодом, или возможно, что на некоторых сайтах есть меры по прекращению использования веб-страниц?
Вот класс, который делает всю «магию»:
import java.io.IOException;
import org.jsoup.*;
import org.jsoup.nodes.Document;
public class HTMLParser {
private Document d;
private String url;
private String content;
public HTMLParser(String url){
this.url = url;
connect();
parse();
display();
}
private void connect(){
try{
d = Jsoup.connect(url).get();
}catch(IOException e){}
}
private void parse(){
content = d.body().text();
}
private void display(){
System.out.println(content);
}
}