Я пытаюсь прочитать HTML-код из URL-соединения.В одном случае html-файл, который я пытаюсь прочитать, содержит 5 разрывов строк перед фактическим объявлением типа документа.В этом случае читатель ввода выдает исключение для EOF.
URL pageUrl =
new URL(
"http://www.nytimes.com/2011/03/15/sports/basketball/15nbaround.html"
);
URLConnection getConn = pageUrl.openConnection();
getConn.connect();
DataInputStream dis = new DataInputStream(getConn.getInputStream());
//some read method here
Кто-нибудь сталкивался с подобной проблемой?
URL pageUrl = new URL("http://www.nytimes.com/2011/03/15/sports/basketball/15nbaround.html");
URLConnection getConn = pageUrl.openConnection();
getConn.connect();
DataInputStream dis = new DataInputStream(getConn.getInputStream());
String urlData = "";
while ((urlData = dis.readUTF()) != null)
System.out.println(urlData);
// выброшено исключение
java.io.EOFException at java.io.DataInputStream.readUnsignedShort (DataInputStream.java:323) в java.io.DataInputStream.readUTF (DataInputStream.java:572) в java.io.DataInputStream.readUTF (DataInputStream.java:547)
вв случае с буферизованным ридером, он просто отвечает нулем и не продолжает
pageUrl = new URL("http://www.nytimes.com/2011/03/15/sports/basketball/15nbaround.html");
URLConnection getConn = pageUrl.openConnection();
getConn.connect();
BufferedReader br = new BufferedReader(new InputStreamReader(getConn.getInputStream()));
String urlData = "";
while(true)
urlData = br.readLine();
System.out.println(urlData);
выводит ноль