Я пытаюсь прочитать URL-адрес, а затем распечатать результат.
BufferedReader in = new BufferedReader(
new InputStreamReader(new URL("http://somesite.com/").openStream(), "UTF-8"));
String s = "";
while ((s=in.readLine())!=null) System.out.println(s);
in.close();
Он прекрасно работает большую часть времени и печатает исходный код сайта.
Однако моя проблема заключается в том, что на определенных веб-сайтах вместо исходного кода будет распечатываться тарабарщина, например символы и другие необычные символы.
Существует ли какое-либо свойство, которое варьируется от веб-сайта к веб-сайту и которое может повлиять на его чтение? Страница прекрасно загружается в Firefox, и я могу без проблем просматривать исходный код. Если Firefox может получить доступ к источнику, я тоже смогу; Я просто не уверен, почему это не работает ...
РЕДАКТИРОВАТЬ: добавлено "UTF-8" в InputStreamReader. Все странные символы теперь являются вопросительными знаками ... все еще не работают ...