получить контент с сайта в формате utf8 - PullRequest
1 голос
/ 06 апреля 2010

я хочу как получить контент с сайтов в формате utf8 ,,

я написал следующий код:

try {
        String webnames = "http://pathivu.com";

        URL url = new URL(webnames);

        URLConnection urlc = url.openConnection();

        //BufferedInputStream buffer = new BufferedInputStream(urlc.getInputStream());
        BufferedReader buffer = new BufferedReader(new InputStreamReader(urlc.getInputStream(), "UTF8"));

        StringBuilder builder = new StringBuilder();

        int byteRead;

        while ((byteRead = buffer.read()) != -1)
            builder.append((char) byteRead);

        buffer.close();

        String text=builder.toString();

        System.out.println(text);
    } 
catch (IOException e) 
{
    e.printStackTrace();

}

но я не могу получить правильный формат ...

спасибо и заранее ..

Ответы [ 2 ]

3 голосов
/ 06 апреля 2010

Проблема может заключаться в том, что ваша консоль или System.out не имеют UTF-8.

  • Попробуйте записать это в файл вместо
  • Установить поток консоли через System.setOut(..)

Возможно, вам придется использовать -Dfile.encoding=utf-8 или OutputStreamWriter

1 голос
/ 06 апреля 2010

Ваш код выглядит нормально .. проблема здесь будет в том, что на сервере данные не будут в формате UTF-8 ..

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...