Вероятно, проблема именно в там , где вы читаете, пишете и / или отображаете эти символы.
Если вы читаете эти символы, используя Reader
, тогда вам нужно сначала создать InputStreamReader
, используя конструктор с двумя аргументами, в котором вы можете передать правильную кодировку (таким образом, UTF-8
) как второй аргумент. Э.Г.
reader = new InputStreamReader(url.openStream(), "UTF-8");
Если вы, например, записываете эти символы в файл, вам нужно создать OutputStreamWriter
, используя конструктор с двумя аргументами, в котором вы можете передать правильную кодировку (таким образом, UTF-8
) как второй аргумент. Э.Г.
writer = new OutputStreamWriter(new FileOutputStream("/page.html"), "UTF-8");
Если вы, например, записываете все это как обычный ваниль на стандартный вывод (например, System.out.println(line)
и т. Д.), Вам необходимо убедиться, что сам стандартный вывод использует правильную кодировку (таким образом, UTF-8
). В среде IDE, например Eclipse, ее можно настроить с помощью Window > Предпочтения > General > Рабочая область > Кодировка .