У меня есть несколько персонажей, которые выглядят примерно так:
Комуникационна кабелна система
и иногда у меня есть микс, подобный этому:
Généralités
Первый переводится на:
Комуникационна кабелна система
и второй:
Женские
Я вижу это с помощью браузера и помещаю их в тело.
Но как я могу заставить java выводить "настоящие" символы? Как называется вышеуказанная кодировка?
Я попробовал пару вещей, и, наконец, это (что не сработало):
import java.nio.charset.*;
import java.nio.ByteBuffer;
import java.nio.CharBuffer;
List<String> lst = new ArrayList<String>(); lst.add("К"); lst.add("о");
for ( String s : lst ) {
Charset utf8charset = Charset.forName("UTF-8");
Charset iso88591charset = Charset.forName("ISO-8859-1");
ByteBuffer inputBuffer = ByteBuffer.wrap( s.getBytes() );
// decode UTF-8
CharBuffer data = utf8charset.decode(inputBuffer);
// encode ISO-8559-1
ByteBuffer outputBuffer = iso88591charset.encode(data);
byte[] outputData = outputBuffer.array();
System.out.println ( new String(outputData) )
}