Я пытаюсь прочитать и обработать некоторый контент на разных языках, я пытаюсь создать строковый объект с кодировкой UTF-8, чтобы убедиться, что все символы обработаны правильно. Но некоторые символы не обрабатываются Java должным образом. Как правильно сделать процесс.
String content = "Εισιτήρια";
System.out.println(new String(content.getBytes(), "UTF-8"));
Выход:
Εισιτή? Ια