Сценарий: Я хочу прочитать набор данных на арабском языке с кодировкой utf-8 .Каждое слово в каждой строке разделяется пробелом.
Проблема: Когда я читаю каждую строку, вывод:
??????????????????
Вопрос: Как прочитать файл и напечатать каждую строку?для получения дополнительной информации здесь - это мой арабский набор данных, и часть моего исходного кода, который считывает данные, будет выглядеть следующим образом:
private ContextCountsImpl extractContextCounts(Map<Integer, String> phraseMap) throws IOException {
Reader reader;
reader = new InputStreamReader(new FileInputStream(inputFile), "utf-8");
BufferedReader rdr = new BufferedReader(reader);
while (rdr.ready()) {
String line = rdr.readLine();
System.out.println(line);
List<String> phrases = splitLineInPhrases(line);
//any process on this file
}
}