Я столкнулся с двумя специальными символами, которые, похоже, не охватываются набором символов ISO-8859-1
, т. Е. Они не попадают в мою программу.
Немец ß
и норвежский ø
Я читаю файлы следующим образом:
FileInputStream inputFile = new FileInputStream(corpus[i]);
InputStreamReader ir = new InputStreamReader(inputFile, "ISO-8859-1") ;
Могу ли я прочитать эти символы, не применяя ручную замену в качестве обходного пути?
[EDIT]
вот так это выглядит на экране. Обратите внимание, что у меня нет проблем с другими акцентами, например и много ...