У меня есть этот код в Java, чтобы взять файл PDF и извлечь весь текст:
File file= new File("C:/file.pdf");
PDDocument doc= PDDocument.load(file);
PDFTextStripper s = new PDFTextStripper();
content= s.getText(doc);
System.out.println(content)
Если мы запускаем приложение с Windows, оно работает правильно и извлекает весь текст.Однако когда мы передаем приложение на сервер, который использует Linux, испанские акценты преобразуются в «странные» символы, такие как -> «carÃccter» (это должно быть «carácter»).Я попытался преобразовать строку в байты, а затем в кодировку UTF8:
byte[] b = content.getBytes(Charset.forName("UTF-8"));
String text= new String(b);
System.out.println(text);
Но это не работает, в Windows он продолжает работать хорошо, но на сервере Linux он все еще показывает неправильные испанские акценты и т.д.... Я понимаю, что если в среде Windows это работает правильно, то в среде Linux оно должно работать тоже ... Любое представление о том, что это может быть или что я могу сделать?Спасибо