PDFTextStripper извлекает неверный тайский текст - PullRequest
0 голосов
/ 04 марта 2019

У меня проблема с тем, что pdfTextStripper прочитал мой pdf в неправильной кодировке (или может быть греческим символом).И я не знаю, как это установить.Любая помощь?

PDDocument my_document = PDDocument.load(pdfFile.getInputStream(), password);
PDFTextStripper pdfTextStripper = new PDFTextStripper();
pdfTextStripper.setWordSeparator("|");
pdfTextStripper.setShouldSeparateByBeads(false);
return pdfTextStripper.getText(my_document);

Заранее спасибо.

...