Я пытаюсь прочитать текст на Java, но это не очень хорошо.Вот мой код
PDFTextStripper pdfStripper = null;
PDDocument pdDoc = null;
COSDocument cosDoc = null;
File pdfFile = new File("1.pdf");
PDFParser parser = new PDFParser(new RandomAccessFile(pdfFile,"rw"));
parser.parse();
cosDoc = parser.getDocument();
pdfStripper = new PDFTextStripper();
pdDoc = new PDDocument(cosDoc);
pdfStripper.setStartPage(1);
pdfStripper.setEndPage(5);
String parsedText = pdfStripper.getText(pdDoc);
System.out.println(parsedText);
Но результат, подобный этому
Пожалуйста, подождите ...
Если это сообщение в конечном итоге не будет заменено надлежащим содержимым документа,ваше средство просмотра PDF может не отображать этот тип документа.
Чтобы обновить Adobe Reader для Windows®, Mac или Linux® до последней версии, посетите страницу http://www.adobe.com/go/reader_download.
.Для получения дополнительной помощи с Adobe Reader посетите http://www.adobe.com/go/acrreader.
Windows является зарегистрированным товарным знаком или товарным знаком корпорации Microsoft в США и / или других странах.Mac является товарным знаком Apple Inc., зарегистрированным в США и других странах.Linux является зарегистрированным товарным знаком Линуса Торвальдса в США и других странах.
Я обнаружил, что эта ошибка произошла из-за документа xfa pdf.Но я не знаю о формате xfa моего pdf-документа.Поэтому, пожалуйста, дайте мне знать, как я могу узнать о формате xfa.
Кто-нибудь, помогите мне, пожалуйста.Спасибо!