Я использую PDFBox в Java, чтобы попытаться извлечь текст из файла PDF.Вот как я загружаю файл:
PDDocument document = PDDocument.load(new File(path1));
Как видите, он открывает файл и загружает содержимое внутри него.Это может вызвать проблему, когда, скажем, я пытался загрузить файл, содержащий 10 миллионов слов или текст, который огромен, и он выдает OutOfMemoryException:Java heap space
.
. Я действительно проверил это, и он выдает ошибку.И виновником была линия выше.Есть ли способ открыть файл, но не загружать его содержимое в PDFBox?
Я ценю любое предложение.