PDFBox для поиска слов.Код распознает только несколько слов - PullRequest
0 голосов
/ 20 декабря 2018

Код, который я разместил, состоит из 5 аргументов, которые включают местоположение PDF-документа и поисковый запрос.Код должен анализировать документ PDF и возвращать все совпадения с ключевым словом в документе и возвращать их расположения в зависимости от формата (последний заданный аргумент).

Код по какой-то причине распознает только несколько слов и ошибки в других словах.Я не уверен, почему это так.

Кажется, что нет разницы в этих словах с точки зрения шрифта, размера и т. Д.

Код можно найти по адресу Полнотекстовый поиск PDF-файл можно найтина PDF документ

...