Определите ключи и пары значений документа PDF с помощью iText - PullRequest
0 голосов
/ 25 сентября 2018

Мне нужно прочитать документ в формате pdf и заполнить значения в таблице базы данных, ее поля имеют следующий формат:

> Service Request              ID 00562464 APAG Notes                  
> 8/18/17 Contingent           Approval by 10/2/17

Где запрос на обслуживание и примечания APA - это ключи и идентификатор 00562464 & 8 /18/17 Условное одобрение до 10/2/17 являются значениями.Когда я читаю этот PDF через метод iText PdfTextExtractor, я получаю следующие значения:

Service Request ID 00562464
APAG Notes 8/18/17 Contingent Approval by 10/2/17

Следовательно, я не могу определить ключи и значения отдельно для заполнения столбцов таблицы.Я использую библиотеку iText Java.

Ниже приведен код, который я использовал для получения вышеуказанного вывода.

 PdfReader reader = new PdfReader(path);
 String textFromPage = PdfTextExtractor.getTextFromPage(reader, 1);
 System.out.println(textFromPage);

1 Ответ

0 голосов
/ 26 сентября 2018

Мне удалось отделить ключи и PDF-файл с помощью LocationTextExtractionStrategy, поставляемой с iText, ниже приведен код

    SrPdfModel srpdfModel = new SrPdfModel();               
    PdfReader reader = new PdfReader(path);             
    Integer pages = reader.getNumberOfPages();          
    for(int i=1; i <= pages; i++){
       Rectangle mediaboxKeys=reader.getPageSize(i);
       mediaboxKeys.setRight((float) 100.00);
       RenderFilter[] filterKeys = {new RegionTextRenderFilter(mediaboxKeys)};
       FilteredTextRenderListener strategyKeys = new FilteredTextRenderListener(new LocationTextExtractionStrategy(), filterKeys);
       String[] keysFromPage = PdfTextExtractor.getTextFromPage(reader, i, strategyKeys).split("\\r?\\n");
}

Я установил границу области ключей, которая находится с левой стороны отстраница с помощью объектов Rectangle установить правильное свойство.Аналогичным образом я могу прочитать значения этих клавиш, установив левую границу.

Полезна следующая ссылка: https://developers.itextpdf.com/question/how-read-text-specific-position

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...