Как прочитать данные из PDF документа и вставить в базу данных? - PullRequest
0 голосов
/ 10 декабря 2018

Я получил PDF документ от клиента.Документ длиной 60 страниц.Мне нужно прочитать данные с середины страницы 49 до страницы 58. В ColdFusion есть тег cfpdf, который позволяет читать документы в формате PDF.Вот пример того, что у меня есть:

<cftry>
    <cfset mypdf = expandPath("./data.pdf")>
    <cfpdf action="read" source="#mypdf#" name="PDFInfo">

    <cfdump var="#PDFInfo#">

    <cfcatch type="any">
        <cfdump var="#cfcatch#">
    </cfcatch>
</cftry>

После того, как документ выгружен на экран, появляется такая информация:

Author  [empty string]
CenterWindowOnScreen    no
ChangingDocument    Allowed
Commenting  Allowed
ContentExtraction   Allowed
CopyContent     Allowed 
PageSizes   
PDFDocumentarray
1   
PDFDocument - struct
height  792
width   612
2   
PDFDocument - struct
height  792
width   612
3   
PDFDocument - struct
height  792
width   612
4   
PDFDocument - struct
height  792
width   612

Я никогда прежде не использовал cfpdf, и это что-тоНовое для меня.Я попытался выполнить поиск в Интернете, но не смог найти пример того, как я могу получить данные из PDF-документа.Есть ли хороший способ получить данные с определенных страниц в файле / документе?Также я предполагаю, что должен быть цикл, который позволит получить доступ к отдельным данным строки.Если у кого-нибудь есть хороший пример ресурса по этой проблеме, пожалуйста, дайте мне знать.Спасибо.

...