Поиск текста в файлах PDF - PullRequest
0 голосов
/ 11 июня 2019

Add-Type -Path "C:\Users\barm\.nuget\packages\itextsharp\5.5.10\lib\itextsharp.dll"
$source = 'C:\test'
$destination = 'C:\test2'
$keyword1 = "K0211"

$pdfs = Get-ChildItem -Path $source | Where-Object {$_.Name -like '*.pdf'} 

foreach($pdf in $pdfs) {

    Write-Host "processing -" $pdf.FullName
    $path = $pdf.FullName
    
    # prepare the pdf
    $reader = New-Object iTextSharp.text.pdf.pdfreader -ArgumentList $pdf.FullName
    }
    # for each page
    for($page = 1; $page -le $reader.NumberOfPages; $page++) {

        # set the page text
        $pageText = [iTextSharp.text.pdf.parser.PdfTextExtractor]::GetTextFromPage($reader,$page).Split([char]0x000A)

        # if the page text contains any of the keywords we're evaluating
        foreach($keyword in $keywords) {
            if($pageText -match $keyword) {
                $response = @{
                    keyword = $keyword
                    file = $pdf.FullName
                    page = $page
                }
                $results += New-Object PSObject -Property $response
            }
            }
    }
    $reader.Close()
}

Я хочу найти переменную $ keyword1 (K0211) в pdf-файле с powershell и itextsharp, и я попробовал несколько сценариев, но не могу заставить его работать.Кто-нибудь может мне помочь?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...