Поиск нескольких PDF-файлов в каталоге для строки в C #, используя itext7 - PullRequest
0 голосов
/ 31 октября 2018

Я пытаюсь найти текст в каждом PDF-файле внутри каталога, используя itext7. Я могу понять, как искать только один PDF.

Мне удалось найти один PDF-файл, используя приведенный ниже код. Как я могу сделать это для каждого PDF-файла в каталоге?

   public List<int> ReadPdfFile(string fileName, String searchString)
        {
            List<int> pages = new List<int>();
            if (File.Exists(fileName))
            {
                PdfReader pdfReader = new PdfReader(fileName);
                for (int page = 1; page <= pdfReader.NumberOfPages; page++)
                {
                    ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();

                    string currentPageText = PdfTextExtractor.GetTextFromPage(pdfReader, page, strategy);
                    if (currentPageText.Contains(searchString))
                    {
                        MessageBox.Show("Found COLLIN GRADY");
                    }
                    else
                    {
                        MessageBox.Show("Could not find COLLIN GRADY");
                    }

                }
                pdfReader.Close();
            }
            return pages;
        }

Это работает, позвонив

 ReadPdfFile("C:\\Users\\Billy\\Desktop\\All custom flyers\\ALBANY Ketchup Nov 2018 2.pdf", "COLLIN GRADY");
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...