Могу ли я прочитать файл PDF, не загружая его на локальный компьютер с Selenium или другими библиотеками C # - PullRequest
0 голосов
/ 27 июня 2018

Я хочу читать pdf-данные в String или в объекте потока, не загружая их на локальный компьютер через какую-либо библиотеку C #. В настоящее время я работаю над проектом автоматизации, где я использую Selenium-chromewebdriver Пожалуйста, предложите библиотеку C #, из которой я могу выполнить эту задачу.

1 Ответ

0 голосов
/ 27 июня 2018

Чтобы использовать это решение в своих проектах, вам необходимо выполнить следующие шаги:

Добавить ссылки на itextsharp.dll и SharpZiplib.dll
Добавьте класс PDFParser.cs в свой проект

Затем вы можете использовать вновь добавленный класс следующим образом:

// create an instance of the pdfparser class
PDFParser pdfParser = new PDFParser();

// extract the text
String result = pdfParser.ExtractText(pdfFile);

Используя класс iTextSharp PdfReader для извлечения дефлированного содержимого каждой страницы, я использую простую функцию ExtractTextFromPDFBytes для извлечения текстового содержимого из дефлированной страницы.

...