Чтобы использовать это решение в своих проектах, вам необходимо выполнить следующие шаги:
Добавить ссылки на itextsharp.dll и SharpZiplib.dll
Добавьте класс PDFParser.cs в свой проект
Затем вы можете использовать вновь добавленный класс следующим образом:
// create an instance of the pdfparser class
PDFParser pdfParser = new PDFParser();
// extract the text
String result = pdfParser.ExtractText(pdfFile);
Используя класс iTextSharp PdfReader для извлечения дефлированного содержимого каждой страницы, я использую простую функцию ExtractTextFromPDFBytes для извлечения текстового содержимого из дефлированной страницы.