iTextSharp является открытым исходным кодом, но модель лицензирования изменилась после версии 4.1.6.Старая лицензия была намного менее строгой, в то время как новая требует оплаты, если вы используете ее в коммерческих целях и не хотите выпускать свой исходный код.Это может или не может повлиять на вас.
Вот самая основная версия извлечения текста с использованием версии 5.1.2.0:
//Full path to the file to read
string fileToRead = System.IO.Path.Combine(Environment.GetFolderPath(Environment.SpecialFolder.Desktop), @"file1.pdf");
//Bind a PdfReader to our file
iTextSharp.text.pdf.PdfReader reader = new iTextSharp.text.pdf.PdfReader(fileToRead);
//Extract all of the text from the first page
string allPage1Text = iTextSharp.text.pdf.parser.PdfTextExtractor.GetTextFromPage(reader, 1);
//That's it!
Console.Write(allPage1Text);