Как читать содержимое конкретной страницы из PDF, используя API-интерфейсы itextsharp - PullRequest
3 голосов
/ 06 августа 2010

Как читать содержимое конкретной страницы из PDF с помощью API itextsharp

Кто-нибудь может перенаправить меня в правильном направлении?

Заранее спасибо!

1 Ответ

1 голос
/ 18 октября 2011

Следующий код извлекает только текст, если это то, что вы ищете.

PdfReader pdfReader = new PdfReader(documentPath);

ITextExtractionStrategy its = new iTextSharp.text.pdf.parser.SimpleTextExtractionStrategy();

//Extract text from the page.
string txt = PdfTextExtractor.GetTextFromPage(pdfReader, page, its);

// Convert the extracted text into a readable string using the right encoding.
extractedText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(txt)));
...