Я хочу читать содержимое файла PDF по содержимому - PullRequest
0 голосов
/ 17 ноября 2009

Я хочу прочитать PDF-файл, содержащий много текста, изображений, таблиц. Я хочу прочитать все содержимое файла по содержимому страница за страницей сверху вниз.

Например:

  • Верхняя часть страницы содержит заголовок
  • Затем с левой стороны содержимое и с правой стороны изображения

Итак, сначала я хочу получить заголовок, затем содержимое, а затем изображения.

Существует ли какой-либо открытый источник для чтения PDF или справочник по кодированию для .net 2.0 или выше ?

Редактировать

Привет, Konamiman, я использую iTextSharp, но не могу прочитать документ. Для пояснения, это код, который я использую в случае iTextSharp

iTextSharp.text.pdf.PdfReader documentReader = new PdfReader(@"C:\Documents and Settings\admin\My Documents\Visual Studio 2008\Projects\pdfClownPDFReader\pdfClownPDFReader\Hongkong Buffet.pdf");
            //MessageBox.Show(documentReader.NumberOfPages.ToString());
            PdfStamper PDFS = new PdfStamper(documentReader, m);
            PdfDictionary dictonary = documentReader.GetPageN(1);
            PdfObject obj = dictonary.Get(PdfName.TEXT);

Я также пробовал PDFSharp.

1 Ответ

1 голос
/ 17 ноября 2009

Например, iTextSharp .

...