Я хочу прочитать PDF-файл, содержащий много текста, изображений, таблиц. Я хочу прочитать все содержимое файла по содержимому страница за страницей сверху вниз.
Например:
- Верхняя часть страницы содержит заголовок
- Затем с левой стороны содержимое и с правой стороны изображения
Итак, сначала я хочу получить заголовок, затем содержимое, а затем изображения.
Существует ли какой-либо открытый источник для чтения PDF или справочник по кодированию для .net 2.0 или выше ?
Редактировать
Привет, Konamiman, я использую iTextSharp, но не могу прочитать документ. Для пояснения, это код, который я использую в случае iTextSharp
iTextSharp.text.pdf.PdfReader documentReader = new PdfReader(@"C:\Documents and Settings\admin\My Documents\Visual Studio 2008\Projects\pdfClownPDFReader\pdfClownPDFReader\Hongkong Buffet.pdf");
//MessageBox.Show(documentReader.NumberOfPages.ToString());
PdfStamper PDFS = new PdfStamper(documentReader, m);
PdfDictionary dictonary = documentReader.GetPageN(1);
PdfObject obj = dictonary.Get(PdfName.TEXT);
Я также пробовал PDFSharp.