Извлечение изображений из файла PDF не работает должным образом с библиотекой iText7. Если кто-то работал над этим раньше, пожалуйста, дайте мне предложения. На самом деле мое изображение содержит текст, который я хочу извлечь после извлечения из PDF.
public static void ExtractImageFromPDFAsByeArray(string filePath)
{
if (!string.IsNullOrEmpty(filePath) && !string.IsNullOrWhiteSpace(filePath))
{
if (System.IO.File.Exists(filePath))
{
PdfReader pdfReader = new PdfReader(filePath);
PdfDocument pdfDoc = new PdfDocument(pdfReader);
for (int pdfObj = 1; pdfObj <= pdfDoc.GetNumberOfPdfObjects(); pdfObj++)
{
var pdfSourceObj = pdfDoc.GetPdfObject(pdfObj);
if (pdfSourceObj != null && pdfSourceObj.IsStream())
{
try
{
PdfStream pdfStream = (PdfStream)pdfSourceObj;
PdfObject type = pdfStream.Get(PdfName.Subtype);
// here we are getting null values for type.
if (type != null &&
type.ToString().Equals(PdfName.Image.ToString()))
{
PdfImageXObject pio = new
PdfImageXObject(pdfStream);
pdfContentArray = pio.GetImageBytes();
//return pdfContentArray;
}
}
catch (Exception exe)
{
Console.WriteLine(exe.Message);
}
}
}
pdfDoc.Close();
pdfReader.Close();
}
}
}