Изображения, извлеченные из файла PDF, являются инвертированным / негативным изображением. (C #) - PullRequest
1 голос
/ 01 февраля 2011

Привет, я работаю над преобразованием pdf в xhtml с использованием библиотеки клоуна pdf (C #). Я извлекаю содержимое pdf, изображения, которые я извлек, является перевернутым изображением. Я хочу реальные изображения, пожалуйста, любые предложения? ..

Код вставлен ниже,

using System;
using System.Collections.Generic;
using System.ComponentModel;
using System.Data;
using System.Drawing;
using System.Linq;
using System.Text;
using System.Windows.Forms;

using it.stefanochizzolini.clown.documents;
using it.stefanochizzolini.clown.files;
using it.stefanochizzolini.clown.documents.contents;
using it.stefanochizzolini.clown.documents.contents.objects;
using it.stefanochizzolini.clown.tools;
using it.stefanochizzolini.clown.documents.contents.composition;
using it.stefanochizzolini.clown.documents.contents.fonts;

using System.IO;
using it.stefanochizzolini.clown.bytes;
using it.stefanochizzolini.clown.objects;

namespace Test1

    public partial class Form1 : Form
        public int index;
        public Form1()

        private void btnBrowse_Click(object sender, EventArgs e)
            openFileDialog1.Filter = "PDF Files|*.pdf";
            txtFileName.Text = openFileDialog1.FileName;

        private void txtFileName_TextChanged(object sender, EventArgs e)
            if (txtFileName.Text.Trim().Length > 0 && txtOutputPath.Text.Trim().Length > 0)
                btnProcess.Enabled = true;
            else { btnProcess.Enabled = false; }

        private void btnProcess_Click(object sender, EventArgs e)

        private void InitiateProcess(string FileName)
            it.stefanochizzolini.clown.files.File file;
            Document document;
                // Open the PDF file!
                file = new it.stefanochizzolini.clown.files.File(FileName);

                // Get the PDF document!
                document = file.Document;

                MessageBox.Show("Sorry. Error in File");


            //Page stamper is used to draw contents on existing pages.
            PageStamper stamper = new PageStamper();

            foreach (Page page in document.Pages)
                txtOutput.Text = txtOutput.Text + Environment.NewLine + Environment.NewLine + "\nScanning page " + (page.Index + 1) + "...\n";

                stamper.Page = page;

                // Wraps the page contents into a scanner.
                Extract(new ContentScanner(page), stamper.Foreground, page );



        private void Extract(ContentScanner level, PrimitiveFilter builder, Page page)
            string ctype = string.Empty;
            if (level == null)

            while (level.MoveNext())
                ContentObject content = level.Current;

                //TextExtractor extractor = new TextExtractor();

                string aa = content.GetType().ToString();
                /*if(content is Text)
                txtOutput.Text = txtOutput.Text + aa + Environment.NewLine;
                 List<ITextString> textStrings = extractor.Extract(page)[TextExtractor.DefaultArea];
                foreach(ITextString textstring in textStrings)
                    RectangleF textstringbox=textstring.Box.Value;
                    txtOutput.Text = txtOutput.Text + "x:" + Math.Round(textstringbox.X);
                    txtOutput.Text = txtOutput.Text + "y:" + Math.Round(textstringbox.Y) + ",";
                    txtOutput.Text = txtOutput.Text + "w:" + Math.Round(textstringbox.Width) + ",";
                    txtOutput.Text = txtOutput.Text + "h:" + Math.Round(textstringbox.Height);
              txtOutput.Text=txtOutput.Text+ "]: " + textstring.Text.ToString();

                if (content is Text)
                    ContentScanner.TextWrapper text = (ContentScanner.TextWrapper)level.CurrentWrapper;
                    //ContentScanner.GraphicsState test = level.getState();
                    foreach (ContentScanner.TextStringWrapper textString in text.TextStrings)
                        RectangleF rf = (RectangleF)textString.Box;
                        /*txtOutput.Text = txtOutput.Text + Environment.NewLine + "Text [font size: " + textString.Style.FontSize + " ],[font Name: " +
                            textString.Style.Font.Name + " ]: " + textString.Text + "[position = left :" + rf.Left.ToString() + " & Top: " + rf.Top.ToString() + "X:" + rf.X.ToString() + "Y:" + rf.Y.ToString();*/

                        txtOutput.Text = txtOutput.Text + Environment.NewLine + textString.Text;



                 //else if (content is MarkedContent)
                //    //MarkedContent mc = (MarkedContent) content
                else if (content is ShowText)
                    it.stefanochizzolini.clown.documents.contents.fonts.Font font = level.State.Font;
                    txtOutput.Text = txtOutput.Text + (font.Decode(((ShowText)content).Text));


                else if (content is ContainerObject)
                    // Scan the inner level!
                    Extract(level.ChildLevel, builder, page);
                else if (content is it.stefanochizzolini.clown.documents.contents.objects.InlineImage)
                    ContentScanner.InlineImageWrapper img = (ContentScanner.InlineImageWrapper)level.CurrentWrapper;
                        txtOutputPath.Text.Trim() + System.IO.Path.DirectorySeparatorChar + "ImageExtractionSample_" + (index++) + ".jpg"

                else if (content is it.stefanochizzolini.clown.documents.contents.objects.GraphicsObject)
                    ContentScanner.GraphicsObjectWrapper objectWrapper = level.CurrentWrapper;
                    if (objectWrapper == null)

                      NOTE: Images can be represented on a page either as
                      external objects (XObject) or inline objects.
                    SizeF? imageSize = null; // Image native size.
                    /*if (objectWrapper is PdfDataObject)
                     ContentScanner.GraphicsObjectWrapper gobjectwrapper=(ContentScanner.GraphicsObjectWrapper)gobjectwrapper;
                        it.stefanochizzolini.clown.objects.PdfDataObject pdobjt=gobjectwrapper
                    //if(objectWrapper is Image)
                    //    }
                    if (objectWrapper is ContentScanner.XObjectWrapper)
                        ContentScanner.XObjectWrapper xObjectWrapper = (ContentScanner.XObjectWrapper)objectWrapper;
                        it.stefanochizzolini.clown.documents.contents.xObjects.XObject Xobject = xObjectWrapper.XObject;
                        // Is the external object an image?
                        if (Xobject is it.stefanochizzolini.clown.documents.contents.xObjects.ImageXObject)
                            txtOutput.Text = txtOutput.Text + Environment.NewLine +
                              "External Image '" + xObjectWrapper.Name + "' (" + Xobject.BaseObject + ")"; // Image key and indirect reference.

                            imageSize = Xobject.Size; // Image native size.

                            PdfDataObject dataObject = Xobject.BaseDataObject;
                            PdfDictionary header = ((PdfStream)dataObject).Header;
                            if (header.ContainsKey(PdfName.Type) && header[PdfName.Type].Equals(PdfName.XObject) && header[PdfName.Subtype].Equals(PdfName.Image))
                                if (header[PdfName.Filter].Equals(PdfName.Image)) // JPEG image.
                                    // Get the image data (keeping it encoded)!
                                 IBuffer body1 = ((PdfStream)dataObject).GetBody(false);
                                 //object h1 = PdfName.ColorSpace;

                                    // Export the image!

                                      txtOutputPath.Text + System.IO.Path.DirectorySeparatorChar + "Image_" + (index++) + ".png"


                        else if (content is it.stefanochizzolini.clown.documents.interaction.annotations.Link)
                            Dictionary<RectangleF?, List<ITextString>> textStrings = null;
                            PageAnnotations annotations = page.Annotations;
                            TextExtractor extractor = new TextExtractor();

                            if (annotations == null)
                                Console.WriteLine("No annotations here.");

                            foreach (it.stefanochizzolini.clown.documents.interaction.annotations.Annotation annotation in annotations)
                                if (annotation is it.stefanochizzolini.clown.documents.interaction.annotations.Link)

                                    if (textStrings == null)
                                    { textStrings = extractor.Extract(page); }

                                    it.stefanochizzolini.clown.documents.interaction.annotations.Link link = (it.stefanochizzolini.clown.documents.interaction.annotations.Link)annotation;
                                    RectangleF linkBox = link.Box;
                                    StringBuilder linkTextBuilder = new StringBuilder();
                                    foreach (ITextString linkTextString in extractor.Filter(textStrings, linkBox))
                                    { linkTextBuilder.Append(linkTextString.Text); }
                                    string bb = linkTextBuilder.ToString();
                                    txtOutput.Text = txtOutput.Text + "Link '" + linkTextBuilder.ToString();
                                    txtOutput.Text = txtOutput.Text + "    Position: "
                                        + "x:" + Math.Round(linkBox.X) + ","
                                        + "y:" + Math.Round(linkBox.Y) + ","
                                        + "w:" + Math.Round(linkBox.Width) + ","
                                        + "h:" + Math.Round(linkBox.Height);



                        else if (objectWrapper is ContentScanner.InlineImageWrapper)
                            txtOutput.Text = txtOutput.Text + Environment.NewLine + "Inline Image";
                            InlineImage inlineImage = ((ContentScanner.InlineImageWrapper)objectWrapper).InlineImage;
                            imageSize = inlineImage.Size; // Image native size.


                        if (imageSize.HasValue)
                            RectangleF box = objectWrapper.Box.Value; // Image position (location and size) on the page.
                            txtOutput.Text = txtOutput.Text + Environment.NewLine +
                              " on page " + (page.Index + 1) + " (" + page.BaseObject + ")"; // Page index and indirect reference.

                            txtOutput.Text = txtOutput.Text + Environment.NewLine + "  Coordinates:";
                            txtOutput.Text = txtOutput.Text + Environment.NewLine + "     x: " + Math.Round(box.X);
                            txtOutput.Text = txtOutput.Text + Environment.NewLine + "     y: " + Math.Round(box.Y);
                            txtOutput.Text = txtOutput.Text + Environment.NewLine + "     width: " + Math.Round(box.Width) + " (native: " + Math.Round(imageSize.Value.Width) + ")";
                            txtOutput.Text = txtOutput.Text + Environment.NewLine + "     height: " + Math.Round(box.Height) + " (native: " + Math.Round(imageSize.Value.Height) + ")";



        private void ExportImage(IBuffer data, string outputPath)
            FileStream outputStream;
            { outputStream = new FileStream(outputPath, FileMode.CreateNew); }
            catch (Exception e)
            { throw new Exception(outputPath + " file couldn't be created.", e); }

                BinaryWriter writer = new BinaryWriter(outputStream);
                //ImageConverter ic = new ImageConverter();
                //Image img = (Image)ic.ConvertFrom(data);

            catch (Exception e)
            { throw new Exception(outputPath + " file writing has failed.", e); }

            Console.WriteLine("Output: " + outputPath);

        private void txtOutputPath_TextChanged(object sender, EventArgs e)
            if (txtFileName.Text.Trim().Length > 0 && txtOutputPath.Text.Trim().Length > 0)
                btnProcess.Enabled = true;
            else { btnProcess.Enabled = false; }

        private void btnBrowseOutput_Click(object sender, EventArgs e)
            txtOutputPath.Text = folderBrowserDialog1.SelectedPath;


        private void btnsave_Click(object sender, EventArgs e)
                MessageBox.Show("text box is empty");
                saveFileDialog1.Filter = "Text Files (*.txt)|*.txt|RTF Files (*.rtf)|*.rtf";

                if (saveFileDialog1.ShowDialog() == DialogResult.OK)
                    StreamWriter yaz = new StreamWriter(saveFileDialog1.FileName.ToString());
                    string yasoutput = txtOutput.Text;


        private void btncancel_Click(object sender, EventArgs e)

        private void btnclear_Click(object sender, EventArgs e)
            txtFileName.Text = "";
            txtOutput.Text = "";
            txtOutputPath.Text = "";




Ответы [ 2 ]

1 голос
/ 01 февраля 2011

Вам потребуется инвертировать буфер изображения, т.е. скопировать полученный буфер изображения в новый буфер, начиная с последнего байта буфера изображения, до первого байта буфера изображения. Это должно заботиться о перевернутом изображении. Данные для каждого пикселя, принимая 24-битные значения RGB, меняют значения R и B таким образом, что RGB становится BGR. Это должно избавить от «негативного» эффекта и сохранить этот новый буфер.

0 голосов
/ 24 января 2013

Передайте ваше растровое изображение в функцию ниже ...

private byte[] BmpToBytes_Unsafe (Bitmap bmp)

        BitmapData bData = bmp.LockBits(new Rectangle(0,0,IMAGE_WIDTH,IMAGE_HEIGHT),

        int lineSize = bData.Width * 3;
        int byteCount = lineSize * bData.Height;
        byte[] bmpBytes = new byte[byteCount];
        byte[] tempLine = new byte[lineSize];
        int bmpIndex = 0;

        IntPtr scan = new IntPtr(bData.Scan0.ToInt32() + (lineSize * (bData.Height-1)));

        for (int i = 0; i < bData.Height; i++)
            Marshal.Copy(scan, tempLine, 0, lineSize);
            scan = new IntPtr(scan.ToInt32()-bData.Stride);
            tempLine.CopyTo(bmpBytes, bmpIndex);
            bmpIndex += lineSize;


        return bmpBytes;

Удачного кодирования ...:)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.