Может ли iTextSharp конвертировать PDF документ в PDF / A - PullRequest
4 голосов
/ 03 марта 2010

Я не могу найти в FAQ, существует ли эта функция в API, хотя она упоминается в книге как нечто, что потенциально доступно. У кого-нибудь был опыт реализации этой функции?

Ответы [ 2 ]

7 голосов
/ 23 апреля 2010

Вкл. В этой теме (от июня 2007 г.) Паулу Соареш предоставляет код, который показывает поддержку PDF / A. Вот код C # (у него также есть пример Java):

private void PdfATest() {
    Document doc = new Document(PageSize.A4);
    PdfWriter writer = PdfWriter.GetInstance(doc, new FileStream("C:\\hello_A1-b_cs.pdf", FileMode.Create));
    writer.PDFXConformance = PdfWriter.PDFA1B;

    PdfDictionary outi = new PdfDictionary(PdfName.OUTPUTINTENT);
    outi.Put(PdfName.OUTPUTCONDITIONIDENTIFIER, new PdfString("sRGB IEC61966-2.1"));
    outi.Put(PdfName.INFO, new PdfString("sRGB IEC61966-2.1"));
    outi.Put(PdfName.S, PdfName.GTS_PDFA1);

    // get this file here: http://old.nabble.com/attachment/10971467/0/srgb.profile
    ICC_Profile icc = ICC_Profile.GetInstance("c:\\srgb.profile");
    PdfICCBased ib = new PdfICCBased(icc);
    outi.Put(PdfName.DESTOUTPUTPROFILE, writer.AddToBody(ib).IndirectReference);

    writer.ExtraCatalog.Put(PdfName.OUTPUTINTENTS, new PdfArray(outi));

    BaseFont bf = BaseFont.CreateFont("c:\\windows\\fonts\\arial.ttf", BaseFont.WINANSI, true);
    Font f = new iTextSharp.text.Font(bf, 12);
    doc.Add(new Paragraph("hello", f));



Ссылка выше включает загрузку для файла ICC_Profile.

5 голосов
/ 22 июня 2010

Вот мой метод парсинга HTML-файла и создания из него архивного документа PDF / A, также с помощью встраивания шрифтов с использованием таблицы стилей (чтобы избежать ошибки: «Все шрифты должны быть встроены. т: Helvetica ")

Надеюсь, это кому-нибудь поможет ...

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using iTextSharp.text.pdf;
using iTextSharp.text;
using System.IO;
using iTextSharp.text.html.simpleparser;

namespace SaveAsPDF
    class HtmlPdfConverter
        public void RendererWebForm2PDFArchive(string fileName)
            Console.WriteLine("Parsing HTML " + fileName);
            Document document = new Document(PageSize.A4);

                // we create a writer that listens to the document and directs a XML-stream to a file
                PdfWriter writer = PdfWriter.GetInstance(document, new FileStream(fileName + ".pdf", FileMode.Create));

                //set document as arhive
                writer.PDFXConformance = PdfWriter.PDFA1A;

                //apply stylesheet to change font (and embedd it)
                StyleSheet styles = new StyleSheet();
                styles.LoadTagStyle("body", "face", "Verdana");

                //prepare html
                StreamReader sr = new StreamReader(fileName, Encoding.Default);
                string html = sr.ReadToEnd();                                
                html = RemoveTag(html, "<title>", "</title>");                

                //convert string to stream
                byte[] byteArray = Encoding.UTF8.GetBytes(html);
                MemoryStream ms = new MemoryStream(byteArray);

                //parse html
                HTMLWorker htmlWorker = new HTMLWorker(document);
                System.Collections.Generic.List<IElement> elements;

                elements = HTMLWorker.ParseToList(new StreamReader(ms), styles);
                foreach (IElement item in elements)

            catch (Exception e)
        }**strong text**