Чтобы достичь уровня доступности PDF / A-1A, я устанавливаю метаданные XMP для PDF с использованием PDFBox v2.0.13.Перед настройкой метаданных я делаю преобразование файла из .docx в pdf.Я пробовал два способа сделать преобразование: один с использованием XDocReport v.2.0.1, а другой с использованием Docx4j v.6.1.0.
В классе Java у меня есть следующий код:
PDDocumentInformation info = pdf.getDocumentInformation();
info.setTitle("Apache PDFBox");
info.setSubject("Apache PDFBox adding meta-data to PDF document");
info.setCreator("MyCreator");
...
DublinCoreSchema dcSchema = metadata.createAndAddDublinCoreSchema();
dcSchema.setTitle(info.getTitle());
dcSchema.setDescription(info.getSubject());
dcSchema.addCreator(info.getCreator());
Производя преобразование с помощью XDocReport, я получаю следующие метаданные:
</rdf:Description>
<rdf:Description xmlns:dc="http://purl.org/dc/elements/1.1/" rdf:about="">
<dc:title>
<rdf:Alt>
<rdf:li xml:lang="x-default">Apache PDFBox</rdf:li>
</rdf:Alt>
</dc:title>
<dc:description>
<rdf:Alt>
<rdf:li xml:lang="x-default">Apache PDFBox adding meta-data to PDF document</rdf:li>
</rdf:Alt>
</dc:description>
<dc:creator>
<rdf:Seq>
<rdf:li>MyCreator</rdf:li>
</rdf:Seq>
</dc:creator>
</rdf:Description>
Вместо того, чтобы делать преобразование с помощью Docx4j, я получаю следующие метаданные:
<rdf:Description xmlns:dc="http://purl.org/dc/elements/1.1/" rdf:about="">
<dc:title>
<rdf:Alt>
<rdf:li lang="x-default">Apache PDFBox</rdf:li>
</rdf:Alt>
</dc:title>
<dc:description>
<rdf:Alt>
<rdf:li lang="x-default">Apache PDFBox adding meta-data to PDF document</rdf:li>
</rdf:Alt>
</dc:description>
<dc:creator>
<rdf:Seq>
<rdf:li>MyCreator</rdf:li>
</rdf:Seq>
</dc:creator>
</rdf:Description>
Из-за разницыиз метаданных, созданных для «title» и «description», окончательный PDF-файл, созданный с использованием результатов XDocReport PDF / A-1A, доступен, а файл, созданный с использованием Docx4j, недоступен.
Проверка доступности выполняется с помощью VeraPDF.
Поскольку Docx4j создает более читаемый PDF, есть ли способ исправить метаданные в окончательном PDF?