Как очистить текст от .pdf артефактов? - PullRequest
0 голосов
/ 24 января 2020

Я заменяю заполнители в файле .pdf, как упоминалось в itext7, и делаю c

 PdfDocument pdfDoc = new PdfDocument(new PdfReader(SRC), new PdfWriter(dest));
    PdfPage page = pdfDoc.getFirstPage();
    PdfDictionary dict = page.getPdfObject();

    PdfObject object = dict.get(PdfName.Contents);
    if (object instanceof PdfStream) {
        PdfStream stream = (PdfStream) object;
        byte[] data = stream.getBytes();
        String replacedData = new String(data).replace("{#Address_line1}", "Saint-Petersburg");
        stream.setData(replacedData.getBytes(StandardCharsets.UTF_8));
    }

    pdfDoc.close()

Мой файл .pdf немного сложнее, поэтому мой заполнитель {#Address_line1} выглядит как ({#)4(Add)-4(ress)-17(_)6(L)-6(i)3(n)-8(e1)4(})

Существуют ли какие-либо инструменты для очистки моего заполнителя, чтобы ({#)4(Add)-4(ress)-17(_)6(L)-6(i)3(n)-8(e1)4(}) превратился в {#Address_line1}? Я могу написать сам, но, возможно, есть готовые решения

1 Ответ

0 голосов
/ 18 февраля 2020

Нет, нужно реализовать собственное решение.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...