Удаление текста с помощью pdfSweep - подстановочный знак? - PullRequest
1 голос
/ 24 мая 2019

с использованием pdfSweep для редактирования текста - работает хорошо, когда я точно знаю, какую «строку» я хочу удалить, например, ID: 12AAFF113, но я не всегда буду знать число, появляющееся после ID:, так как я могу удалить ID и x количество символов после этого -

разрешает ли подстановочный знак или подобное?

Dim input As String = "G:/tmp/redact/input.pdf"
Dim output As String = "G:/tmp/redact/output.pdf"
Dim strategy As New CompositeCleanupStrategy()
strategy.Add(New RegexBasedCleanupStrategy("ID: 12AAFF113"))

Dim pdf As New PdfDocument(New PdfReader(input), New PdfWriter(output))
Dim autoSweep As New PdfAutoSweep(strategy)
autoSweep.CleanUp(pdf)
pdf.Close()

1 Ответ

1 голос
/ 24 мая 2019

Yoy можно использовать PdfAutoSweep и RegexBasedCleanupStrategy.

Например, в следующем фрагменте показано, как удалить все появления строки (D|d)olor regex.

    CompositeCleanupStrategy strategy = new CompositeCleanupStrategy();
    strategy.add(new RegexBasedCleanupStrategy("(D|d)olor").setRedactionColor(ColorConstants.GREEN));

    PdfDocument pdf = new PdfDocument(new PdfReader(input), new PdfWriter(output));

    // sweep
    PdfAutoSweep autoSweep = new PdfAutoSweep(strategy);
    autoSweep.cleanUp(pdf);

    pdf.close();

Регулярное выражение в вашем случае должно быть "id: \ s (\ w) {7}" или summat.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...