У меня есть PDF, созданный программой сканирования.Одно изображение на страницу и скрытый текст OCR.
Я хочу удалить изображения и сделать текст видимым.
Я нашел информацию, как удалить изображения (заменить другим изображением), но не нашел способа сделать невидимымТекст видимый.
Пример PDF с изображением и скрытым текстом
Я пробовал ниже метод, но он не работает:
Public Shared Sub UnhideText(ByVal strFileName As String)
Dim pdf As iTextSharp.text.pdf.PdfReader = New iTextSharp.text.pdf.PdfReader(strFileName)
Dim stp As iTextSharp.text.pdf.PdfStamper = New iTextSharp.text.pdf.PdfStamper(pdf, New IO.FileStream("e:\out.pdf", IO.FileMode.Create))
'This does not work, text remains unvisible. I guess SetTextRenderingMode applies only for new added text.
For pageNumber As Integer = 1 To pdf.NumberOfPages
Dim cb As iTextSharp.text.pdf.PdfContentByte = stp.GetOverContent(pageNumber)
cb.SetTextRenderingMode(iTextSharp.text.pdf.PdfContentByte.TEXT_RENDER_MODE_FILL)
Next
stp.Close()
End Sub