Как вставить невидимый текст в PDF? - PullRequest
3 голосов
/ 28 февраля 2011

Я хочу вставить невидимый текст в существующий файл PDF, чтобы сделать его доступным для поиска.

Какую библиотеку следует использовать?
Буду признателен за ссылки на конкретные Методы API для использования.

Бесплатный, идеально открытый исходный код.
Большое спасибо!

(Для любопытных: я хочу автоматически распознавать входящие отсканированные документы исделать их доступными для поиска, в хранилище Alfresco)

Ответы [ 3 ]

3 голосов
/ 03 марта 2011

3 варианта.

  1. Режим рендеринга текста 3: «Без обводки, без заливки». myPdfContentByte.setTextRenderMode(PdfContentByte.TEXT_RENDER_MODE_INVISIBLE);
  2. Нарисуйте текст позади чего-либо. Вы, вероятно, получили отсканированные изображения страниц. myPdfStamper.getUnderContent(pageNum) iText позволит вам рисовать текст под сканированием.
  3. Нарисуйте текст за пределами носителя страницы или рамки обрезки. Если вы просто хотите, чтобы какая-то случайная поисковая система с PDF-файлами показала вашу страницу, это сработает, но если вы хотите, чтобы люди, просматривающие PDF-файл, увидели соответствующее поле выбора текста ... не так уж много.
1 голос
/ 01 марта 2011

Этот показывает, как создать документ PDF, содержащий текст, а этот показывает, как добавить изображение. Сначала добавьте текст, а затем добавьте изображение поверх него - текст станет «невидимым» для конечного пользователя, но останется доступным для поиска поисковыми системами. Это также может быть полезно.

0 голосов
/ 28 февраля 2011

Вам не нужно делать текст невидимым.Просто визуализируйте их в соответствующем месте, но наложите отсканированное изображение на текст.Или вы можете визуализировать текст поверх изображения и установить альфа-значение цвета обводки и кисти на ноль.

...