В настоящее время мы работаем с некоторыми издателями, чтобы создавать онлайн-книги из своих PDF-файлов. Наше устаревшее приложение использует flex, поэтому для этого мы конвертируем PDF в SWF-файлы, используя PDF2SWF на SWFTools .
Проблема, с которой мы сталкиваемся, заключается в том, что наш Flex-ридер не выделяет текст в документе SWF, когда пользователь выполняет поиск. После быстрого исследования мы обнаружили, что при извлечении текста нам нужно встраивать шрифты, которые используются в документе PDF:
http://wiki.swftools.org/wiki/How_do_I_highlight_text_in_the_SWF%3F
pdf2swf -F $YOUR_FONTS_DIR$ -f input.pdf -o output.swf
Как видно из приведенного выше кода, нам нужен путь к каталогу шрифтов, содержащему шрифты, найденные в этом PDF.
Поскольку мы будем конвертировать большое количество PDF-файлов, возможно ли получить доступ к файлам шрифтов непосредственно через PDF-файл, а не хранить много шрифтов в нашем приложении?
Дополнительная информация
Наше приложение написано на Java.
В настоящее время в приложении мы используем PDFBox и Ghostscript, поэтому, если какие-либо решения используют эти библиотеки, это предпочтительный вариант, но мы открыты для любых идей.