У нас есть система, работающая следующим образом:
- Файл PDF генерируется на сервере с использованием библиотеки mPDF .
- Пользователь просматривает сгенерированный файл PDF в браузере и иногда печатает его на виртуальном принтере, который создает файл EMF.
- Анализируется файл EMF для извлечения текстовой информации.
- Извлеченная текстовая информация подвергается дальнейшей обработке.
Моя часть этого процесса заключается в извлечении текстовой информации из файла EMF.И мои алгоритмы работают нормально, когда файл EMF содержит текстовую информацию.Но когда PDF-файл печатается на виртуальном принтере, программное обеспечение для печати заменяет некоторые части текстовой информации линиями и кривыми, что делает невозможным извлечение текстовой информации из EMF.
Я много раз исследовал эту проблему и пришел к выводу, что ее нет.общее решение для каждого печатного PDF.Но в то же время я обнаружил, что программное обеспечение для печати заменяет только те части текста, которые используют встроенные шрифты OpenType.
Так что в этом конкретном случае, если бы я мог настроить mPDF так, чтобы он не использовал встроенные шрифты OpenType, тогда проблема будет решена.
Мой вопрос: возможно ли настроить mPDF таким образом, чтобы не использовать встроенные шрифты OpenType?