pdf2htmlEX преобразует текст, но не отображается (программа не может найти файл шрифта на linux?) - PullRequest
0 голосов
/ 08 марта 2020

Я использую pdf2htmlEX для преобразования pdf в html, и вывод отображается правильно, когда он генерируется локально на ма c, но не когда он генерируется в производстве на amazon linux. Эта проблема возникает на нескольких страницах, но я буду использовать страницу 22 этого pdf в качестве конкретного примера c.

Для неправильного вывода html (сгенерированного на linux):

  1. , хотя определенный текст не отображается, когда он отображается в браузере, правильный текст находится в нижележащем html при проверке с помощью chrome dev tools
  2. , что вызвано тем, что атрибут css visibility элемента (заданный именем класса ff13) имеет значение hidden, где в правильном для преобразования установлено значение visible
  3. , и я вижу в инструментах разработчика на вкладке вычисленных стилей css для rendered fonts, что правильный шрифт DejaVu Sans и неправильный шрифт Helvetica

Я проверил и подтвердил, что DejaVuSans.ttf (и другие шрифты DejaVu) установлены на машине linux в /usr/share/fonts/dejavu/, поэтому я думаю, что по какой-то причине программа pdf2htmlEX может не находит файл шрифта при преобразовании, поэтому он помечает свойство css visibility как hidden. Я также попытался установить ядро ​​ ma c (источник здесь ) и microsoft шрифты, перезагрузить компьютер и повторить попытку, но это не помогло кажется, помогает.

Кто-нибудь знает, как это исправить или устранить неполадки отсюда? Заранее спасибо за любую помощь!

1 Ответ

0 голосов
/ 08 марта 2020

Необходимо убедиться, что файлы шрифтов для всех встроенных шрифтов PDF находятся в пути fontconfig. Вы можете увидеть список путей в конфигурационном файле fontconfig (обычно /etc/fonts/fonts.config). Посмотрите в верхней части этого файла список каталогов. Если ваш файл шрифтов отсутствует в одном из них, он не будет найден.

В вашем случае я бы переместил файлы шрифтов в / usr / share / fonts, а не в подкаталог.

...