Я использую pdf2htmlEX
для преобразования pdf в html, и вывод отображается правильно, когда он генерируется локально на ма c, но не когда он генерируется в производстве на amazon linux. Эта проблема возникает на нескольких страницах, но я буду использовать страницу 22 этого pdf в качестве конкретного примера c.
Для неправильного вывода html (сгенерированного на linux):
- , хотя определенный текст не отображается, когда он отображается в браузере, правильный текст находится в нижележащем html при проверке с помощью chrome dev tools
- , что вызвано тем, что атрибут css
visibility
элемента (заданный именем класса ff13
) имеет значение hidden
, где в правильном для преобразования установлено значение visible
- , и я вижу в инструментах разработчика на вкладке вычисленных стилей css для
rendered fonts
, что правильный шрифт DejaVu Sans
и неправильный шрифт Helvetica
Я проверил и подтвердил, что DejaVuSans.ttf
(и другие шрифты DejaVu) установлены на машине linux в /usr/share/fonts/dejavu/
, поэтому я думаю, что по какой-то причине программа pdf2htmlEX
может не находит файл шрифта при преобразовании, поэтому он помечает свойство css visibility
как hidden
. Я также попытался установить ядро ma c (источник здесь ) и microsoft шрифты, перезагрузить компьютер и повторить попытку, но это не помогло кажется, помогает.
Кто-нибудь знает, как это исправить или устранить неполадки отсюда? Заранее спасибо за любую помощь!