Я играю с Page.getTextContent API
от PDFjslib (pdf.js)
.
Даже это возвращает стилизацию различных предметов, но стили, возвращаемые из заголовка и без заголовка, в основном то же самое.
Тогда я понял, что getTextContent
возможно только для рендеринга текстового слоя (если вы посмотрите на фактический html, текстовый слой из pdf. js прозрачен, и это другой слой в верхней части слоя холста дисплея), как получить фактические стили текстового элемента?
Дополнительная информация: случай для пакета pdf2json
одинаков, значения TS и T для заголовка и не заголовка также одинаковы.