pdftotext получить информацию о шрифте (семейство шрифтов, стиль, размер) - PullRequest
0 голосов
/ 06 мая 2018

Я использую "pdftotext -bbox file.pdf" для преобразования файла pdf в HTML.

Вот пример строки из вывода:

<word xMin="351.852025" yMin="42.548936" xMax="365.689478"
yMax="47.681498">foo</word>

Есть ли способ получить информацию о шрифте для каждого слова, например:

  • семейство шрифтов, например Verdana
  • стиль, т.е. нет, жирный, курсив
  • размер, например размер шрифта 9

Мне интересно знать, может ли это сделать poppler или xpdf-версия pdftotext.

...