Как получить координаты символов / слов / строк / блоков - PullRequest
0 голосов
/ 06 мая 2018

Я делаю pdftotext -bbox file.pdf, и это производит вывод на уровне слов. Есть ли способ вывести координаты на уровне символа / фразы / строки / блока?

Мне интересно знать, может ли это сделать poppler или xpdf-версия pdftotext.

1 Ответ

0 голосов
/ 29 ноября 2018

Конечно, просто используйте pdftotext -bbox-layout, и это даст вам необходимую структуру.

...