Как визуализировать текстовый слой в формате PDF - PullRequest
0 голосов
/ 15 мая 2019

Я ищу способ извлечь текст и положение этого текста из PDF с помощью «текстового слоя».Моя цель - показать PDF-файл с извлеченным текстом в качестве слоя и дать пользователю возможность выбрать определенные линии в качестве областей интереса.

pdftotext показывает мне только текст в строках, но без информации о положении.Я проверил TET из PDFlib, но у них нет пробной версии, и, похоже, библиотеки больше не поддерживаются.

Программа должна работать на Linux

...