Я ищу способ извлечь текст и положение этого текста из PDF с помощью «текстового слоя».Моя цель - показать PDF-файл с извлеченным текстом в качестве слоя и дать пользователю возможность выбрать определенные линии в качестве областей интереса.
pdftotext показывает мне только текст в строках, но без информации о положении.Я проверил TET из PDFlib, но у них нет пробной версии, и, похоже, библиотеки больше не поддерживаются.
Программа должна работать на Linux