Я хочу прочитать существующий PDF-файл и извлечь текстовую и графическую информацию.В графике в настоящее время мне просто нужны нарисованные линии.Есть много компонентов поставщика для чтения текста в формате PDF, но есть ли такие, которые также могут предоставить графическую информацию?Хотя бесплатный / открытый исходный код предпочтительнее, я тоже в порядке с коммерческими.
Требование:
Для каждой страницы в PDF:
Чтение текстовых блоков
Знакомство с координатами холста текстового блока (прямоугольник, содержащий блок).Обратите внимание, что для текста с более высоким размером шрифта размер прямоугольника изменится.
Линии - требуется сбор (x1, y1, x2, y2) для каждой строки на странице в pdf
Спасибо, - Искатель