Как искать текст в PDF и конвертировать эту страницу в изображение и обрезать его? - PullRequest
0 голосов
/ 04 июня 2019

У меня есть требование вытащить изображение из PDF, которое является графиком.Поскольку в основном графики хранятся не в виде изображений в формате PDF, а представляют собой комбинацию текстов, линий, полос, цветного фона и т. Д.

Я подумал о разработке плана выполнения работы и хочу оценить свойплан с экспертами здесь (я совершенно новичок в разборе PDF).

план:

a) Поиск по ключевому слову и получить номер страницы в PDF (например: "Текучесть кадров""из рисунка ниже),

b) Создать изображение страницы с помощью библиотеки Python pdf2image,

c) Запустить функцию обрезки Python, чтобы получить часть, которая является только частью графика.

Пример: Это ссылка на PDF-файл, открытый для скачивания.Я хочу получить график внизу страницы 7. Как показано на рисунке ниже.

enter image description here

Как это сделать?Я бы предпочел программирование на Python.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...