У меня есть требование вытащить изображение из PDF, которое является графиком.Поскольку в основном графики хранятся не в виде изображений в формате PDF, а представляют собой комбинацию текстов, линий, полос, цветного фона и т. Д.
Я подумал о разработке плана выполнения работы и хочу оценить свойплан с экспертами здесь (я совершенно новичок в разборе PDF).
план:
a) Поиск по ключевому слову и получить номер страницы в PDF (например: "Текучесть кадров""из рисунка ниже),
b) Создать изображение страницы с помощью библиотеки Python pdf2image,
c) Запустить функцию обрезки Python, чтобы получить часть, которая является только частью графика.
Пример: Это ссылка на PDF-файл, открытый для скачивания.Я хочу получить график внизу страницы 7. Как показано на рисунке ниже.
Как это сделать?Я бы предпочел программирование на Python.