Кодирование ответа (требуется tesseract (бесплатное программное обеспечение)). Я не уверен, какой из пакетов я фактически использовал для этого бита кода, некоторые пакеты существуют для других функций в том же блоке кода.
from PIL import Image
import pytesseract
import cv2
import os
import subprocess
#Strip images and put them in the relevant directory
def image_exporter(pdf_path, output_dir):
if not os.path.exists(output_dir):
os.makedirs(output_dir)
cmd = ['pdfimages', '-all', pdf_path,
'{}/prefix'.format(output_dir)]
subprocess.call(cmd)
print('Images extracted:')
print(os.listdir(output_dir))