пытается извлечь текст из изображения, тип которого 'PIL.PpmImagePlugin.PpmImageFile'
, используя pytesseract
. Код и ошибка, как показано ниже
from pdf2image import convert_from_path
pages = convert_from_path('D:/pdf_csv/HealthCare/eRDS - ML/eRDS - ML/2001468/2001468,69,70.pdf',poppler_path='C:/Users/Hp/poppler-0.68.0/bin')
text = pyt.image_to_string(Image.open(pages[0]), lang='eng')
Ошибка, которую я получаю:
AttributeError: 'PpmImageFile' object has no attribute 'read'
Или существует ли какой-либо метод для преобразования PpmImageFile в формат 'jpg' или 'png'