У меня есть PDF-файл с более чем 60+ страницами.
Я разделил каждую страницу на разные PDF-файлы, используя pyPdf.Теперь в каждом PDF-файле есть несколько таблиц данных.
Затем я преобразую эти PDF-файлы в .tif. Я хочу преобразовать эти таблицы данных из .tif в текст, используя tesseract или tesseract-ocr.Я попробовал вещи, но не сработало.
Может кто-нибудь иметь представление о том же?