преобразование .tif в .text с использованием tesseract - PullRequest
1 голос
/ 26 марта 2012

У меня есть PDF-файл с более чем 60+ страницами.
Я разделил каждую страницу на разные PDF-файлы, используя pyPdf.Теперь в каждом PDF-файле есть несколько таблиц данных.
Затем я преобразую эти PDF-файлы в .tif. Я хочу преобразовать эти таблицы данных из .tif в текст, используя tesseract или tesseract-ocr.Я попробовал вещи, но не сработало.

Может кто-нибудь иметь представление о том же?

...