Использование библиотеки PyPDF подразумевает использование OCR - PullRequest
0 голосов
/ 21 апреля 2020

Я хотел бы знать, требует ли библиотека PyPDF использования механизма распознавания даже с теми файлами PDF, которые представляют собой текст, который можно скопировать и выбрать, или же он анализирует этот текст с другим типом обработчика и запрашивает только распознавание текста для этих файлов? PDF-файлы, которые в основном являются изображениями.

...