У меня есть отсканированный PDF, в котором есть некоторые случайные данные в табличном формате, и я хочу скопировать их в лист Excel.
Я поиграл с цифровыми PDF-файлами и использую «tabula» для извлечения таблиц, но отсканированные PDF-файлы требуют OCR (что я видел в Google).Я знаю, что здесь задействовано OCR (тессеракт), но не знаю, какой подход я должен использовать для решения проблемы.