Python принимать pdf без использования пакетов, требующих установки pip - PullRequest
1 голос
/ 10 апреля 2020

Я надеюсь извлечь текст из PDF-файлов в блокноте Jupyter. К сожалению, на моем рабочем месте мы не можем установить пакеты python с помощью pip install или conda install. Это включает в себя большинство популярных pdf-to-text пакетов, на которые я видел ссылки онлайн: pypdf2, pdfminer, textract, pdftotext, tika, slate, pdfquery, xpdf, tabula и др. c.

Мне интересно, есть ли какой-нибудь другой способ вставить файл pdf в блокнот Jupyter с одним из пакетов, автоматически включаемых в Anaconda, если не считать преобразования pdf в текстовый файл перед приемом внутрь?

...