Преобразование PDF в CSV с использованием Python 3.7 Anaconda - PullRequest
0 голосов
/ 13 марта 2019

Я пытаюсь преобразовать PDF-файл "January2019" в CSV-файл. Оригинальный PDF содержит только таблицы на определенных страницах, и я пытаюсь извлечь эти таблицы. Я следую инструкции по http://stanford.edu/~mgorkove/cgi-bin/rpython_tutorials/Using_Python_to_Extract_Tables_From_PDFs.php, но когда я вставил:

импорт PyPDF2

PDFfilename = "January2019.pdf"

pfr = PyPDF2.PdfFileReader (open (January2019, "rb"))

вывод отображается как ModuleNotFoundError: Нет модуля с именем 'PyPDF2' ...

PS. Я очень плохо знаком с Python и программированием. Любые советы будут с благодарностью!

Ответы [ 4 ]

1 голос
/ 13 марта 2019

Вы уже установили PyPDF2? Если нет, запустите это в своем терминале (или cmd или powershell)

conda install -c conda-forge pypdf2

см. документы в облаке Анаконда

0 голосов
/ 14 марта 2019

Если вам не удается успешно установить PyPDF2, другой вариант («Запись данных таблицы в CSV с PDFTables») не требует установки этого пакета. Вы будете просто вызывать PDFTables через API, который немного проще.

0 голосов
/ 13 марта 2019

То, что эта ошибка говорит вам, правильно. Вы не установили модуль PyPDF2. Сначала установите с:

pip install pypdf2

0 голосов
/ 13 марта 2019

Сначала установите модуль PyPDF2 с помощью pip. Запустите эту команду в терминале / подсказке:

pip install pypdf2
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...