Я пытаюсь преобразовать PDF-файл "January2019" в CSV-файл. Оригинальный PDF содержит только таблицы на определенных страницах, и я пытаюсь извлечь эти таблицы. Я следую инструкции по http://stanford.edu/~mgorkove/cgi-bin/rpython_tutorials/Using_Python_to_Extract_Tables_From_PDFs.php, но когда я вставил:
импорт PyPDF2
PDFfilename = "January2019.pdf"
pfr = PyPDF2.PdfFileReader (open (January2019, "rb"))
вывод отображается как ModuleNotFoundError: Нет модуля с именем 'PyPDF2' ...
PS. Я очень плохо знаком с Python и программированием. Любые советы будут с благодарностью!
Вы уже установили PyPDF2? Если нет, запустите это в своем терминале (или cmd или powershell)
conda install -c conda-forge pypdf2
см. документы в облаке Анаконда
Если вам не удается успешно установить PyPDF2, другой вариант («Запись данных таблицы в CSV с PDFTables») не требует установки этого пакета. Вы будете просто вызывать PDFTables через API, который немного проще.
То, что эта ошибка говорит вам, правильно. Вы не установили модуль PyPDF2. Сначала установите с:
pip install pypdf2
Сначала установите модуль PyPDF2 с помощью pip. Запустите эту команду в терминале / подсказке: