Я немного заблокирован здесь. Меня попросили поместить файлы PDF в файл CSV с помощью Python. Я искал в интернете и нашел это руководство по этому адресу:
https://www.blog.pythonlibrary.org/2018/05/03/exporting-data-from-pdfs-with-python/
Там написан код, объясняющий, как импортировать PDF в CSV, я поместил строки здесь:
import csv
import os
from miner_text_generator import extract_text_by_page
def export_as_csv(pdf_path, csv_path):
filename = os.path.splitext(os.path.basename(pdf_path))[0]
counter = 1
with open(csv_path, 'w') as csv_file:
writer = csv.writer(csv_file)
for page in extract_text_by_page(pdf_path):
text = page[0:100]
words = text.split()
writer.writerow(words)
if __name__ == '__main__':
pdf_path = 'w9.pdf'
csv_path = 'w9.csv'
export_as_csv(pdf_path, csv_path)
Моя проблема сейчас в том, что когда я запускаю его, он говорит мне, что модуль "miner_text_generator" не найден. Я пытался установить его с помощью pip, но он тоже не работает.
Я работаю над Python 3.7
У вас, ребята, есть идеи, как это исправить? Или есть другой способ сделать это? Я не могу использовать API-скрипт или веб-скрипт, он должен оставаться на моем компьютере.
Спасибо за вашу помощь!