Нужна помощь в импорте данных из pdfplumber в файл .csv - PullRequest
0 голосов
/ 16 марта 2020

Я использовал pdfplumber для извлечения текста из PDF-файлов, но когда я попытался импортировать данные с помощью to_csv, я выдал ошибку #me. Нужна помощь в импорте данных в .csv

import pdfplumber
import pandas as pd
import numpy as np
import os
import re
from collections import OrderedDict

pdf = pdfplumber.open('C:/Users/Desktop/Mydata.pdf')
page = pdf.pages[1-76]
text = page.extract_text()
text
print(text)



text2 = pd.DataFrame([text])

text2.to_csv("C:\\Users\\Desktop\\MyPDFData\\converted_text.csv")

Не получить данные в импортированном файле, только что получил пустой файл

1 Ответ

0 голосов
/ 22 апреля 2020

Вам может не понадобиться pandas, чтобы сделать это. Просто сначала откройте CSV-движок:

with open(your_csv_file_name, mode='w', newline='') as export_csv:
        csv_writer = csv.writer(export_csv, escapechar=' ', quoting=csv.QUOTE_NONE)
        csv_writer.writerow(text)

Есть отличная страница для понимания экспорта CSV:

https://realpython.com/python-csv/?fireglass_rsn=true

...