Как добавить в CSV-файл каждую строку PDF-файла - PullRequest
0 голосов
/ 19 сентября 2019
directory = r"C:\Users\Anna\Desktop\NLP\input"
for file in os.listdir(directory):
    a=open(directory+"\\"+file,'rb')
    pdfReader = PyPDF2.PdfFileReader(a)
    pageObj = pdfReader.getPage(0)
    files=pageObj.extractText().split('\n')
    files=[i.replace(".",'') for i in files]
    print(files)

Как извлечь из файла pdf каждую строку в csv в виде строки?

...