directory = r"C:\Users\Anna\Desktop\NLP\input"
for file in os.listdir(directory):
a=open(directory+"\\"+file,'rb')
pdfReader = PyPDF2.PdfFileReader(a)
pageObj = pdfReader.getPage(0)
files=pageObj.extractText().split('\n')
files=[i.replace(".",'') for i in files]
print(files)
Как извлечь из файла pdf каждую строку в csv в виде строки?