Перенаправить вывод функции, которая конвертирует pdf в txt файлы в новую папку в python 3 - PullRequest
0 голосов
/ 06 июня 2019

Мой код использует pdfminer для преобразования pdf в текст. Я хочу получить вывод этих файлов в новую папку. В настоящее время он приходит в существующую папку, из которой он выполняет преобразование в .txt с помощью pdfminer. Как перенаправить вывод в другую папку. Я хочу вывод в папку с именем "D: \ extract_text" Код до сих пор:

from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.converter import TextConverter
from pdfminer.layout import LAParams
from pdfminer.pdfpage import PDFPage
from io import StringIO
import glob
import os

def convert(fname, pages=None):
   if not pages:
       pagenums = set()
   else:
       pagenums = set(pages)

   output = StringIO()
   manager = PDFResourceManager()
   converter = TextConverter(manager, output, laparams=LAParams())
   interpreter = PDFPageInterpreter(manager, converter)

   infile = open(fname, 'rb')
   for page in PDFPage.get_pages(infile, pagenums):
       interpreter.process_page(page)
   infile.close()
   converter.close()
   text = output.getvalue()   
   output.close


   outfile = os.path.splitext(os.path.abspath(fname))[0] + '.txt'
   print(outfile)
   with open(outfile, 'w', encoding = 'utf-8') as pdf_file:
       pdf_file.write(text)

   return text    




directory = glob.glob(r'D:\files\*.pdf')  

for myfiles in directory:  
     convert(myfiles)
...