Как использовать объект хранения файлов в pdfminer - PullRequest
0 голосов
/ 18 апреля 2020

ТАК У меня есть этот код в качестве параметра. Я передаю объект хранилища файлов, который я получаю из request.files

def extract_from_pdf(resume):
        with open(resume, 'rb') as fh:
        # iterate over all pages of PDF document
        for page in PDFPage.get_pages(fh, caching=True, check_extractable=True):
            resource_manager = PDFResourceManager()
            fake_file_handle = io.StringIO()
            converter = TextConverter(
                                    resource_manager,
                                    fake_file_handle,
                                    codec='utf-8',
                                laparams=LAParams()
                                )
        page_interpreter = PDFPageInterpreter(
                                resource_manager,
                                converter)
        page_interpreter.process_page(page)
        text = fake_file_handle.getvalue()
        yield text
        converter.close()
        fake_file_handle.close()
...