Причина ошибки: попытка прочитать файл в режиме записи Решение:
for i in range(min(3,inputpdf.numPages)):
output = PdfFileWriter()
output.addPage(inputpdf.getPage(i))
new_fi = fi[:-4]+'_page_%s.pdf' % i
with open(new_fi, 'wb') as outputStream:
output.write(outputStream)
pdf_check = open(new_fi, 'rb')
print('opened PDF')
read_pdf = PdfFileReader(pdf_check)
print('loaded PDF')
page_content = read_pdf.getPage(0).extractText()
print(page_content.encode('utf-8'))
Используя
with open(new_fi, 'wb') as outputStream
, вы создаете указатель файла в режиме записи. По умолчанию файл закрывается только в конце этого блока. Следовательно, при попытке чтения read_pdf выдает ошибку, поскольку файл не был закрыт перед его повторным открытием для чтения.