Разделите большой PDF-файл на один PDF-файл с помощью Python - PullRequest
0 голосов
/ 12 апреля 2019

Я пытаюсь разделить большой файл PDF на страницу со страницы 5000 до 6000. Файлы PDF имеют 7000 страниц с текстом и изображениями и имеют размер 250 МБ.Код Python, который я написал, работает для файлов PDF меньшего размера.

Я получаю следующие ошибки: Первая ошибка RecursionError: maximum recursion depth exceeded.

После установки sys.setrecursionlimit(9999) я получаюследующая ошибка Process finished with exit code -1073741571 (0xC00000FD).Файл PDF был записан в мою выходную папку, но поврежден и имеет размер 0 КБ.Увеличение предела рекурсии тоже не помогает.

Что я мог сделать?Сжать файл PDF, а затем разделить?

Это мой код:

pdf_file = open(path,'rb')
    pdf_reader = PdfFileReader(pdf_file)
    pageNumbers = pdf_reader.getNumPages()

    output = PdfFileWriter()

    #this is just to test if it works for 1 page
    output.addPage(pdf_reader.getPage(5854))

    with open("output_path" + "document-output.pdf", "wb") as f:
        output.write(f)

1 Ответ

0 голосов
/ 02 мая 2019

Поделиться тем, что у меня сработало.Я использовал пакет wand, чтобы разделить этот PDF-файл на 7000 страниц. пакет с палочкой

from wand.image import Image
# Converting #page into JPG
with Image(filename="C:/Users/Name/Documents/PDFfile.pdf[5950]", resolution= 300) as img:
     img.save(filename="C:/Users/Name/Documents/temp1.jpg")
...