Как преобразовать все файлы PDF в каталоге / папке для изображения Python 3? - PullRequest
0 голосов
/ 18 июня 2019

Как преобразовать все файлы PDF в каталоге / папке в изображение Python 3? есть ли альтернатива?

во время выполнения этого кода я получаю сообщение об ошибке типа

pdf2image.exceptions.PDFPageCountError: Невозможно получить количество страниц. Предупреждение о синтаксисе: не может быть файлом PDF (все равно продолжается) Синтаксис Ошибка: не удалось найти словарь трейлера Синтаксическая ошибка: не удалось найти Синтаксическая ошибка в словаре трейлера: не удалось прочитать таблицу внешних ссылок

Не знаю, почему, пожалуйста, кто-нибудь, помогите мне

from pdf2image import convert_from_path
import glob,os
import os, subprocess

pdf_dir = r"C:\\Users\\xxx\\Desktop\\folder1\\folder2\\"
os.chdir(pdf_dir)

for pdf_file in os.listdir(pdf_dir):
    pages = convert_from_path(pdf_file, 500)
    for page in pages:
        page.save(pdf_file[:-4] +".jpg", 'JPEG')

1 Ответ

1 голос
/ 18 июня 2019

Я думаю, вы оба JPG и PDF в одном каталоге. Для перебора только файлов PDF:

from pdf2image import convert_from_path
import glob,os
import os, subprocess

pdf_dir = r"C:\\Users\\xxx\\Desktop\\folder1\\folder2\\"
os.chdir(pdf_dir)

for pdf_file in glob.glob(os.path.join(path.dir, "*.pdf")):
    pages = convert_from_path(pdf_file, 500)
    for page in pages:
        page.save(pdf_file[:-4] +".jpg", 'JPEG')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...