Windows Automati c наименование из информации в самом файле PDF - PullRequest
0 голосов
/ 13 марта 2020

Я пытаюсь найти способ переноса отсканированных PDF-файлов, которые автоматически называются такими вещами, как «397009900», в определенную строку внутри самого PDF-файла. В моем случае это имя чертежа, которое я пытаюсь извлечь из PDF, чтобы переименовать файл ie "ISO-4024-4301".

Есть ли способ автоматически переименовать файл PDF с информацией изнутри?

Большое спасибо.

1 Ответ

2 голосов
/ 13 марта 2020

Это можно сделать с помощью python.

import PyPDF2
with open('path_to_file\Test doc.pdf', 'rb') as p:
    pdfReader = PyPDF2.PdfFileReader(p)
    pageObj = pdfReader.getPage(0)
    info=pageObj.extractText()
    print(info)

. Вы можете указать номер страницы, на которую вы хотите извлечь информацию. Измените номер страницы с 0, где вы хотите извлечь.

pageObj = pdfReader.getPage(0)

Извлеченные тексты будут сохранены в переменной info, после чего вы можете выполнить любую операцию, чтобы выбрать нужный текст, который вы хотите переименовать.

import os
os.rename(r'old_file_path_and_name_with_extension',r'new_file_path_and_name_with_extension')

С помощью модуля ОС вы можете легко переименовывать файлы!

...