Python библиотека, которая помогает скрыть данные в файле PDF - PullRequest
0 голосов
/ 28 апреля 2020

Я работаю над проектом, в котором мне нужно скрыть данные внутри pdf-файла.
Хотя один из способов сделать это - обновить метаданные pdf, а затем извлекать из них метаданные всякий раз, когда это необходимо. Но в моем проекте я должен навсегда удалить метаданные после того, как их использование закончится.
Я использовал PyPDF2 для добавления метаданных и извлечения из него метаданных, но я не смог найти функцию для постоянного извлечения метаданных из pdf.
Код для справки:


# Code to add metadata
from PyPDF2 import PdfFileReader, PdfFileWriter
file_in = open('pg.pdf', 'rb')
pdf_reader = PdfFileReader(file_in)
metadata = pdf_reader.getDocumentInfo()
pdf_writer = PdfFileWriter()
pdf_writer.appendPagesFromReader(pdf_reader)
pdf_writer.addMetadata({
'/public_key':'_public_key',
'/hmac_hash': '_hmac_data'
})

# code to extract metadata:

file_in = open('new.pdf', 'rb')
pdf_reader = PdfFileReader(file_in)
metadata = pdf_reader.getDocumentInfo()
repr(metadata)
"{'/Producer': 'PyPDF2', '/public_key': 'ba68b2fc8d4ca0ca70d95d77a58f8447', '/hmac_hash': 'my_secret_key'}"

Я хочу окончательно удалить / public_key и hmac_ha sh из PDF, но функция pop и popitems класса объектов метаданных, похоже, не работает .

Подскажите что-нибудь, что работает для меня.

...