Я хотел бы прочитать файл PDF в виде текста (postscript), добавить новые объекты в структуру файла и сохранить окончательный вывод в виде нового PDF, но если я просто скопировал содержимое PDF PostScript и вставил его во вновь созданный файл Файл PDF (где encoding='ansi'
), файл не работает.
Я уверен, что это может быть проблема кодирования, но я не уверен, что мне следует делать, чтобы иметь действительный формат файла PDF после манипулирования исходным содержимым PostScript.
Вот фрагмент кода, который не работал со мной:
pdf_file = open('Input.pdf', 'r', encoding='ansi').read()
pdf_file_bytes = bytearray(pdf_file, 'ansi')
pdf_file = open('Output_bytes.pdf', 'wb').write(pdf_file_bytes)
И, как я уже сказал, выходной PDF неверен!