Question

Допустим, у меня есть PDF с 10 выносками. Теперь я преобразовал этот pdf в bytearray, используя следующий код:

file = open('cc.txt','rb')
for line in open("123.pdf", 'rb').readlines():
    file.write(line)
file.close()

Теперь, как я могу определить байты, обозначающие выноски? Я попробовал поискать в Google, но не смог найти никаких ответов. Помоги мне, ребята.

gettalong · Answer 1 · 08 февраля 2020

Вы не можете, потому что это не то, как файлы PDF структурированы внутри (они не основаны на строках). Вам нужна библиотека парсинга PDF, чтобы получить объекты, соответствующие выноскам с выносками.

Как выделить объект в байт-массиве, полученном из PDF-файла?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как выделить объект в байт-массиве, полученном из PDF-файла?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов