Question

Я пишу анализатор документов и документов. Необходимо получить различные метаданные о документе этих форматов. Например, для docx мне нужно получить код XML и продолжить работу с тегами. Подскажите решения, которые помогут решить мою проблему? Такие решения, как python-docx, не подходят, потому что они работают только с текстом.

Slam · Answer 1 · 27 января 2019

Если вам нужны необработанные docx данные, вы, вероятно, будете работать с ними на низком уровне, то есть откройте файл с zipfile и прочитаете мета с помощью xml etree

Какие библиотеки Python использовать для анализа файлов doc и docx?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Какие библиотеки Python использовать для анализа файлов doc и docx?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы