Я пытаюсь проанализировать файл docx, используя python-docx.Файл содержит изображения и текст.В основном мне нужен способ взять изображение (объект InlineShape) из файла и сохранить его как отдельное изображение (например, «smth.jpg»).Есть способ сделать это?Из чтения документации по API это не похоже, но, может быть, я что-то упускаю.
docx2python извлечет эти изображения за вас.
docx2python
from docx2python import docx2python content = docx2python('my_document.docx', 'output_image_directory')
Изображения будут в любом каталоге, который вы поставите.
ОК, я решил найти способ. Преобразование файла docx в zip и распаковка оттуда. Это не самый лучший вариант, но все еще довольно хорош для меня.