Python, отделяющий изображения и текст от файлов MS Office - PullRequest
0 голосов
/ 19 ноября 2010

Есть ли способ отделить текст и изображения от файлов MS Office, таких как word, excel, ppt и т. Д. и получить положение изображения в документе (где изображение начинается в документе между текстом)?

Приложение должно быть разработано для Linux box.

Пожалуйста, предложите.

1 Ответ

0 голосов
/ 20 ноября 2010

Возможно, вы захотите взглянуть на привязки Python UNO для OpenOffice - wiki на http://wiki.services.openoffice.org/wiki/Python - это должно позволить вам открывать и работать с документами MSOffice на linux.

Что именно вы пытаетесь достичь - новый способ документировать документы Office в формате HTML?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...