Невозможно извлечь форматированный текст --- DOC, DOCX - PullRequest
0 голосов
/ 07 марта 2011

Проблема:

Мне нужно:

  • Модуль Python для извлечения форматированного текста из файлов doc / docx.

Есть идеи?

1 Ответ

0 голосов
/ 07 марта 2011

Если вы чувствуете себя смелым и у вас есть время, вы можете использовать uno & OpenOffice для этой работы http://wiki.services.openoffice.org/wiki/PyUNO_bridge Я использовал его из c #.

...