Вы можете просто анализировать текстовый документ построчно.Это не элегантно и, конечно, не красиво, но работает.Вот фрагмент чего-то похожего, что я сделал в python 3.3.
import os
directory='your/path/to/file/'
file='yourword.doc'
doc=open(directory+file,'r+b')
for line in doc:
line2=str(line)
print(line2))
Я использовал регулярное выражение, чтобы получить именно то, что мне нужно.Но этот код будет читать каждую строку вашего текстового документа (форматирование и все) и преобразовывать его в красивые строки, с которыми вы можете иметь дело.Не уверен, что это вообще полезно (этому посту пару лет), но, по крайней мере, он анализирует слово document.Тогда нужно просто избавиться от ненужных строк перед записью в текстовый файл.