Для документа DOCX я делаю:
document = zipfile.ZipFile(path) soup = BeautifulSoup(document.read('word/document.xml'), 'html.parser')
Как это сделать для документа DOC?