Таким образом, вы можете начать с установки пакета под названием «docx» (выполните «pip install docx» на своем терминале или в командной строке, если у вас есть python2 или «pip install python-docx» для python3).
Затем вы можете запустить следующий код:
from docx import Document
import pandas as pd
document = Document('text.docx')
df = pd.DataFrame(columns=['paragraph'])
for para in document.paragraphs:
print(para.text)
df.loc[len(df)] = para.text
print(df)
Надеюсь, это поможет.
BR