Как скопировать каждый абзац из файла .docx в новую строку в файле .csv? - PullRequest
0 голосов
/ 29 апреля 2019

Я новичок в питоне.Я пытаюсь проанализировать файл .docx и скопировать каждый абзац в отдельную строку в новом файле .csv.

Я могу точно подсчитать количество абзацев, а также распечатать весь документ, но я получаю ошибки при попытке выполнить итерацию по документу для анализа каждого абзаца.

1 Ответ

1 голос
/ 29 апреля 2019

Таким образом, вы можете начать с установки пакета под названием «docx» (выполните «pip install docx» на своем терминале или в командной строке, если у вас есть python2 или «pip install python-docx» для python3).

Затем вы можете запустить следующий код:

from docx import Document
import pandas as pd

document = Document('text.docx')
df = pd.DataFrame(columns=['paragraph'])
for para in document.paragraphs:
    print(para.text)
    df.loc[len(df)] = para.text
print(df)

Надеюсь, это поможет. BR

...