Как извлечь параграфы с номерами разделов в документе docx с использованием python-docx? - PullRequest
0 голосов
/ 11 декабря 2018

Мой файл выглядит так:

       1. first element
           1.1 xxxxxxx
       2. second element
          2.1  yyyyyyyy

Я хочу извлечь весь абзац, например первый абзац должен быть (1. первый элемент + 1.1 xxxxxx)

Я использую Python-docx, и проблема в том, что каждая строка является абзацем, потому что у меня всегда один и тот же стиль («Нормальный») без «заголовка».

Это мой код:

 doc = docx.Document(filename)

 for para in doc.paragraphs:

     print(para.text)
...