Извлечение содержимого из определенных файлов Docx с использованием Python-Docx - PullRequest
0 голосов
/ 21 сентября 2018

Я использую библиотеку Python-Docx для проекта, который извлекает текст, заголовки и изображения из текстового документа.Тем не менее, я не хочу извлекать это из каждой страницы документа word, я хочу только это содержание с первых 3 страниц.Если кто-то может написать пример кода для:

  1. Загрузить файл документа Word.
  2. Поиск любых заголовков, текста или изображений.
  3. Поиск только по первому3 страницы документа.
  4. Возьмите найденные заголовки, текст и изображения и добавьте их в новый документ с помощью Python-Docx.
...