Я использую библиотеку Python-Docx для проекта, который извлекает текст, заголовки и изображения из текстового документа.Тем не менее, я не хочу извлекать это из каждой страницы документа word, я хочу только это содержание с первых 3 страниц.Если кто-то может написать пример кода для:
- Загрузить файл документа Word.
- Поиск любых заголовков, текста или изображений.
- Поиск только по первому3 страницы документа.
- Возьмите найденные заголовки, текст и изображения и добавьте их в новый документ с помощью Python-Docx.