извлечь текст с первой страницы текстового документа с использованием Python - PullRequest
0 голосов
/ 25 сентября 2018

Я пытаюсь найти скрипт Python, который мог бы извлечь текст с первой страницы текстового документа.Я нашел функции, которые могли бы создавать абзацы, но не страницы, а это не то, что мне нужно.

1 Ответ

0 голосов
/ 25 сентября 2018

Проблема в том, что страницы в формате docx являются чисто виртуальными.MS Word самостоятельно решает, где и когда устанавливать ограничители страниц, основываясь на размере текста и других параметрах.

Немного проще, когда пользователь явно устанавливает разрывы страниц, поскольку их можно найти, как описано там , например.

В качестве обходного пути, вы можете просто рассчитать количество строк на странице и урезать его самостоятельно, но, насколько я знаю, не существует "простого" методаделать все с 1 строкой кода.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...