Извлечение подробных сведений о текстовом документе Microsft с использованием Apache Tika Python или библиотеки Java. - PullRequest
0 голосов
/ 24 сентября 2019

Я пытаюсь извлечь подробные сведения о документе Microsoft Word, используя библиотеку apache tika python.Я нашел возможность прочитать файл, но детали, такие как, заголовок, нижний колонтитул, абзац и т. Д., Связанные с документом Word, я не могу извлечь.

...