Я извлек модуль Python -docx, кажется, вы можете только читать document.core_properties. А как насчет других мета-полей в верхнем или нижнем колонтитулах?
В настоящее время мне пришлось выгрузить весь текст, используя doc2txt, а затем выполнить поиск.