Я пытаюсь извлечь все (1) URL-адреса гиперссылок и (2) текст гиперссылки из документа .docx и поместить их в список.
Компонент для извлечения всех URL-адресов гиперссылок уже работает (спасибо Как извлечь URL в гиперссылках из файла docx, используя python). Однако у меня возникают трудности с началом извлечения текста гиперссылки.
Я пытался просмотреть пакеты python -docx и python -docx2txt, но ни у меня нет отличной документации, поэтому я не уверен, с чего начать.