Как я могу найти текст между двумя заголовками из DOCX в Python - PullRequest
0 голосов
/ 08 мая 2019

Я хочу извлечь информацию из резюме, для этого мне нужно идентифицировать заголовки и взять текстовые данные под этим заголовком.

1 Ответ

1 голос
/ 09 мая 2019

Я думаю, вам нужно быть более конкретным в своей проблеме и подходе, который вы хотите использовать. На данный момент, для извлечения заголовков, вы можете определить корпус сначала сформировать все заголовки после прочтения в красивый суп. После создания такого корпуса вы можете сопоставить корпус с заголовком резюме и получить раздел, определив начальную и конечную точку данных. а затем сопоставить навыки и т.д. все, что вы хотите сделать с этим. Это самый простой подход, основанный на вашем текущем вопросе. Будьте более конкретны, поэтому я могу руководствоваться более точным подходом.

Лучшее

...