Чтение определенного раздела из текстового документа с использованием Spacy - PullRequest
0 голосов
/ 16 января 2020

Я новичок в Python и работаю над требованием, в котором мне нужно проанализировать кучу резюме и получить содержание ТОЛЬКО проектов, упомянутых в этих резюме, таких как название проекта, компания, продолжительность, обязанности, навыки, используемые в эти проекты и т. д. c.

Используя сопоставление на основе правил Spacy, я мог бы извлечь все навыки, упомянутые в резюме, но мне нужно конкретно найти навыки, перечисленные для проектов, и соответствующую информацию, такую ​​как продолжительность и т. д. c .

Я пробовал с разбором Spacy-зависимостей, сегментацией предложений et c. но не получил желаемого результата, так как форматы резюме меняются.

Я также пытался использовать docx для того же, но из-за несоответствия формата он не выдает мне соответствующий результат.

...