Я новичок в Python и работаю над требованием, в котором мне нужно проанализировать кучу резюме и получить содержание ТОЛЬКО проектов, упомянутых в этих резюме, таких как название проекта, компания, продолжительность, обязанности, навыки, используемые в эти проекты и т. д. c.
Используя сопоставление на основе правил Spacy, я мог бы извлечь все навыки, упомянутые в резюме, но мне нужно конкретно найти навыки, перечисленные для проектов, и соответствующую информацию, такую как продолжительность и т. д. c .
Я пробовал с разбором Spacy-зависимостей, сегментацией предложений et c. но не получил желаемого результата, так как форматы резюме меняются.
Я также пытался использовать docx для того же, но из-за несоответствия формата он не выдает мне соответствующий результат.