Если вы уже извлекли даты, то похоже, что вам не хватает «типа даты» для каждого. Если DateFinder не может отслеживать позиционную структуру дат в корпусе, то извлечение даты с его использованием не будет слишком полезным.
Однако это не просто проблема распознавания сущностей. Вам придется связать NER с POS-тэгером (и, может быть, даже с синтаксическим анализатором зависимостей) Spacy - хороший вариант.
Сначала вы должны запустить POS-тегер на своем корпусе и посмотреть, подбирает ли он такие фразы, как «Опыт» или «История работы». Если нет, то вы должны добавить свои собственные ярлыки, чтобы он специально помечал эти слова по вашему желанию.
Тогда вы можете запустить NER, чтобы забрать даты. Имейте в виду, что NER в лучшем случае пометит все ваши даты как объекты DATE и не сможет найти различия между типами дат.
Вам нужно будет связать соответствующую дату с предыдущей или следующей частью речи, используя некоторую грамматику языка или регулярное выражение.
Например, вы можете связать все Даты, следующие за словом «Опыт», с тегом «POS Experience».
В качестве альтернативы вы можете попробовать NLTK (который является альтернативой Spacy, но вам также потребуется запустить тот же конвейер с ним). Читайте здесь , чтобы узнать больше.