Распознавание именованных объектов, как определено только как маркировка смежных сегментов предложений и присвоение им метки из предопределенного набора. Автоматически распознаваемые распознаватели (например, те, что используются в spacy) действительно используют контекст всего предложения, однако, как только модель обучена, вы не можете добавить новые метки, такие как «дата рождения». Если у вас большой корпус, где такие объекты аннотированы, вы можете переобучить пространственную модель, чтобы она могла использовать ваши метки.
Возможно, слишком тяжелая техника использовала бы некоторые методы извлечения знаний , которые в основном связывают распознанные сущности и присваивают им некоторые семантические метки. В вашем случае это будет что-то вроде: [PERSON] (was born on) [DATE]
.
В любом случае, если задачу, которую вы хотите решить, так же просто, как переименовать сущность в определенном контексте, я бы написал набор правил для конкретного случая. Примерно так: если у сущности дата, а в предложении есть «рожден» или «рожден», то это ваша сущность с датой рождения. Или вы можете сделать более причудливые правила, основанные на разборе зависимостей, которые вы получаете также от spacy.