Учитывая токен, который является частью именованной сущности с несколькими токенами, существует ли прямой метод для получения диапазона этой сущности?
Например, рассмотрим это предложение с одним двухсловным именем:
>>> doc = nlp("This year was amazing.")
>>> doc.ents
(This year,)
>>> doc[0].ent_type_
'DATE'
>>> doc[1].ent_type_
'DATE'
Скажем, мы рассматриваем первый токен («Это»), возможно ли извлечь сущность, частью которой он является? Может быть, что-то вроде этого:
>>> doc[0].ents_
(This year,)
Я полагаю, что иногда токен может быть частью более чем одной сущности.
В данный момент я получаю это путем создания обратного словаря от индексов до индексов сущностей.
Спасибо!