Получить диапазон сущности из одного из его токенов в spaCy - PullRequest
0 голосов
/ 20 апреля 2019

Учитывая токен, который является частью именованной сущности с несколькими токенами, существует ли прямой метод для получения диапазона этой сущности?

Например, рассмотрим это предложение с одним двухсловным именем:

>>> doc = nlp("This year was amazing.")
>>> doc.ents
(This year,)
>>> doc[0].ent_type_
'DATE'
>>> doc[1].ent_type_
'DATE'

Скажем, мы рассматриваем первый токен («Это»), возможно ли извлечь сущность, частью которой он является? Может быть, что-то вроде этого:

>>> doc[0].ents_
(This year,)

Я полагаю, что иногда токен может быть частью более чем одной сущности.

В данный момент я получаю это путем создания обратного словаря от индексов до индексов сущностей.

Спасибо!

...