Я хотел бы получить индекс в необработанном тексте сущности, найденной с помощью библиотеки python для poplyglot.
# Polyglot example NER
from polyglot.text import Text
text1 = u'Ik wil Ben mijn zoontje met de naam Ben ziek melden.'
print(text1)
ptext1 = Text(text1)
print(ptext1.entities)
for sent in ptext1.sentences:
for entity in sent.entities:
print(entity.tag, entity, entity.start, entity.end)
результат:
[I-PER ([ 'Ben'])]
I-PER ['Ben'] 8 9
Итак, вопрос в том, как получить начальный и конечный индексы, если эти индексы чанков находятся в исходном предложении?