Вы можете вручную изменить список объектов (doc.ents
) и добавить новые диапазоны, используя смещения токенов.Помните, что сущности не могут перекрываться вообще.
import spacy
from spacy.tokens import Span
nlp = spacy.load('en', disable=['ner'])
doc = nlp("I see an XYZ.")
doc.ents = list(doc.ents) + [Span(doc, 3, 4, "NEWENTITYTYPE")]
print(doc.ents[0], doc.ents[0].label_)
Вывод:
XYZ NEWENTITYTYPE