>>> import spacy
>>> en = spacy.load('en')
>>> text = "Joe is walking down the street. He is wondering if Dan Jordan will be home soon."
>>> doc = en(text)
>>> people = [e for e in doc.ents if e.label_ == 'PERSON']
>>> print(people)
[Joe, Dan Jordan]
>>> print(doc.ents)
(Joe, Dan Jordan)
Я хотел бы иметь возможность удалить или заменить все энты с меткой, в данном случае «ЧЕЛОВЕК» - так что каким-то образом получить «х идет по улице. Он интересуется, будет ли х домаскоро ".
Какой лучший подход для этого?Я полагаю, что вам придется каким-то образом повторно маркировать документ и удалять / заменять строки «PERSON», но я не уверен, как проверить, является ли токен ent и есть ли у ent метка «PERSON» во время итерации документа....