При изучении основ интеллектуального анализа текста я столкнулся со следующей проблемой: я должен использовать именованную аннотацию сущностей, чтобы найти и найти именованные сущности.Однако при обнаружении тег должен быть включен в документ.Так, например: «Привет, я - Коен» должен привести к «Привет, я - <ЛИЦО> Коен ».
Я понял, как найти и пометить именованные объекты, но я застрял при их получении.в файле правильно.Я попытался сравнить, если в файле есть ent.orth_, а затем заменить его на закрывающий тег tag + ent.orth_ +.
print([(X, X.ent_iob_, X.ent_type_) for X in doc])
Я использовал это дляопределить местонахождение сущностей и их начало.
for ent in doc.ents:
entities.append(ent.orth_ + ", " + ent.label_)
Я использовал это для создания переменной с исходной формой и надписью.
Прямо сейчас у меня есть переменная со всеми оригинальнымиформы и метки и знают, где сущности начинаются и заканчиваются. Однако, пытаясь как-то заменить его, мои знания заканчиваются и не могут найти аналогичные примеры.