Я хочу извлечь отношения и сущности из текста путем совместного извлечения. Когда я пытаюсь пометить текст, я выясняю некоторые проблемы.
Учитывая текст:
Трамп - 45-й и нынешний президент Соединенных Штатов ... Трамп родился и вырос в Квинс, район Нью-Йорка ...
Учитывая некоторые тройные отношения:
- t1 = (Трамп, президент, США)
- t2 = (Trump, born_in, Queen) ...
Как мне избежать пометки второго «Трампа», когда я помечаю первую тройку t1? ИЛИ Как мне различить два «Трампа» в тексте?
Есть еще один пример: Трамп опубликовал свою первую книгу Трамп . Как их дифференцировать?
Существует ли нормальный и часто используемый метод для решения этой проблемы? Хотя я могу использовать POS-теги для работы со вторым примером, он не будет работать в первом примере.