Как пометить неоднозначные и множественные объекты в совместном извлечении? - PullRequest
0 голосов
/ 22 марта 2020

Я хочу извлечь отношения и сущности из текста путем совместного извлечения. Когда я пытаюсь пометить текст, я выясняю некоторые проблемы.

Учитывая текст:

Трамп - 45-й и нынешний президент Соединенных Штатов ... Трамп родился и вырос в Квинс, район Нью-Йорка ...

Учитывая некоторые тройные отношения:

  • t1 = (Трамп, президент, США)
  • t2 = (Trump, born_in, Queen) ...

Как мне избежать пометки второго «Трампа», когда я помечаю первую тройку t1? ИЛИ Как мне различить два «Трампа» в тексте?

Есть еще один пример: Трамп опубликовал свою первую книгу Трамп . Как их дифференцировать?

Существует ли нормальный и часто используемый метод для решения этой проблемы? Хотя я могу использовать POS-теги для работы со вторым примером, он не будет работать в первом примере.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...