Я пытаюсь построить архитектуру, которая распознает слова, которые относятся к предметному слову из абзаца текста. Этими «родственными» словами могут быть слова, которые описывают предметное слово или предоставляют информацию о предметном слове.
Вот базовый пример:
Джону 36 лет, он живет в Нью-Йорке. Он худой, около 5'9 с светлой кожей.
В этом примере предметное слово будет «Джон». Связанные слова: «36», «мужской», «нью-йорк», «тощий», 5'9 »,« светлая кожа ».
У меня уже есть подход на основе правил для определения предметного слова, котороеработает отлично. Идентификация "связанных" слов не дает точности, на которую я надеюсь. Чтобы идентифицировать связанные слова, я взял подход под контролем обучения и структуры LSTM. Хотя я использовал комбинацию тегов PoS и тегов зависимостивначале я перешел на чистые вложения (модели на основе трансформаторов).
Будем весьма благодарны за любые рекомендации по архитектуре или методам.