Spacy - сущностный компоновщик - почему прогнозируемая оценка является комбинацией prob и cosine sim? - PullRequest
2 голосов
/ 30 марта 2020

Я проходил через метод прогнозирования для канала компоновщика сущностей в spacy, и по какой-то причине оценка определяется следующим образом:

scores = prior_probs + sims - (prior_probs*sims)

Ссылка здесь

Кто-нибудь имеет опыт работы с этим / знает, откуда взялась эта формула?

Спасибо!

1 Ответ

2 голосов
/ 30 марта 2020

Это взято из Связывание сущностей посредством совместного кодирования типов, описаний и контекста Уравнение раздела 4 2.

Я не чувствую себя достаточно уверенно, хотя и подробно объясняю формулу В целом цель состоит в том, чтобы объединить оценки вероятности для соответствующих кандидатов, полученных из внешних ресурсов, основанных на знаниях (KB в документе), которые являются предыдущими вероятностями, и оценки, оцененные с помощью кодера предложения, используемого для кодирования упоминания для связи вместе с его context, sims в формуле, потому что они вычисляют косинусное сходство между закодированным вектором упоминания и всеми кандидатами в сущности (именно поэтому эта формула используется, только если «incl_context» - true).

...