Дистанционный надзор: метод маркировки на основе правил? - PullRequest
1 голос
/ 18 октября 2019

В настоящее время я работаю над вещами, связанными с сущностями, и обнаружил, что во многих работах реализован дистанционный надзор для маркировки данных. Что я понимаю о дистанционном надзоре, так это о том, что у нас есть установленная База знаний (КБ), и мы делаем своего рода «маркировку на основе правил», проверяя извлеченные пары сущностей, независимо от того, существуют они в КБ или нет. Если пара сущностей существует в КБ, она будет помечена как положительная, в противном случае она будет помечена как отрицательная.

Мои вопросы:

  1. Правильно ли я понимаю эту концепцию дистанционного наблюдения?
  2. Если да, я не понимаю, почему мы обучаем нейронные сети классифицироватьоснованная на правилах система? Например, если в будущем мы получим новые предложения, содержащие сущности, и мы хотим проверить, имеют ли они отношение друг к другу, почему бы нам просто не обратиться к КБ? Почему вместо этого мы тренируем отношения сущностей?

Спасибо

1 Ответ

2 голосов
/ 24 октября 2019

Дистанционный надзор - это подход, основанный на использовании эвристики на основе правил для получения помеченных данных, а полученные помеченные данные затем используются для обучения модели (обычно нейронной сети).

База знаний (КБ)можно использовать можно использовать как правило на основе эвристики. Как заявил Натан Маккой, КБ, как правило, будет неполным, и модель позволит вам обнаружить связь между сущностями, которых нет в базе знаний.

Snorkel являетсяпример инструмента, который был разработан для дистанционного наблюдения

...