SpaCy NER дифференцирующие номера или объекты - PullRequest
1 голос
/ 09 октября 2019

Я в настоящее время играю с SpaCy NER и задаюсь вопросом, может ли SpaCy NER выполнить эти 2 вещи:

Случай 1

Допустим, у нас есть 2 предложения, которые мы хотимделать NER с:

  1. Уровень сахара в его организме увеличивается.
  2. Его общее состояние здоровья увеличивается.

Можем ли мы пометить "увеличение"в первом предложении как сущность «симптомов», а тег «увеличивающийся» во втором слове как сущность «хорошего результата»? Увидит ли NER разницу в этих 2 «возрастающих» словах?

Случай 2

У нас также есть 2 разных предложения:

  1. Myзарплата - 8000 долларов США в месяц
  2. Мои расходы - 5000 долларов США в месяц

Может ли NER видеть число в первом предложении как «доход», а число во втором предложении - как"расходы"?

Спасибо

1 Ответ

1 голос
/ 09 октября 2019

Эти задачи выходят за рамки того, что вы ожидаете, что модель NER сможет выполнять разными способами. Алгоритм NER Spacy может использоваться для поиска типов объектов, таких как MONEY (который является типом сущности в его английских моделях) или, возможно, что-то вроде SYMPTOM, но он не рассматривает очень большой контекст для обнаружения / классификации объектовпоэтому не будет возможности дифференцировать эти случаи, когда соответствующий контекст находится довольно далеко.

Возможно, вы хотите объединить NER (или другой тип обнаружения релевантного диапазона, который также может быть основан на правилах)с другим типом анализа, который больше фокусируется на контексте. Это может быть какая-то классификация текста, вы можете исследовать синтаксический анализ и т. Д.

Вот простой пример из пространных документов о извлечении отношений сущностей с использованием NER (чтобы найти MONEY) с последующим изучениеманализ зависимости, чтобы попытаться выяснить, на что может ссылаться денежный элемент:

https://spacy.io/usage/examples#entity-relations

...