Каков список возможных тегов с описанием задачи NER CoNLL 2003? - PullRequest
0 голосов
/ 26 декабря 2018

Мне нужно сделать NER.Я нашел библиотеку DeepPavlov , которая делает это.

Вот пример из документов :

from deeppavlov import configs, build_model

ner_model = build_model(configs.ner.ner_ontonotes, download=True)
ner_model(['Bob Ross lived in Florida'])
>>> [[['Bob', 'Ross', 'lived', 'in', 'Florida']], [['B-PERSON', 'I-PERSON', 'O', 'O', 'B-GPE']]]

Я не понимаю, чтовсе эти теги означают.Как я понял из документации, они представлены в формате задачи NER CoNLL 2003.

Может кто-нибудь указать мне список возможных тегов с описанием задачи NER CoNLL 2003?

1 Ответ

0 голосов
/ 08 января 2019

Для задачи NER есть несколько общих типов сущностей, используемых в качестве тегов:

  • лиц (PER)
  • организаций (ORG)
  • денежных значений (ДЕНЬГИ)
  • Геополитический объект, т. Е. Страны, города, государства (GPE)

и многие другие

Кроме того, для различения смежных объектов с одинаковым тегом многие приложения используютСхема маркировки БИО.Здесь B обозначает начало сущности, I обозначает «внутри» и используется для всех слов, составляющих сущность, кроме первого, а O означаетотсутствие сущности.

Итак, в приведенном выше примере B-PERSON означает, что имя человека начинается с токена Bob , следующего тега I-PERSON говорит, что Ross относится к сущности как к предыдущему тегу.Затем идет O , что означает, что жил не принадлежит ни к какому объекту, то же самое относится к в , тогда как Флорида является начальным.из Геополитический субъект (GPE) .

Пожалуйста, дайте мне знать, если это было достаточно полезно.

...