Для задачи NER есть несколько общих типов сущностей, используемых в качестве тегов:
- лиц (PER)
- организаций (ORG)
- денежных значений (ДЕНЬГИ)
- Геополитический объект, т. Е. Страны, города, государства (GPE)
и многие другие
Кроме того, для различения смежных объектов с одинаковым тегом многие приложения используютСхема маркировки БИО.Здесь B обозначает начало сущности, I обозначает «внутри» и используется для всех слов, составляющих сущность, кроме первого, а O означаетотсутствие сущности.
Итак, в приведенном выше примере B-PERSON означает, что имя человека начинается с токена Bob , следующего тега I-PERSON говорит, что Ross относится к сущности как к предыдущему тегу.Затем идет O , что означает, что жил не принадлежит ни к какому объекту, то же самое относится к в , тогда как Флорида является начальным.из Геополитический субъект (GPE) .
Пожалуйста, дайте мне знать, если это было достаточно полезно.