Как использовать BERT только для извлечения ENTITY из последовательности без классификации в задаче NER? - PullRequest
0 голосов
/ 24 октября 2019

Мое требование здесь - предложение (последовательность), я хотел бы просто извлечь сущности, присутствующие в последовательности, без классификации их по типу в задаче NER. Я вижу, что BertForTokenClassification для NER выполняет классификацию. Может ли это быть адаптировано только для извлечения?

Можно ли просто использовать BERT для извлечения / идентификации объекта ?

1 Ответ

0 голосов
/ 25 октября 2019

Независимо от тегов BERT, NER обычно выполняется с помощью тегов в формате IOB (внутри, снаружи, в начале) или чем-то похожим (часто конец также явно помечается). Теги внутри и начальные содержат тип объекта. Примерно так:

Alex B-PER
is O
going O
to O
Los B-LOC
Angeles I-LOC

Если вы измените свои обучающие данные так, что будет только один тип сущности, модель научится обнаруживать сущности, не зная, к какому типу относится сущность.

Alex B
is O
going O
to O
Los B
Angeles I
...