Я довольно новичок в CoreNER, поэтому, пожалуйста, потерпите меня, если это очевидно.
Мне нужно обучить тэджера NER в Стэнфорде распознавать ссылки на количество жертв в новостях.Например, в следующем предложении:
На прошлой неделе пять человек умерли от лихорадки Эбола и т.д. ...
Строка "пять человек"умер "будет ссылка на ряд жертв.Очевидно, что присутствие числа в начале n-граммы является сильным сигналом того, что это может быть число несчастного случая.Но конкретное число может сильно различаться.
Так что я думал о том, чтобы сделать это в два этапа
- Запустить тэгер Number
- Запустить тэгер CasulatyNumber, который будет использовать 'Number-ness' словв качестве одной из функций
Поддерживает ли это CoreNER?И если да, то какие свойства я должен установить в файле свойств?
Thx.
Alain Désilets