Стэнфордский CoreNLP классификатор: учебный контекст NER - PullRequest
0 голосов
/ 25 июня 2018

В Стэнфордском классификаторе CoreNLP все примеры, которые я видел, содержали слова (обозначенные O), которые никто не хочет распознавать. Например, ниже «определенные» и «до» не признаются как активы:

certain O       O
Apple   ASSET   ASSET
products       ASSET   ASSET
macOS   ASSET   ASSET
before  O       O

1) Нужны ли мне слова, которые предоставляют контекст, например, «определенный» и «до»?

2) Имеет ли значение заказ? Могу ли я, вместо того, чтобы заказывать «определенные продукты Apple, macOS, перед тем, как« делать »раньше определенные продукты Apple, macOS»?

3) Если контекст необходим, как только я добавлю достаточно обучающих данных, могу ли я просто добавить больше ресурсов без контекста?

1 Ответ

0 голосов
/ 25 июня 2018

Объявление 1. Контекст полезен, если ваша классификация зависит от контекста.

Объявление 2. Под капотом Stanford CoreNLP Classifier используется алгоритм CRF ( Условное случайное поле ), в котором используется порядокслов для правильной классификации.

Объявление 3. См. п.1. - необходимость зависит от вашей проблемы и ваших данных.Вы можете повторно использовать предыдущие контексты и посмотреть, улучшает ли это или снижает точность классификации.

...