Какие функции Apache OpenNLP использует по умолчанию при запуске своих моделей распознавания именованных объектов (NER)? - PullRequest
0 голосов
/ 17 октября 2018

Я знаю, что Apache OpenNLP использует модель MaxEnt для своего тега NER.Но какие функции Apache OpenNLP использует (по умолчанию) при запуске своих моделей распознавания именованных объектов (NER)?а также как мы можем включить / настроить новые функции в OpenNLP (реализация Java)?

1 Ответ

0 голосов
/ 21 октября 2018

В Apache OpenNLP NER он позволяет пользователям определять функции с помощью файла XML.XML по умолчанию выглядит так:

https://github.com/apache/opennlp/blob/master/opennlp-tools/src/main/resources/opennlp/tools/namefind/ner-default-features.xml

Если вы хотите настроить его, используйте опцию -featuregen при обучении модели:

$ opennlp TokenNameFinderTrainer -featuregen your-features-definition.xml -model my-model.bin ...

Вы надеваетепри запуске TokenNameFinder не требуется указывать XML-файл настроенной функции, поскольку файл модели содержит информацию о ваших функциях.

...