команда java:
java -Xmx10g edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,pos,lemma,ner -file phone-number-example.txt -outputFormat text -ner.fine.regexner.mapping phone-number-regex.rules
пример текста:
I will call him at 555-555-5555
формат файла правил:
555-555-5555 PHONE_NUMBER NUMBER 1
(обратите внимание, что столбцы разделены табуляцией)
Мелкозернистый NER будет применяться после статистического NER.Вы также можете создать пользовательский regexner
и запустить его после статистической модели.Ключ говорит перезаписать тег NUMBER (который указан в третьем столбце).