Вот пример команды
java -Xmx5g edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,pos,lemma,ner -ner.additional.tokensregex.rules example.rules -file example.txt -outputFormat text
Дополнительная информация ... ner
аннотатор выполнит серию шагов
- статистический нер
- числовые последовательности и SUTime
- мелкозернистый NER (пример: LOCATION -> STATE_OR_PROVINCE)
- дополнительные правила TokensRegexNER
- дополнительные правила TokensRegex
- построение сущностей
Таким образом, после выполнения шагов 1-5 сущности будут построены и будут видеть теги из ваших правил TokensRegex.
Это в текущем коде GitHub и версии 3.9.2 (не работает со старыми версиями).
Подробнее здесь: https://stanfordnlp.github.io/CoreNLP/ner.html