NER закончил написание пользовательских NERin Стэнфорд НЛП - PullRequest
0 голосов
/ 04 июня 2018

В stanford nlp я использовал шаблон для сопоставления номера телефона в regexner.Но NER перезаписывает его как Number.

Если я удаляю примечание ner, оно отображается как PHONE_NUMBER.Может кто-нибудь из вас, пожалуйста, помогите мне.

Заранее спасибо.

Вот моя строка регулярного выражения:

^(?:(?:\+|0{0,2})91(\s*[\-]\s*)?|[0]?)?[789]\d{9}$  PHONENUMBER

Ответы [ 2 ]

0 голосов
/ 08 июня 2018
^(?:(?:\+|0{0,2})91(\s*[\-]\s*)?|[0]?)?[789]\d{9}$  PHONENUMBER NUMBER

работал столбец после столбца CUSTOM NER для перезаписи

0 голосов
/ 06 июня 2018

команда java:

java -Xmx10g edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,pos,lemma,ner -file phone-number-example.txt -outputFormat text -ner.fine.regexner.mapping phone-number-regex.rules

пример текста:

I will call him at 555-555-5555

формат файла правил:

555-555-5555    PHONE_NUMBER    NUMBER  1

(обратите внимание, что столбцы разделены табуляцией)

Мелкозернистый NER будет применяться после статистического NER.Вы также можете создать пользовательский regexner и запустить его после статистической модели.Ключ говорит перезаписать тег NUMBER (который указан в третьем столбце).

...