Правило TokenRegex, исключающее токены, которые были пойманы любым другим правилом - PullRequest
0 голосов
/ 22 мая 2018

Я использую stanford nlp tokenRegex для токенизации.Я использую файл регулярных выражений.Ниже приведены правила, которые я использовал.

Rule 1:

 {
   ruleType:"tokens",
   pattern:([{tag:/NN/}|{tag:/NNP/}]),
   result:"Single noun"
}

Rule 2

{
   ruleType:  "tokens",
   pattern:([{tag:/NN.*/}|{tag:/CD*/}]),
   result : "Noun with Number"
}

Предложение, которое я дал, Take note with the Samsung Notebook 9 Pen, и я получил следующие результаты

note -> Одиночное существительное

Samsung Notebook 9 Pen -> Существительное с номером

Даже еслиPOS для Samsung, блокнота, ручки ... NN исключен.Он не перехватывается rule1, то есть слова, перехваченные rule 2, исключаются rule 1.

Есть ли способ сопоставить оба правила?

...