Я использую stanford nlp tokenRegex для токенизации.Я использую файл регулярных выражений.Ниже приведены правила, которые я использовал.
Rule 1
:
{
ruleType:"tokens",
pattern:([{tag:/NN/}|{tag:/NNP/}]),
result:"Single noun"
}
Rule 2
{
ruleType: "tokens",
pattern:([{tag:/NN.*/}|{tag:/CD*/}]),
result : "Noun with Number"
}
Предложение, которое я дал, Take note with the Samsung Notebook 9 Pen
, и я получил следующие результаты
note -> Одиночное существительное
Samsung Notebook 9 Pen -> Существительное с номером
Даже еслиPOS для Samsung, блокнота, ручки ... NN
исключен.Он не перехватывается rule1
, то есть слова, перехваченные rule 2
, исключаются rule 1
.
Есть ли способ сопоставить оба правила?