В чем разница между <NN>* и <NN. *> * В шаблоне регулярных выражений NLTK? - PullRequest
1 голос
/ 07 марта 2019

Я пролистал главу 7 книги НЛТК в поисках решения этой проблемы, но пока мне это неясно.

  1. <NN>* означает 0 или более существительных
  2. <NN.*>*, как объяснено в книге, означает 0 или более существительных любого типа

В НЛТК NN, NNS, NNP, NNPS исключают друг друга?(Я могу ошибаться, думая, что NN является зонтиком для остальных)

В этом случае <NN.*>* означает, что 0 или более из любого из NN, NNS, NNP, NNPS что само может повторяться 0 или более раз (это внешнее *)?Или это просто означает, что NN повторяется 0 или более раз, что снова повторяется 0 или более раз?Или я полностью ошибаюсь?

1 Ответ

1 голос
/ 07 марта 2019

Вот список POS-тегов банка Пенна. Как вы увидите, NN не включает NNS, NNP и NNPS; оно представляет только единственные и массовые существительные.

NN - Существительное, единственное или массовое
NNS - существительное, множественное число
NNP - имя существительное, единственное число
NNPS - имя собственное, множественное число

<NN.*>* означает любой из NN, NNS, NNP, NNPS, повторенный 0 или более раз (из внешнего *), тогда как <NN>* будет означать только <NN> повторение 0 или более раз.

...