Может ли кто-нибудь сказать мне, как извлечь только существительные из следующего вывода:
Я токенизировал и проанализировал строку «Дайте мне обзор фильма» на основе заданной грамматики, используя следующую процедуру:
sent=nltk.word_tokenize(msg)
parser=nltk.ChartParser(grammar)
trees=parser.nbest_parse(sent)
for tree in trees:
print tree
tokens=find_all_NP(tree)
tokens1=nltk.word_tokenize(tokens[0])
print tokens1
и получил следующий вывод:
>>>
(S
(VP (V Give) (Det me))
(NP (Det the) (N review) (PP (P of) (N movie))))
(S
(VP (V Give) (Det me))
(NP (Det the) (N review) (NP (PP (P of) (N movie)))))
['the', 'review', 'of', 'movie']
>>>
Теперь я хотел бы получить только существительные.Как мне это сделать?