Я пытаюсь извлечь подмножество nltk.corpus.brown.tagged_words()
, которое имеет определенный тег, скажем VBZ
.
Документация кажется мне очень запутанной и бесполезной в этом отношении.Я знаю, что могу сделать это с помощью цикла for или понимания списка, но мне интересно, есть ли какая-то встроенная функциональность в tagged_words()
, которая позволяет мне фильтровать кортежи, которые имеют определенный тег.
Спасибо.
демо:
>>> from nltk.corpus import brown
>>> brown.tagged_words()
[(u'The', u'AT'), (u'Fulton', u'NP-TL'), ...]