Я работаю в Brown Corpus, используя NLTK. Я хочу выделить tokens
с tokens
, помеченным DT
Мой код:
import nltk
from nltk.corpus import brown
brown_tag = brown.tagged_words()
brownDT = [(a,b) for (a,b) in brown_tag if b == 'DT']
Приведенный выше код возвращает value
с тегом DT
но мне тоже нужен index
. Я пытаюсь получить взамен value
и index
из value
. Например, вывод должен быть:
[index, (token, 'DT')]
Этот код не работает:
brownDT = [((a,b),brown_tag.index((a,b))) for (a,b) in brown_tag if b == 'DT']