Я читаю новостную статью и делаю пометки с помощью nltk.Я хочу удалить те строки, у которых нет тега pos, например CD (цифры).
import io
import nltk
from nltk.corpus import stopwords
from nltk.tokenize import word_tokenize
from nltk import pos_tag
stop_words = set(stopwords.words('english'))
file1 = open("etorg.txt")
line = file1.read()
file1.close()
print(line)
words = line.split()
tokens = nltk.pos_tag(words)
Как удалить все предложения, не содержащие тег CD?