следующее предложение, помеченное частью речи: все животные / DT / NNS / VBP равны / JJ, /,
но / CC некоторые / DT животные / NNS / VBP больше / RBR равны / JJ, чем / IN другие / NNS ./.
Как написать регулярное выражение, которое соответствует только словам каждого слова / pos-тега в предложении.
text="""All/DT animals/NNS are/VBP equal/JJ ,/, but/CC some/DT animals/NNS
are/VBP more/RBR equal/JJ than/IN others/NNS ./."""
tokens=nltk.word_tokenize(text)
pattern="([A-Za-z]+)|[A-Za-z]"
print("Upper case words:")
for tok in tokens:
if re.search(pattern, tok) is not None:
print("'{}'".format(tok))