Если вы хотите сделать больше со своим текстом, вы также можете маркировать его. Для этого я бы рекомендовал SpaCy .
Сначала установите его и добавьте «маленькую» модель SpaCy на английском языке
pip install spacy
python -m spacy download en_core_web_sm
Затем добавьте эти три строки в ваш код.
import spacy # with other imports
nlp = spacy.load("en_core_web_sm") # early in your script to load the model
doc = nlp(txt) # before your print(txt) line
doc
будет повторяться. И вы сможете анализировать каждое слово с помощью части речевого тегирования, например.
for token in doc:
print(token, token.pos_)
Выход:
Alabama PROPN # 'PROPN' means proper noun
Building NOUN
Веселитесь:)