Я использую TextBlob для определения части речи в предложении. Но, к моему замешательству, TextBlob не помечает слова, из-за чего порядок индекса становится неправильным. Например: теги [4] [0] не равны словам [4]
Я пробовал много разных предложений, но эта проблема возникает только для этого предложения. Мои предложения / корпус - это условия поиска Google.
from textblob import TextBlob
s = "orthopedic doctor near btm 2nd stage near 20th crosd"
tb=TextBlob(s)
tb.tags
[('orthopedic', 'JJ'), ('doctor', 'NN'), ('near', 'IN'), ('2nd', 'CD'), ('stage', 'NN'), ('near', 'IN'), ('20th', 'CD'), ('crosd', 'NN')]
tb.words
WordList(['orthopedic', 'doctor', 'near', 'btm', '2nd', 'stage', 'near', '20th', 'crosd'])
"btm" отсутствует в tb.tags
from textblob import TextBlob
s = "orthopedic doctor near btm 2nd stage near 20th crosd"
tb=TextBlob(s)
tb.tags
tb.words