Несоответствие между тегами TextBlob и словами - PullRequest
0 голосов
/ 10 июля 2019

Я использую TextBlob для определения части речи в предложении. Но, к моему замешательству, TextBlob не помечает слова, из-за чего порядок индекса становится неправильным. Например: теги [4] [0] не равны словам [4]

Я пробовал много разных предложений, но эта проблема возникает только для этого предложения. Мои предложения / корпус - это условия поиска Google.

from textblob import TextBlob
s = "orthopedic doctor near btm 2nd stage near 20th crosd"
tb=TextBlob(s)
tb.tags
[('orthopedic', 'JJ'), ('doctor', 'NN'), ('near', 'IN'), ('2nd', 'CD'), ('stage', 'NN'), ('near', 'IN'), ('20th', 'CD'), ('crosd', 'NN')]
tb.words
WordList(['orthopedic', 'doctor', 'near', 'btm', '2nd', 'stage', 'near', '20th', 'crosd'])

"btm" отсутствует в tb.tags

from textblob import TextBlob
s = "orthopedic doctor near btm 2nd stage near 20th crosd"
tb=TextBlob(s)
tb.tags
tb.words
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...