Этого можно добиться, используя пакет polyglot
.Существует возможность морфологического анализа.
Этот вид анализа основан на morferor моделях, обученных на наиболее часто встречающихся словах встречаться с морфемами («примитивные единицы синтаксиса, наименьшие индивидуально значимые элементы ввысказывания языка ").
Из документации :
from polyglot.text import Text
blob = "Wewillmeettoday."
text = Text(blob)
text.language = "en"
print(text.morphemes)
Вывод будет:
WordList([u'We', u'will', u'meet', u'to', u'day', u'.'])
Обратите внимание, что еслиЕсли вы хотите начать работать с полиглотом, вам следует сначала внимательно прочитать документацию, поскольку следует учитывать несколько моментов, например загрузка моделей для конкретного языка.