Многоязыковая лемматизация в Python - PullRequest
0 голосов
/ 12 декабря 2018

У меня есть набор данных на нескольких языках.я могу применить лемматизацию в соответствии с ее языком?Я уже разделил данные в соответствии с их языком.Пробовал использовать лемматизацию WordNet, но он поддерживает только английский язык

Для использования на нескольких языках я использую snowballStemmer.

1 Ответ

0 голосов
/ 12 декабря 2018

Попробуйте использовать spacy Он поддерживает более 34 языков и имеет лемматизатор.

...