Я работаю над проектом, в котором я пытаюсь рассчитать процент инфлективной морфологии нескольких корпусов, чтобы сравнить их.
Я знаю, как использовать nltk Porter Stemmer для получениякорень слова, но для меня было бы гораздо полезнее, если бы я мог вернуть аффикс, а не корень.Если бы я мог это сделать, я мог бы просто посчитать количество аффиксов, которые обрезал стеммер («ly», «ed» и т. Д.), И сравнить его с общим количеством слов.Это может быть простой переворот, но я не могу понять, как это сделать с корнями.