Может ли Портер Стеммер вернуть аффикс, а не стебель? - PullRequest
1 голос
/ 30 марта 2019

Я работаю над проектом, в котором я пытаюсь рассчитать процент инфлективной морфологии нескольких корпусов, чтобы сравнить их.

Я знаю, как использовать nltk Porter Stemmer для получениякорень слова, но для меня было бы гораздо полезнее, если бы я мог вернуть аффикс, а не корень.Если бы я мог это сделать, я мог бы просто посчитать количество аффиксов, которые обрезал стеммер («ly», «ed» и т. Д.), И сравнить его с общим количеством слов.Это может быть простой переворот, но я не могу понять, как это сделать с корнями.

1 Ответ

0 голосов
/ 30 марта 2019

Что ж, если вы хотите получить аффикс, достаточно просто удалить корень (результат переносчика) из исходной формы слова.

Рассмотрим этот псевдокод:

word = "hopeful"
stem_word = porter(word)           #  stem_word should be "hope"
affix = word.remove(stem_word)     # affix should be "ful" 

Другой возможной альтернативой, которая может вам помочь, является использование «дефиса», поскольку он может разделить слова на морфемы, а не просто разделитьслово по корню.Следовательно, он может дать вам больше информации о аффиксах.

...