Еще один вопрос реализации алгоритма stemming? - PullRequest
0 голосов
/ 24 декабря 2010

Я пытаюсь реализовать алгоритм stemming, но у меня возникли сложности с пониманием этого вопроса

Шаг 1c

(*v*) Y -> I                    happy        ->  happi
                                sky          ->  sky

Разве это не противоположность того, что мы хотим сделать, почему алгоритм преобразует Y в I.

для полного алгоритма здесь http://tartarus.org/~martin/PorterStemmer/def.txt

Спасибо

1 Ответ

2 голосов
/ 24 декабря 2010

Стерилизатор Портера и другие алгоритмы stemming не всегда возвращают слова; они возвращают слово основы . Цель состоит в том, чтобы связанные слова имели одинаковую основу. Пока слова «счастье», «счастливый» и «счастливый» сводятся к одному и тому же стеблю, ваш стеммер выполняет свою работу, даже если стебель не является настоящим словом.

...