Я работаю, пытаясь автоматически классифицировать короткие статьи, и пытаюсь выяснить, как сопоставить похожие слова - например, полки на полках или покраска и перекраска
Я использую алгоритм определения портера, но он помогает только в определенных ситуациях и только в конце слова (оба приведенных выше примера не работают с ним).
Есть ли алгоритм или списки связанных слов, которые могли бы помочь с чем-то вроде этого (кроме создания моего собственного?)
(я работаю в php, поэтому любые решения на этом языке были бы более полезными.)