Я реализую поисковое приложение.
Корпус больших текстовых документов.
Во время обработки файла я пишу все слова и вызываю алгоритм Портера Стеммера
Шаг1 (http://tartarus.org/~martin/PorterStemmer/csharp2.txt).
Step1 избавляется от множественного числа и -ed или -ing ...
Я заметил, что слово «это» будет означать «thi».
Это нормальная работа алгоритма?
Так как я хотел обозначить слово «это».