Существует ли базовая библиотека. net для лемматизации английского sh? Если нет, с чего следует начать, чтобы написать алгоритм лемматизации? - PullRequest
0 голосов
/ 19 июня 2020

Я работал над исследовательским приложением в составе исследовательской группы, чтобы определить взаимосвязь между несколькими документами. В настоящее время документы анализируются из pdf, стоп-слова удаляются, а оставшийся текст обрабатывается алгоритмом выделения портера. Этот метод оказался не таким точным, как надеялись наши исследования, и мне было поручено найти библиотеку для обработки лемматизации текста. Мне пока не удалось найти базовую библиотеку. net, способную помочь в лемматизации. Я хочу знать, существует ли такая библиотека или в случае, если такой библиотеки не существует, как мне начать разработку алгоритма лемматизации английских sh слов?

...