Нахождение синонимов и основной формы наклоненных слов - PullRequest
2 голосов
/ 11 января 2012

Я ищу инструмент на Java, который позволил бы мне делать следующие вещи:

1) Найдите для наклонного слова его основную форму. Пример:

  • Для слов «соединение», «подключение», «подключается» и т. Д. Будет возвращено слово «подключение».
  • Для слов «работает», «работает» возвращается слово «бежать».

2) Вернуть для каждого слова набор его синонимов.

Кто-нибудь знает такой инструмент?

1 Ответ

2 голосов
/ 11 января 2012

Полагаю, вам небезразличен только английский.

Первая ваша проблема называется stemming .Эта SO post рекомендует эту реализацию Java Porter stemmer .

. В WordNet имеется довольно большая созданная человеком / кураторская база данных слов и их отношений, которая включает синонимы среди другихвещи.Вот API Java для WordNet .

...