Поиск ключевых слов в предложении - PullRequest
1 голос
/ 18 мая 2011

Я пытаюсь реализовать несколько алгоритмов для измерения сходства между двумя предложениями. Я думаю, было бы полезно, если бы у меня было какое-то расширенное представление предложения.

Мы могли бы получить это расширенное представление с помощью поиска Google / Bing, но размещение целого предложения в качестве ключевого слова не дает хороших результатов, особенно если предложение длинное. Поэтому я подумал, что поиск ключевых слов в предложении и использование их в качестве поисковых терминов улучшит наши результаты.

Кто-нибудь знает алгоритм поиска ключевых слов в предложении?

Спасибо!

1 Ответ

4 голосов
/ 18 мая 2011

Lucene может обрабатывать как извлечение, так и сравнение.

...