Я пытаюсь реализовать несколько алгоритмов для измерения сходства между двумя предложениями. Я думаю, было бы полезно, если бы у меня было какое-то расширенное представление предложения.
Мы могли бы получить это расширенное представление с помощью поиска Google / Bing, но размещение целого предложения в качестве ключевого слова не дает хороших результатов, особенно если предложение длинное. Поэтому я подумал, что поиск ключевых слов в предложении и использование их в качестве поисковых терминов улучшит наши результаты.
Кто-нибудь знает алгоритм поиска ключевых слов в предложении?
Спасибо!