Индексирование контента и синонимов для поисковой системы - PullRequest
1 голос
/ 18 июня 2010

Я занимаюсь разработкой поисковой системы.

Я думаю о том, чтобы взять уникальные слова, скажем, описания продуктов, и вызвать API, чтобы получить синонимы и индексировать их.

«быстрый и мощный ноутбук»

даст следующие результаты ...

конечно "быстрый и мощный ноутбук" И еще одно поле с «ускоренным нетбуком»

синонимы, конечно, не будут отображаться пользователю, но будут использоваться только для повышения релевантности результатов поиска.

Что вы думаете об этой идее? Какие подводные камни вы видите? Кто-нибудь делает это?

1 Ответ

0 голосов
/ 18 июня 2010

Слова с кратными синонимами в конечном итоге раздувают поиск. Если у вас есть 5 слов, каждое из которых имеет 10 синомимов, вы выполняете поиск около 50 слов.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...