Как найти тренды в длинной строке поиска - PullRequest
2 голосов
/ 27 октября 2009

Я бы хотел, чтобы на моем веб-сайте были теги с трендами в соответствии с результатами поиска, выполненного пользователями. Проблема, которую я не вижу в простом решении, состоит в том, как легко извлечь важные термины из строки поиска. Например, многие пользователи могут искать «визуальную студию» с разными целями. Например, «visual studio 2010», «визуальное тестирование студии», «компоненты веб-форм visual studio». В этих 3 поисках «визуальная студия» имеет тенденцию. Как алгоритм может заметить, что, поскольку «visual studio» в большинстве случаев будет смешиваться со многими другими словами?

Спасибо!

Ответы [ 2 ]

2 голосов
/ 27 октября 2009
  1. разбить каждый поисковый запрос на массив из отдельных слов.
  2. вычислить расстояние между словами (чем ближе, тем лучше => чем выше значение)
  3. добавить это расстояние для каждой пары слов во всех запросах.

Пары слов с более высокими значениями являются вашими "трендовыми тегами".

1 голос
/ 27 октября 2009

Посмотрите на этот проект codeplex

http://www.codeplex.com/TheTagCloud

Включает функцию, в которую вы можете передавать html-файл в качестве входных данных и возвращать облако тегов.

...