Отслеживание популярных страниц - PullRequest
0 голосов
/ 28 апреля 2011

Мы работаем над сайтом поддержки клиентов, который содержит различные ресурсы, включая статьи поддержки, видео и новости.

Мы планируем реализовать глобальный поиск с использованием Lucene.NET, и мы хотим, чтобы он отображался аналогично Google, т.е. все различные ресурсы отображаются в зависимости от актуальности и популярности. У нас также будет фильтр страниц индекса по таким вещам, как «Лучшие» или «Самые популярные».

Мой главный вопрос - отслеживать, что на самом деле является наиболее популярным, как долго после открытия страниц вы классифицируете его как «Вид». например, если клиент выполняет поиск, как вы отслеживаете, какой результат, который он открыл, был фактически тем, что он искал, в какой момент вы добавляете «вес» к используемым поисковым терминам?

Я понимаю, что все это основано на предположениях, я просто ищу точный способ отображения наиболее важных данных для пользователя.

Буду признателен за любые советы или указания в правильном направлении.

1 Ответ

0 голосов
/ 28 апреля 2011

Один из подходов к обнаружению удовлетворенного поиска заключается в сохранении страниц, по которым они щелкают по заданному запросу, в заданный период времени. Если они нажимают на результаты, которые отображаются ниже, и прекращают поиск, возможно, они были удовлетворены документом с более низким рейтингом.

Если вы хотите выполнить какой-либо анализ, например, PageRank, вам придется делать это как часть шагов сканирования и индексации, а не на лету, когда пользователь выполняет поиск. Например, Nutch может выполнять определенные анализы во время сканирования и индексации.

...