Solr: сортировка по рейтингу кликов - PullRequest
4 голосов
/ 21 декабря 2011

В настоящее время Solr развернут на нескольких серверах на нашем сайте обмена изображениями. У нас есть 10 миллионов изображений, из которых 1/4 миллиона добавляются ежемесячно.

Пока что Solr очень хорошо отбирает результаты поиска, но мы считаем, что есть возможность улучшить сортировку / ранжирование. Мы считаем, что включение в рейтинг рейтинга кликов позволит значительно улучшить результаты.

В настоящее время мы собираем данные о переходах через MongoDB. Мы записываем, сколько раз кликнуло изображение по сравнению с тем, сколько раз оно показывалось за семестр. Так, например:

[идентификатор изображения], [критерий поиска], [рейтинг кликов]

«00000001», «банановая кожура», «0,1565»

"00000001", "банан", "0,0216"

"00000001", "банан обезьяны", "0,0087"

Что мы хотим сделать, так это найти способ включить эти данные о переходах по конкретным поисковым запросам в наш рейтинг Solr. Чем больше будет нажато изображение для того же термина, тем выше его рейтинг. Мы еще не смогли найти способ сделать это чисто.

Мы хотели бы загружать данные извне, а не включать их в состав индекса Solr - поскольку мы хотели бы, чтобы данные о переходах были почти в реальном времени, и хотели бы, чтобы наш каталог Solr не получал слишком огромный.

Любые идеи или мысли будут очень очень ценятся!

1 Ответ

0 голосов
/ 22 декабря 2011

ExternalFileField является наиболее очевидным решением.

Также проверьте http://www.slideshare.net/LucidImagination/bialecki-andrzej-clickthroughrelevancerankinginsolrlucidworksenterprise-8419715, чтобы узнать больше об этой проблеме.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...