Это скорее вопрос теории, а не практики.Я работаю над проектом, который представляет собой довольно простой каталог ссылок.Вся модель аналогична каталогу Dmoz или Yahoo, за исключением того, что каждая запись имеет определенные дополнительные атрибуты.
У меня есть иерархическая таксономия , работающая со всеми записями, имеющими отношение многие ко многим, всеЗаписи теперь сортируются по этим категориям, и все, кажется, работает нормально.Теперь, какой смысл использовать каталог, если нет опции поиска?
Вот немного подробнее о моих моделях: у каждой записи есть заголовок, описание, URL и несколько социальных профилей: YouTube, Twitter, Flickr и др.пара других.К каждой записи может быть прикреплен логотип и скрытое поле для тегов.Также название и описание хранятся на трех разных языках.Поэтому в основном я хотел бы, чтобы результаты поиска были:
- Соответствующие (включая таксономию)
- Возможно те с логотипами
- Возможно те с 100% заполненных профилей
Я пробовал Сфинкс и в настоящее время работаю с Lucene, но, похоже, теоретически поиск не совсем правильный.Я надеюсь, что это имеет смысл, что заполненные записи должны показываться выше, чем другие, но я не могу действительно выяснить баллы.Я не хотел бы, чтобы неуместные записи появлялись сверху, если во всем описании есть только одно совпадение слов, поскольку названия более актуальны.
Так что мой вопрос - есть ли какие-нибудь книги, методики или даже другиеПоисковые системы (если Сфинкс и Люсен недостаточно хороши) , что бы вы порекомендовали по этому вопросу ?Я не только хотел бы получить полный контроль над результатами поиска и их рейтингом, но и предоставить своим посетителям правильную и актуальную информацию.
Также приветствуются ссылки на интересные статьи!
И Нет , я не пытаюсь перестроить Google:)
Спасибо :))