Какую стороннюю поисковую систему (бесплатно) я должен использовать? - PullRequest
1 голос
/ 19 декабря 2009

Как видно из названия, мне нужен поисковик ... для поиска в MySQL. Мой сайт основан на PHP.

Я работал с sphinx, но моя хостинговая компания не поддерживает полнотекстовые индексы!

Так что поисковая система будет использоваться без полнотекстового!

Он должен быть довольно мощным и должен включать по крайней мере следующие функции:

  • При поиске совпадений 'bmw 520' только в тех случаях, когда эти два слова входят именно в этот порядок, возвращается. не подходит только для «bmw» или только для «520».

  • При поиске 'bmw 330ci' будут возвращены результаты, указанные выше, но С И БЕЗ расширения ci. Как вы все знаете, в автомобилях есть ряд расширений (i, ci, si, fi и т. Д.).

  • Я хочу, чтобы знак «минус» «исключал» все возвраты, содержащие слово после знака, например: «bmw -330» будет возвращать все результаты «bmw» без «330». (НЕТ вместо знака минус тоже нормально)

  • все акценты специальных символов, такие как 'é', преобразуются в их простые значения, в данном случае 'e'.

  • список слов, которые следует полностью игнорировать при поиске

Спасибо, ребята!

Ответы [ 3 ]

5 голосов
/ 19 декабря 2009

Компетентный поиск Zend_Lucene работает довольно хорошо. Я не уверен, как он справится с вашим вторым требованием, однако, если вы настроите токенизацию, вы сможете сделать это, рассматривая переход от букв к цифрам как новое слово.

Единственное, в чем я действительно не уверен - это главное требование. Учитывая то, как он индексируется, порядок поиска становится неуважительным, поэтому вы не сможете сделать это без интенсивного редактирования Lucene, написания фильтра (использование lucene для поиска совпадений, затем проверка порядка) или написания собственного решения , Все это замедлит поиск и увеличит нагрузку на ваш сервер.

Существует также solr , но я никогда не использовал его и ничего о нем не знаю. Сфинкс был другим, но я вижу, вы уже исключили это.

0 голосов
/ 19 декабря 2009

Я использовал несколько поисковых систем на своем сайте в это время, но в следующей перестройке я планирую перейти на Google Site Search.

Для этого есть несколько причин:

  • Пользователи очень хорошо знакомы со списком результатов поиска в стиле Google, который повышает удобство использования и, следовательно, рейтинг кликов
  • Движок Google очень хорошо угадывает, когда использовать описание страницы и когда использовать фрагмент страницы (он также очень хорош для получения соответствующих фрагментов по сравнению с некоторыми другими движками)
  • Используется тысячами очень популярных сайтов
  • Google - самая популярная поисковая система в мире, поэтому вы знаете, что их технология надежна и точна

Поиск по сайту Google начинается со 100 долларов США в год за 1000 страниц или менее (и ограничение для запросов) или вы можете использовать бесплатную систему пользовательского поиска Google (но она гораздо менее настраиваема)

0 голосов
/ 19 декабря 2009

Xapian очень хорошо (очень исчерпывающе), если у вас есть время для начальной настройки.

Он функционирует так, как вы ожидаете, что поисковая система будет работать, сообщает индексатору, какие биты информации индексировать в каком пространстве имен / таблице / объекте (страница, профиль, продукты и т. Д.), А затем выдает запрос для ваших пользователей на основе ключевых слов , он также поддерживает теги стиля Google, например "profile: Mark icecream" будет искать в моем профиле слово icecream, я, кажется, помню, что он также поддерживает диапазоны для данных, которые вы указываете как числовые.

Может использоваться в локальном режиме, который может предлагать изменения правописания (Вы имели в виду?), Или в удаленном режиме, к которому многие сайты могут индексировать и запрашивать.

Что действительно спасло меня один раз, так это возможность прикреплять временные данные без поиска к индексируемому элементу, например прикрепление идентификатора БД ко всем данным, индексированным для этой записи, очень хорошо для последующей обработки и получения всей записи из БД, когда ваши совпадения возвращаются из xapian.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...