Лучший способ добавить полный веб-поиск на мой сайт? - PullRequest
8 голосов
/ 08 октября 2008

Мне нужно добавить полный веб-поиск на мой сайт. Мне нужно что-то вроде пользовательского поиска Google, но без рекламы, и это должно быть бесплатно. Любая рекомендация веб-службы или проекта с открытым исходным кодом, которая может проиндексировать мой сайт и позволить мне выполнять поиск, будет полезна.

Мой сайт сделан в ruby ​​на рельсах, если это поможет.

Я задам этот вопрос на вики-сообществе, чтобы вы могли редактировать мой плохой английский. Я думаю, что многие люди могут извлечь пользу из этого вопроса.

Ответы [ 6 ]

6 голосов
/ 08 октября 2008

Ferret - это рубиновый порт Lucene. Проверьте плагин acts_as_ferret .

6 голосов
/ 08 октября 2008

Проверьте Lucene. Это поисковая система с открытым исходным кодом, которая, безусловно, будет интересным опытом для внедрения на вашем собственном сайте. Я верю, что он был изначально разработан людьми Excite.

5 голосов
/ 08 октября 2008

Зависит от того, что вы на самом деле подразумеваете под полным веб-поиском. Если вы хотите выполнить поиск по всей сети, то приведенные выше ответы не сильно вам помогут, поскольку они действительно предназначены для индексации и поиска контента вашего сайта. Я бы предложил использовать поиск ajax в Google (нужен только «питание от Google», без рекламы) или Boss from yahoo (может потребоваться реклама, не уверенная).

http://code.google.com/apis/ajaxsearch/

http://developer.yahoo.com/search/boss/

5 голосов
/ 08 октября 2008

Люди собираются на act_as_solr и думают о сфинксе в блогах, которые я читаю:

http://acts -as-solr.rubyforge.org /

http://ts.freelancing -gods.com /

Я также смотрел tsearch в postgres, он выглядит очень способным:

http://www.sai.msu.su/~megera/postgres/gist/tsearch/V2/

3 голосов
/ 08 октября 2008

Что вы подразумеваете под "полным веб-поиском"?

Доступны хорошие ответы для полнотекстового поиска, когда поисковая система индексирует и запрашивает объекты модели, хранящиеся в вашей базе данных.

Если вы имеете в виду что-то, что индексирует и запрашивает ваш визуализированный HTML, Nutch - это популярный вариант с веб-сканером, анализатором, индексатором и интерфейсом запросов.

2 голосов
/ 08 октября 2008

Я рекомендую acts_as_xapian . Его очень легко реализовать, он достаточно быстр, и у него есть те функции, которые вам обычно нужны.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...