Google Search API или полнотекстовая индексация MS SQL Server? - PullRequest
1 голос
/ 19 июля 2009

Мы работаем над веб-сайтами для наших клиентов и хотим использовать поисковое решение, которое можно легко использовать повторно. Какой мы должны идти после? Должны ли мы использовать Google Search API или полнотекстовую индексацию MS Sql Server и предикаты CONTAINS & FREETEXT?

Ответы [ 2 ]

4 голосов
/ 19 июля 2009

Мы используем полнотекстовую индексацию SQL Server здесь при переполнении стека, и она работает достаточно хорошо - но я могу только рекомендовать ее для 2005 и 2008 годов, в тех версиях, на которых мы ее используем. Я слышал, что намного хуже в 2000 году. Есть причуды (списки стоп-слов и т. Д.), Но ничего серьезного. Это быстро и делает то, что говорит на банке, в основном.

Проблема, с которой вы сталкиваетесь с contains() и freetext(), заключается в том, что пользователи часто ожидают выполнить поиск на уровне "всей страницы", например, в Google , где все, что записывается на страницу / экран, является для поиска. Это не совсем то, как работают базы данных, но пользователи не заботятся об этом. Они заботятся о результатах и ​​имеют (возможно, разумные) ожидания, основанные на многолетнем поиске в сети.

Если вы ожидаете, что вам понадобится уровень поиска "целая страница", я настоятельно рекомендую посмотреть Google Search API или Lucene.NET (если вы Стек Microsoft, основанный на использовании SQL).

3 голосов
/ 19 июля 2009

В полнотекстовом поиске SQL Server хорошо то, что барьер для входа довольно низок (при условии, что вы уже используете SQL Server). StackOverflow использует его для поиска. Недостатком является то, что его эффективность (или ее отсутствие) является одной из наиболее часто критикуемых функций SO. Настолько, что многие люди (включая меня) по умолчанию используют «site: stackoverflow.com ...» в Google.

Пользовательский поиск Google также имеет низкий барьер для входа, но вы теряете некоторый контроль над тем, как часто обновляется ваш индекс и сколько результатов поиска вы можете вернуть. Поиск по сайту Google - лучшая версия, исправляющая некоторые из этих функций (например, индексация по требованию).

На верхнем торце у вас есть Google Search Appliances , который действительно является единственным вариантом Google, если ваши данные не являются общедоступными.

Что подходит, зависит от того, как часто ваши данные необходимо переиндексировать, сколько запросов вы делаете, какую полосу пропускания вы хотите использовать для индексации, являются ли ваши данные общедоступными и насколько хороши результаты поиска, чтобы , Нет единого ответа.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...