Каковы мои варианты для базы данных поисковой системы на Windows - PullRequest
0 голосов
/ 14 октября 2010

У меня есть проект по созданию поисковой системы с высоким трафиком, похожей на altavista.com.Windows .NET C # будет использоваться для проекта.Я ищу хорошую базу данных поисковой системы, которая может справиться с очень высокой нагрузкой.Я взглянул на lucene и sql server 2008. Я читал, что lucene имеет тенденцию портиться при очень высокой нагрузке.Итак, я рассматриваю sql server 2008, но я не уверен, что sql server может справиться с очень высокой нагрузкой на гигабайты данных.

База данных получит кусок данных, и ей потребуется извлекать аналогичные данные в других местах таблицы,он будет действовать только в области похожих вопросов на стеке потока.Потребуется поиск по миллионам строк.Является ли SQL Server 2008 и Lucene мои единственные варианты

1 Ответ

2 голосов
/ 14 октября 2010

Я успешно использовал Lucene с большими объемами данных, и я не сталкиваюсь с проблемами порчи данных.

Но если вас беспокоит автономная люцен, вы можете вместо этого попробовать apache solr , егопоисковый сервер с открытым исходным кодом, основанный на Lucene

Solr - популярная, молниеносная корпоративная поисковая платформа с открытым исходным кодом из проекта Apache Lucene.Его основные функции включают мощный полнотекстовый поиск, выделение совпадений, граненый поиск, динамическую кластеризацию, интеграцию с базой данных и обработку документов (например, Word, PDF).Solr обладает высокой масштабируемостью, обеспечивает распределенный поиск и репликацию индексов, а также поддерживает функции поиска и навигации на многих крупнейших мировых интернет-сайтах.

В google-коде есть клиент .net для solr solr.net .. Вы можете попробовать это

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...