Solr - это еще один отличный вариант, это фактически фасад поверх lucene, который предоставляет вам хороший API на основе REST / url. Есть доступная, зрелая библиотека .Net для работы с ней.
http://lucene.apache.org/solr/
http://code.google.com/p/solrnet/
Однако, исходя из вашего вопроса, вы ищете реальный базовый движок или вы ищете что-то, чтобы также сканировать / перемещаться по вашему контенту, создавая индексы выбранной вами поисковой системы?
-
Редактирование ответа на комментарий от оригинального постера.
Тогда вам нужно решить две половины уравнения.
Сначала выбирается поисковая система, которая реагирует на ввод (ключевые слова), а затем запрашивает ее индексы и возвращает то, что, по ее мнению, является подходящим совпадением. Вторая половина уравнения - это поиск механизма для заполнения поискового индекса выбранного вами движка.
Что касается движка, было предложено Lucene, и я предложил вариант Lucene, который обеспечивает (возможно) улучшенный интерфейс разработчика. С точки зрения построения вашего поискового корпуса, это немного по-другому. Здесь вы можете выбрать собственное программное обеспечение, которое берет часть контента и добавляет его в индекс. Преимущество здесь в том, что у вас есть отличный контроль над тем, что входит в поисковую систему и когда. Недостатком является то, что вы пишете новый код - к счастью, современные поисковые системы, такие как Lucene / Solr, делают это довольно легко.
Ваш второй вариант - использовать что-то для автоматического сканирования вашего контента и добавления его в индекс. Проблемы здесь заключаются в определении и обучении для настройки соответствующей опции. В зависимости от выбранного вами сканера, он может выполнять или не выполнять хорошую работу по индексированию документов, находящихся в файловой системе (например, на корпоративном сайте Sharepoint).
Nutch - это сканер из Apache (создателей Lucene и Solr), который потенциально может быть использован, если вы решите не писать свой собственный код. http://wiki.apache.org/nutch/