ASP.NET поисковая система - PullRequest
       6

ASP.NET поисковая система

6 голосов
/ 21 февраля 2010

Я нахожусь в процессе создания корпоративного веб-сайта. Мы ищем любой открытый или платный поисковик на основе ASP.NET. Должно быть в состоянии

  1. Поиск веб-контента всех страниц сайта.
  2. Все офисные документы. и т.д.
  3. Если у нас есть какой-либо searach, то повторно выполняет фильтрацию на основе типа пользователя и стиля

Пожалуйста, дайте мне знать, какие инструменты или программное обеспечение нам нужно рассмотреть.

Ответы [ 2 ]

7 голосов
/ 21 февраля 2010

Попробуйте Lucene.NET

Apache Lucene - это высокопроизводительная, полнофункциональная библиотека для поиска текста, полностью написанная на Java.Это технология, подходящая практически для любого приложения, требующего полнотекстового поиска, особенно кросс-платформенного.

Lucene.Net - это исходный код, класс для класса, API для API и алгоритмический портпоисковая система Java Lucene для платформы C # и .NET, использующая Microsoft .NET Framework.

Вот несколько ссылок на учебники, с которых можно начать:

2 голосов
/ 21 февраля 2010

Solr - это еще один отличный вариант, это фактически фасад поверх lucene, который предоставляет вам хороший API на основе REST / url. Есть доступная, зрелая библиотека .Net для работы с ней.

http://lucene.apache.org/solr/

http://code.google.com/p/solrnet/

Однако, исходя из вашего вопроса, вы ищете реальный базовый движок или вы ищете что-то, чтобы также сканировать / перемещаться по вашему контенту, создавая индексы выбранной вами поисковой системы?

-

Редактирование ответа на комментарий от оригинального постера.

Тогда вам нужно решить две половины уравнения.

Сначала выбирается поисковая система, которая реагирует на ввод (ключевые слова), а затем запрашивает ее индексы и возвращает то, что, по ее мнению, является подходящим совпадением. Вторая половина уравнения - это поиск механизма для заполнения поискового индекса выбранного вами движка.

Что касается движка, было предложено Lucene, и я предложил вариант Lucene, который обеспечивает (возможно) улучшенный интерфейс разработчика. С точки зрения построения вашего поискового корпуса, это немного по-другому. Здесь вы можете выбрать собственное программное обеспечение, которое берет часть контента и добавляет его в индекс. Преимущество здесь в том, что у вас есть отличный контроль над тем, что входит в поисковую систему и когда. Недостатком является то, что вы пишете новый код - к счастью, современные поисковые системы, такие как Lucene / Solr, делают это довольно легко.

Ваш второй вариант - использовать что-то для автоматического сканирования вашего контента и добавления его в индекс. Проблемы здесь заключаются в определении и обучении для настройки соответствующей опции. В зависимости от выбранного вами сканера, он может выполнять или не выполнять хорошую работу по индексированию документов, находящихся в файловой системе (например, на корпоративном сайте Sharepoint).

Nutch - это сканер из Apache (создателей Lucene и Solr), который потенциально может быть использован, если вы решите не писать свой собственный код. http://wiki.apache.org/nutch/

...