Какие существуют бесплатные или недорогие инструменты для поиска / индексации файловых систем (с использованием .Net)? - PullRequest
4 голосов
/ 06 апреля 2010

Я ищу способ поиска в файловой системе, которая содержит приблизительно 1 ТБ документов в формате Office или PDF. Является ли Lucene.Net лучшим способом для достижения этой цели? Я также слышал о dtSearch, и мне было интересно, если кто-нибудь использовал этот инструмент с успехом? Существуют ли какие-либо другие инструменты, которые бы помогли?

Я ищу инструменты, которые используют .Net и будут работать на блоках Windows.

Если Lucene.Net - лучший путь - есть ли у кого-нибудь хорошие учебники, которые помогут мне начать? Я погуглил, и большинство результатов, которые возвращаются, либо не кажутся лучшими практиками, либо не имеют прямого отношения к моей текущей ситуации.

Если этот вопрос уже задавался, я прошу прощения, и если кто-то, пожалуйста, укажите мне на подобный пост, было бы здорово.

Ответы [ 3 ]

4 голосов
/ 06 апреля 2010

Просмотр Поисковый сервер Экспресс . Это бесплатная версия поиска, включенная в SharePoint.

Lucene / Solr - выбор, но ваша проблема не в поисковой системе, вам нужна система, которая может читать и анализировать PDF-файлы. Lucene сам по себе является просто движком, но у вас есть дополнения с Solr, который помогает вам анализировать контент.

Использование Search Server должно довольно быстро запустить вас, а API поиска хорошо документирован и прост в использовании.

1 голос
/ 07 января 2012

Посмотрите вверх searchblox - это полнофункциональный сканер и индексатор, созданный поверх Lucene и на 100% бесплатный.

1 голос
/ 06 апреля 2010

Я использовал все, и мне это немного нравится, это приложение, но у него также есть SDK для C / C # / Clarion, который включает в себя API поиска.

Во-первых, он не будет индексировать содержимое файлов, только имена файлов. Это делает его очень быстрым для создания индекса и доступа к нему

главная страница

SDK

...