Документ, сохраненный в файловой системе Текстовый поиск и фильтрация требуются в приложении ASP .Net - PullRequest
1 голос
/ 15 декабря 2009

Мы создаем приложение для рабочей площадки, в котором мы будем хранить резюме всех кандидатов, которые планируется сохранить в файловой системе.

Теперь нам нужно выполнить поиск внутри этого файла и предоставить результат пользователю, нам нужно предоставить то, что является лучшим решением для осуществления текстового поиска.

Я только что попытался идентифицировать его и получил некоторые ссылки, такие как IFilter (API или интерфейс) и Lucene.Net (с открытым исходным кодом), но не уверен, что это правильное решение.

На начальном этапе ожидается около 50 000 резюме, и оно должно быть достаточно масштабируемым при увеличении числа.

Мне просто нужен пример из практики, анализ или ваши предложения о том, какой метод лучше всего справится с этим требованием (технология ASP .Net)

Спасибо

Ответы [ 3 ]

0 голосов
/ 15 декабря 2009

Одной из возможностей может быть использование функции FILESTREAM в SQL Server 2008 в сочетании с полнотекстовым индексом / поиском на уровне базы данных.

Это позволит вам сохранить файлы в файловой системе, а также обеспечит целостность транзакций и поиск.

SQL Express поддерживает FILESTREAM, и ограничение размера в 4 ГБ не распространяется на файлы (хотя оно применяется к размеру полнотекстового индекса).

0 голосов
/ 22 декабря 2009

Это может быть наивно, так как я не знаком с готовыми продуктами для поиска, но если предварительная сборка не отвечает всем требованиям, я создам простой сервис, который сканирует и индексирует (или несколько экземпляров для сканирования разных каталогов для увеличения скорости). ) и обновляет базу данных. Если бы к файлам обращались регулярно, вы могли бы создать слой изоляции, чтобы предотвратить столкновения.

Родня

0 голосов
/ 15 декабря 2009

Вы можете использовать Microsoft Search Server . Существует бесплатная версия, поэтому вы можете попробовать ее перед покупкой (или никогда не покупать, если она соответствует вашим требованиям).

Если позже вы захотите интегрировать эти документы в портал Sharepoint, Enterprise Search также может интегрироваться с ним.

...