Вы можете хранить данные в двоичном формате и использовать полнотекстовый поиск для интерпретации двоичных данных и извлечения текстовой информации: .doc, .txt, .xls, .ppt, .htm.Извлеченный текст индексируется и становится доступным для запросов (убедитесь, что вы используете ключевое слово CONTAINS).Само собой разумеется, полнотекстовый поиск должен быть включен. Не уверен, как добавление полнотекстового индекса повлияет на вашу систему - то есть, на ее размер.Вам также нужно взглянуть на план выполнения, чтобы убедиться, что индекс используется во время запроса.
Для получения дополнительной информации смотрите:
http://technet.microsoft.com/en-us/library/ms142499(SQL.90).aspx
Плюсы: Основное преимущество хранения данных в базе данных состоит в том, что она делает данные «автономными».Поскольку все данные содержатся в базе данных, резервное копирование данных, перемещение данных с одного сервера базы данных на другой, репликация базы данных и т. Д. Намного проще.
также вы можете включить управление версиями файлов, а также облегчить работу веб-ферм с балансировкой нагрузки.
Минусы: вы можете прочитать это здесь: https://dba.stackexchange.com/questions/3924/sql-server-2005-large-binary-storage. Но это то, что выдля эффективного поиска по файлам.
Или другое, что я мог бы предложить, это, вероятно, сохранить ключевые слова в базе данных и затем связать их с файлом в файловой папке.
Вот статья, в которой обсуждается использование abt с помощью FileStream и базы данных: http://blogs.msdn.com/b/manisblog/archive/2007/10/21/filestream-data-type-sql-server-2008.aspx