Полнотекстовая индексация архивного файла - PullRequest
1 голос
/ 22 ноября 2010

Привет,
Короче говоря, я должен выяснить, могу ли я реализовать способ индексации ZIP-файлов .rtf через IFilter в Sql Server 2008 Express для полнотекстового поиска.

Длинная версия: Этот вопрос носит в основном теоретический характер: я не обладаю достаточным опытом и знаниями, чтобы выяснить, возможно ли такое самостоятельно.

Проблема заключается в следующем. Существует база данных Sql Server Express 2008 R2 ограниченного размера, в которой будут храниться большие файлы .rtf, вероятно, 2-10 тыс. Из них, и индексироваться для полнотекстового поиска. Теперь они, вероятно, не вписываются в ограничение 10 Гб, поэтому мне интересно, можно ли их заархивировать (например, в архиве) и сохранить таким образом. Полнотекстовый поиск должен быть выполним на них, в заархивированном состоянии.

Я думал о том, чтобы попытаться каким-то образом связать ifilters (я понятия не имею, выполнимо ли это), или может быть другое решение, которое я не вижу в АТМ; Буду признателен за любой вклад, так как я немного растерялся.

1 Ответ

0 голосов
/ 22 ноября 2010

Возможно, вам будет намного проще использовать что-то вроде Lucene .Вы можете извлечь текст для файлов и индексировать его.

...