SQl Server 2008 FILESTREAM, службы индексирования и FTS - PullRequest
1 голос
/ 13 октября 2009

Мне нужно внедрить сервис для поиска PDF-файлов. Первоначально я начал использовать SQL Server 2008 FTS, но вскоре понял, что мои PDF-файлы должны храниться в самой БД. Затем я указал на службы индексирования, а также на тип данных SQL 2008 FILESTREAM, чтобы я мог хранить PDF-файлы в файловой системе. Итак, как эти три (службы индексирования, FTS и опция FILESTREAM) связаны друг с другом? Нужно ли мне использовать все три вместе для поиска?

Кроме того, такие услуги, как DiscountASP, включены ли в таких хостинговых службах? Или я должен рассмотреть вопрос о переходе на Lucene.NET?

Ответы [ 2 ]

1 голос
/ 05 ноября 2009

Мы использовали PDF iFilter, который позволяет вам сохранить PDF в БД, а затем выполнить FTS против него. Однако теперь мы конвертируем наши PDF-файлы в текстовые и сохраняем текст в полнотекстовом индексе. Это позволяет нам теперь хранить все наши документы (мы храним .doc, .pdf и т. Д.) В одном индексе.

DiscountASP разрешает использование FTS / iFTS в размещенной базе данных.

0 голосов
/ 15 октября 2009

Если вы заранее знаете, что хотите найти (например, вы получаете сотни PDF-файлов в день и вам нужно будет найти файлы с определенными строками «известный до получения»), то вы можете сделать текстовую версию на приеме, создать индексировать записи для файла PDF, а затем выбросить текст.

Если вы не знаете условий поиска заранее, жизнь становится намного медленнее :( Существует программа под названием Поиск PDF, которая утверждает, что выполняет полнотекстовый поиск в файлах PDF. Мне не нужно было ее использовать, поэтому я не могу сказать, как это, но это здесь: http://www.getpdf.com/.

Надеюсь, это поможет

...