Вопросы о Sql Server 2008 FullText Search - PullRequest
0 голосов
/ 06 октября 2009

Я использую Sql Server 2008 FullText Search для проекта. Мне нужно иметь возможность искать файлы PDf, и у меня возникло несколько вопросов, касающихся этого:

  1. Как включить поиск в PDF? Я слышал о фильтре Adobe, но не смог найти четкого руководства по началу работы.

  2. Файлы PDF хранятся в самой БД или в файловой системе? В основном меня беспокоило место на хостингах общего пользования, таких как DiscountASP. Как правило, мы получаем только около 100 МБ места для БД, но гораздо больше (в ГБ) для файловой системы. Итак, если эти PDF-файлы будут храниться непосредственно в БД, то это может дорого обойтись, верно?

  3. Я хотел бы предоставить фрагменты результатов поиска (например, Google). Как я могу добиться этого с Sql Server 2008 FTS?

Ответы [ 3 ]

2 голосов
/ 06 октября 2009

Похоже, вы хотите использовать Microsoft Indexing Services

Индексирует файлы в файловой системе, чтобы вы могли искать их содержимое.

Вот пример запроса служб индексирования с использованием ASP.NET

2 голосов
/ 06 октября 2009

Полнотекстовый поиск позволяет искать только содержимое базы данных. Он не будет индексировать контент за пределами базы данных. Полный текст можно расширить с помощью API для программирования , а у Adobe есть провайдеров для PDF-контента , как вы уже знаете. Полный текст SQL может использовать эти провайдеры.

Однако есть еще одна функция, которая может вас заинтересовать, а именно новый тип данных SQL 2008 FILESTREAM . Файловые потоки хранятся в файловой системе как файлы, но поддерживаются как часть базы данных с точки зрения обеспечения непрерывности транзакций, резервного копирования и восстановления и т. Д. К счастью, FILESTREAM и FULL TEXT работают вместе .

1 голос
/ 06 октября 2009
  1. Вам нужен PDF IFilter. Вот от Foxit Software.
  2. Я полагаю, что вы можете использовать «Sql Server Full Search» только в том случае, если файлы PDF хранятся в базе данных.
  3. Я не нашел способа сделать это, кроме как открыть файл и самостоятельно искать контекст для каждого результата.
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...