Я работаю над проектом базы знаний с использованием полнотекстового поискового движка SQL Server 2008.
Проект включается в статьи и файлы, где каждая статья имеет несколько файлов. В этих статьях весь контент имеет вид pure html .
Сейчас я успешно создал полнотекстовый каталог и индекс для SQL Server 2008, и моя база данных совместима с версией 10.
Вот мои вопросы:
1) Можно ли игнорировать теги html, более четко тексты, содержащиеся в "<...>", при поиске в этих статьях, потому что, если я хочу искать div, таблицу и т. Д., Результат не должен возвращаться
2) Статьи будут обновляться в любое время, поэтому полнотекстовый индекс должен обновляться при вставке новой записи. Достаточно ли этого для установки только «TRACK CHANGES AUTOMATIC» при создании полнотекстового каталога?
3) Мы можем использовать функцию FILESTREAM в дальнейшем, имеет ли SQL Server 2008 хорошую производительность для файлов, использующих полнотекстовый индекс?
Какие конкретные типы документов SQL Server 2008 хорош при индексировании?
Привет