Как я могу использовать SQL Server для определения длины полнотекстового индексированного поля varbinary? - PullRequest
0 голосов
/ 31 июля 2011

Я сохранил несколько двоичных файлов в таблице SQL Server.Я создал полнотекстовый индекс для этой таблицы, который также индексирует двоичное поле, содержащее документы.Я установил соответствующие фильтры iFilters, чтобы SQL Server мог также читать файлы .doc, .docx и .pdf.

Используя функцию DATALENGTH, я могу получить длину / размер всего документа, но это также включает макет идругая бесполезная информация.Я хочу знать длину текста документов.

Использование iFilters SQL Server может извлекать только текст таких «сложных» документов, но может также использоваться для определения длины толькотекст

1 Ответ

0 голосов
/ 01 августа 2011

Насколько я знаю (что немного), нет возможности запрашивать свойства документа через FTS.Я бы получил количество слов перед вставкой документа в базу данных, а затем вставил счет вместе с ним в другой столбец таблицы.Для документов Word вы можете использовать свойство Document.Words.Count;Я не знаю, каков эквивалентный механизм для документов PDF.

...