поиск HTML, хранящегося в виде двоичного изображения в SQl2000 / 2005 (без полнотекста) - PullRequest
0 голосов
/ 08 марта 2009

Я создаю простой инструмент поиска для поиска по «n» статьям HTML-контента. Я попробовал полнотекстовый поиск, и все было хорошо, пока мы не начали работу, и у меня было множество проблем с тем, как веб-хостинг сортировал вещи должным образом. Поэтому мне, возможно, придется перейти на хост, который не поддерживает полнотекстовый SQL.

Все статьи хранятся в столбце SQL «изображение», все, что я хочу сделать, - это выполнить ПОИСК «% ключевого слова%» в этом столбце, но не знаю, как это сделать, или, если это возможно .

Может ли SQLserver декодировать двоичный файл и выполнять поиск на лету?

Или мне лучше просто хранить текстовую версию содержимого во втором столбце?

Я посмотрел проект Lucene.net, но не уверен, что он будет работать на платформе общего хостинга.

любая помощь будет высоко ценится.

веселит. Craig

1 Ответ

1 голос
/ 08 марта 2009

Это зависит от вашей версии SQL-сервера - в 2000 году вам, вероятно, не повезло. «Изображение» на самом деле - просто двоичный двоичный объект - никакие строковые функции или что-либо еще не будут работать на нем.

В SQL Server 2005 вы могли бы преобразовать это (или в схеме базы данных, или на лету, с CAST) в VARCHAR (MAX) - текстовый тип до 2 ГБ, который может работать с обычными строковыми функциями , и можно искать с помощью WHERE CAST (blob AS VARCHAR (MAX)), как '.......'

Это будет не совсем молниеносно, но это может сработать. Я бы предпочел изменить тип данных этого столбца на VARCHAR (Макс), хотя - все только текст, поддерживается до 2 ГБ - должно быть достаточно для нескольких документов HTML.

Марк

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...