Как искать поле varbinary в SQL Server? - PullRequest
0 голосов
/ 23 февраля 2010

У меня есть приложение, в котором я разрешаю пользователям загружать файлы, в основном документы PDF и Word. Эти файлы хранятся в поле varbinary в базе данных. Для чего бы это ни стоило, мне нужно, чтобы эти файлы были доступны независимо от того, как пользователь обращается к приложению, через веб-приложение, приложение Windows Forms или любой другой уровень представления.

Есть ли способ поиска необработанного текстового содержимого этих полей? Например, если я загружаю резюме, я бы хотел, чтобы пользователь мог искать в C # и искать в указанном тексте поле varbinary.

Кроме того, если есть лучшая стратегия для решения этой проблемы, я открыт для этого.

Ответы [ 2 ]

3 голосов
/ 23 февраля 2010

Я бы сказал, что использование SQL Server является неподходящим инструментом для этой задачи (с точки зрения поиска), поскольку он не может анализировать текст, хранящийся в двоичном документе.

Я предлагаю поискать что-то вроде Lucene.NET (порт .NET поисковой системы Lucene ... изначально написанный на Java), что позволит вам легко осуществлять поиск по вашим документам после того, как они ' загружен.

Вы должны быть в состоянии разработать решение, которое позволит вам сохранить хранилище документов в SQL Server, но использовать Lucene.NET для индексирования и поиска документов, которые вы там хранили.

2 голосов
/ 23 февраля 2010

Вам нужен слой некоторого кода для извлечения типа и знания формата. Для SQL это просто необработанные данные

...