sql сервер полнотекстового поиска с опечатками - PullRequest
4 голосов
/ 21 апреля 2011

В настоящее время мы оцениваем несколько вариантов нечетких поисков.Одним из наших требований является соответствие опечаток.OCR CRA1G (с номером 1) должен совпадать с 'CRAIG'.

Полнотекстовый поиск на сервере sql, похоже, близок, но без сигары.

Существуют ли какие-либо опции, кроме 'FORMSOF(Inflectional, CRA1G) ', который мог бы сделать замену для этих типов несоответствий и все же получить результаты?

Я не могу найти ничего подобного. SOUNDEX определенно недостаточно хорош.

Iможет попробовать Lucene затем, который имеет хорошие возможности нечеткого поиска.

С уважением

Крейг.

Ответы [ 2 ]

3 голосов
/ 21 апреля 2011

SQL Server 2008 поддерживает тезаурусы, которые помогут вам добраться туда, куда вам нужно. Вы бы определили свои орфографические ошибки как синонимы. Смотри http://msdn.microsoft.com/en-us/library/ms142491.aspx.

Edit: Насколько я понимаю, вы не могли бы сделать это, используя подстановочный знак или подход регулярного выражения. Вам нужно будет определить общие шаблоны набора замены для ваших слов, которые, как вы ожидаете, будут чаще всего неправильно набираться.

2 голосов
/ 21 апреля 2011

Это может не помочь вам, но у нас была проблема с именами. На немецком языке есть много похожих названий: Bayer, Beyer, Baier звучат одинаково. Для этого мы создали отдельный столбец, используя фонетическое написание . Вы можете создать аналогичный алфавит для своей нечеткости, где «I» равно «1», и получить аналогичные результаты.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...