Существует ли такая вещь, как средство разбиения по словам SQL Server для венгерского языка? - PullRequest
2 голосов
/ 19 августа 2011

Я хочу использовать CONTAINS для полнотекстового индекса и использовать FORMSOF(...) для венгерских данных. Является ли это возможным? Я ЗНАЮ, что он не поддерживается по умолчанию в SQL Server.

1 Ответ

4 голосов
/ 19 августа 2011

SQL Server может загружать пользовательские средства разбиения по словам и парадигматические модули, см. Средства разбиения по словам и Stemmers . Если вы не можете найти венгерский стеммер, всегда есть возможность создать свой собственный: Word Breaker и Stemmer Sample , см. Также Как настроить собственный инструмент разбиения слов LRSAMPLE для работы на 64-битном SQL Server 2008 . Вам не нужно реализовывать словарь самостоятельно, вы можете просто повторно использовать, например, алгоритм libstemmer Hungarian Snowball и упаковать его в качестве основы SQL Server.

...