Получить частоты слов из полнотекстового поиска SQL Server - PullRequest
18 голосов
/ 29 апреля 2010

Полнотекстовый поиск SQL Server вычисляет ранг на основе частоты слова в документе и в наборе всех документов (TFIDF). Можно ли получить доступ к этим значениям напрямую?

Я хотел бы найти топ-n наиболее часто встречающихся слов в моей таблице. Можно ли получить этот список из индекса полнотекстового поиска?

Я использую SQL Server 2005.

Ответы [ 2 ]

15 голосов
/ 24 мая 2011

Я не знаю простого способа сделать это на SQL Server 2005, но в 2008 году две команды Transact-SQL делают именно то, что вам нужно.

0 голосов
/ 24 мая 2011

Я не работал с полнотекстовым поиском, но раньше я достиг аналогичного результата, используя процедуру на основе таблицы чисел для разделения входного текста на отдельные слова (множество примеров того, как это сделать, доступно в других местах) и запуск агрегатных функций по отношению к результатам. На самом деле быстрее, чем вы ожидаете.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...