Я пытаюсь найти лучший способ реализации сложного алгоритма для хранимой информации в реляционной БД.
В частности: я хочу реализовать вариант алгоритма k-средних (алгоритм кластеризации документов) в большой базе данных MS SQL Server, содержащей векторы TFxIDF многих документов (эти векторы используются в качестве входных данных для алгоритма).
Моей первой мыслью было выполнение всего этого в SQL с использованием хранимых процедур, функций, представлений и всех других основных инструментов SQL Server, но потом я подумал, что, возможно, мне следует написать управляемый код (я свободно владею C #), выполняется на сервере SQL.
Производительность является проблемой здесь, поэтому я должен принять это во внимание также.
Буду признателен за любые советы о том пути, по которому я должен идти.
Спасибо!