Кстати, алгоритм кластеризации Fuzzy-C-Means (FCM) также известен как Soft K-Means .
Целевые функции практически идентичны , единственное отличие заключается во введении вектора, который выражает процент принадлежности данной точки к каждому из кластеров. Этот вектор представлен показателю «жесткости», целью которого является придание большего значения более сильным связям (и наоборот, минимизация веса более слабых); кстати, когда коэффициент жесткости стремится к бесконечности, результирующий вектор становится двоичной матрицей, что делает модель FCM идентичной модели K-средних.
Я думаю, что за исключением некоторой возможной проблемы с кластерами, которым не назначены точки, можно эмулировать алгоритм K-средних с алгоритмом FCM, моделируя бесконечный коэффициент жесткости (= путем введения функция, которая изменяет наибольшее значение в векторе на 1 и обнуляет другие значения вместо возведения в степень вектора). Это, конечно, очень неэффективный способ запуска K-средних, потому что алгоритм должен выполнить столько же операций, сколько и с истинным FCM (если только со значениями 1 и 0, что упрощает арифметику, но не сложность)
Что касается производительности , то FCM, следовательно, должен выполнить k (то есть количество кластеров) умножений для каждой точки для каждого измерения (не считая также возведения в степень для учета жесткости). Это, плюс накладные расходы, необходимые для вычисления и управления вектором близости, объясняет, почему FCM работает намного медленнее, чем обычные K-средние.
Но FCM / Soft-K-Means менее «глупы», чем Hard-K-Means, когда речь идет, например, о вытянутых кластерах (когда точки, в других отношениях совместимые в других измерениях, имеют тенденцию рассеиваться вдоль определенного измерения или двух), и вот почему это все еще вокруг; -)
Из моего оригинального ответа:
Кроме того, я только что подумал об этом, но не придумал никакой «математической» мысли, что FCM может сходиться быстрее, чем жесткие K-средние, что несколько компенсирует большие вычислительные требования FCM.
Май 2018 г. отредактировано:
На самом деле нет авторитетного исследования, которое бы я мог определить, которое бы поддержало мою догадку о более высокой скорости сходимости FCM. Спасибо Бенджамин Хорн , чтобы сохранить меня честным; -)