Сходство кластеров - PullRequest
0 голосов
/ 23 марта 2020

Я выполнил К означает кластеризацию по данным и в итоге получил лучшее k = 12 с использованием кривой локтя и оценки силуэта. Теперь я хотел бы свернуть эти 12 кластеров в 7/8 кластеров, основываясь на некоторых показателях сходства. Я не хочу снова запускать K средних с k = 7/8, так как это нарушит распределение. Я хочу найти способ найти сходство кластеров между кластерами. Если какой-то балл предполагает, что кластер B и кластер C имеют 60% сходство, я бы хотел объединить кластер B и кластер C, так как один ан имеет кластер A как есть. Я боюсь, что, если я снова запусту средство K, несколько точек данных в кластере A могут перейти в кластер B. Может кто-нибудь предложить какие-либо показатели в python, которые могли бы помочь мне достичь этого.

...