Склеарн: распространение аффинности на python - есть ли метод для вычисления ошибки в кластерах? - PullRequest
0 голосов
/ 08 февраля 2019

При просмотре документов для sklearn.cluster и Affinity Propagation я не вижу ничего, что могло бы вычислить ошибку в кластере.Это существует или это то, что я должен написать сам?

Обновление: позвольте мне предложить возможную идею:

С распространением сродства у нас есть матрица различий (то есть матрица, которая измеряет, насколько каждая строка отличается друг от друга).Когда AP закончен, у меня есть все назначения меток, к какому кластеру они принадлежат.Что если я взял измерение различий из матрицы?Например, скажем, в матрице 10x10 точка 3 - это мой кластер, а метка 4 назначена для примера 3. Различие между центроидом и меткой, например, -5.Допустим, этому центроиду присвоены еще две метки с различием -3 и -8 соответственно.Теперь, если я сказал, общая ошибка -16/3.Если у меня есть другой кластер с измерениями различий -2, -3, -2, -3, -2, -3 = -15/6.Это, кажется, обеспечивает измерение потенциальной ошибки.

1 Ответ

0 голосов
/ 09 февраля 2019

Я не думаю, что есть общепринятое определение "ошибки", которое имело бы смысл в контексте распространения сродства, которое представляет собой метод, основанный на подобии .

Работа с ошибкамихорошо с методами, основанными на координатах, такими как k-means, но на AP у нас может не быть координат.

...