Не используйте predict
с какой-либо кластеризацией, кроме семейства k-средних.
Если вы делаете fit
, результат вычисляется с распространением сродства.
Если вы вызываетеpredict
, это , а не на самом деле делает AP .Вместо этого он просто находит ближайший образец для каждой точки.Это может или не может дать те же результаты, что вы наблюдали.Поскольку близкие точки, скорее всего, несут ответственность, у этого есть высокая вероятность быть правильным - но он не делает никакой формы сродства распространение , это - классификация ближайшего соседа к образцам.
k-означает хорошо, потому что он использует логику ближайшего центра.Но это обычно не относится к кластеризации.В общем, алгоритмы кластеризации не могут предсказать данные вне выборки;для этого вам нужен классификатор.