Как я могу получить сумму квадратов ошибок (SSE) из алгоритма k означает? - PullRequest
0 голосов
/ 07 декабря 2018

У меня есть фрейм данных с двумя столбцами и 450 строками.Сначала я должен запустить алгоритм K-средних с различными значениями k (т.е. k кластерами).И каждый раз, когда я запускаю разные значения k, мне нужно вычислять SSE.У меня есть только математическое уравнение.SSE рассчитывается путем возведения в квадрат каждой точки расстояния до соответствующего центроида кластеров, а затем суммирования всего.Так что в конце у меня должно быть SSE для каждого значения k.

Я попал в то место, где вы запускаете алгоритм k средних:

Data.kemans <- kmeans(data, centers = 3)

Как я могу получить SSE (сумму квадратов ошибок) из этого data.kmeans?

1 Ответ

0 голосов
/ 07 декабря 2018

Я думаю, что это возвращается kmeans.Документация гласит:

Значение

kmeans возвращает объект класса "kmeans", у которого есть печать и встроенный метод.Это список, по крайней мере, со следующими компонентами:

(...)

totss
Общая сумма квадратов.

в пределах
Векторсумма квадратов внутри кластера, один компонент на кластер.

tot.withinss
Общая сумма квадратов внутри кластера, т. е. сумма (в пределах).

междуss
Между-кластерная сумма квадратов, т.е. totss-tot.withinss.

Следовательно, Data.kmeans$withinss должен дать вам ответ, который вы ищете.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...