Как рассчитать ошибку реконструкции? - PullRequest
0 голосов
/ 02 июня 2011

Как рассчитать ошибку реконструкции и где найти информацию о ней? (Я вычислю ошибку восстановления моих данных после алгоритма K-средних)

Ответы [ 2 ]

1 голос
/ 08 сентября 2011

Необходим для расчета расстояния между точками до центральных точек в каждом кластере.

0 голосов
/ 02 июня 2011

Один из способов расчета ошибки восстановления по заданному вектору - это вычисление евклидова расстояния между ним и его представлением. В K-средних каждый вектор представлен своим ближайшим центром.

Таким образом, после запуска k означает: для каждого вектора вычислить ошибку для вектора как евклидово расстояние между этим вектором и его центроидом. Суммируйте их по ошибкам для каждого вектора, и у вас есть ошибка в вашем тренировочном наборе. Чем меньше ошибок, тем лучше кластеризация в целом.

Действительно, алгоритм K-Means сам пытается оптимизировать эту самую метрику, и если вы дадите ему работать до сходимости, он найдет локальный минимум для ошибки восстановления евклидова расстояния.

...