Один из способов расчета ошибки восстановления по заданному вектору - это вычисление евклидова расстояния между ним и его представлением. В K-средних каждый вектор представлен своим ближайшим центром.
Таким образом, после запуска k означает: для каждого вектора вычислить ошибку для вектора как евклидово расстояние между этим вектором и его центроидом. Суммируйте их по ошибкам для каждого вектора, и у вас есть ошибка в вашем тренировочном наборе. Чем меньше ошибок, тем лучше кластеризация в целом.
Действительно, алгоритм K-Means сам пытается оптимизировать эту самую метрику, и если вы дадите ему работать до сходимости, он найдет локальный минимум для ошибки восстановления евклидова расстояния.