Я понимаю вычисление кластерной ошибки в отношении точек данных, которые можно измерить как точку (т.е. 2,7 или -3,2, 3,4). Мы можем получить центроид с помощью следующего уравнения C = (X1 + X2 + X3) / 3, если кластер имеет три точки данных.Затем мы измеряем ошибку как расстояние точек данных от центроида.
Однако, если изображения кластеризованы, на самом деле не существует ни одной точки данных.Возможно, у нас есть измерение, например, яркость пикселя или оттенок пикселя.Затем нам нужно вычислить значение, которое наилучшим образом представляет либо картину в целом, либо ее области.Из этого значения я могу получить значение сходства со всеми другими значениями изображения в моем наборе данных.
Мой вопрос: я не знаю или не понимаю, откуда вычисляется ошибка для кластера изображений.Я знаю центр тяжести кластера (это будет конкретное изображение), но как рассчитать ошибку самого кластера?