Предположим, у меня есть набор данных, и пусть SSD (n) будет суммой квадратов расстояний, когда мы предполагаем n кластеров. Мой вопрос заключается в следующем: всегда ли маргинальный SSD уменьшается в n. Другими словами, является ли функция f (n) определенной как
е (п) = SSD (п) -SSD (п + 1)
уменьшается в n. Это будет означать, что выгода от добавления каждого дополнительного кластера уменьшается. Я пытаюсь найти либо доказательство, либо простой контрпример.
Я провел несколько симуляций со случайными данными, и это всегда кажется правдой.