В кластеризации k-средних уменьшается ли предельная сумма квадратов расстояний? - PullRequest
0 голосов
/ 16 апреля 2019

Предположим, у меня есть набор данных, и пусть SSD (n) будет суммой квадратов расстояний, когда мы предполагаем n кластеров. Мой вопрос заключается в следующем: всегда ли маргинальный SSD уменьшается в n. Другими словами, является ли функция f (n) определенной как

е (п) = SSD (п) -SSD (п + 1)

уменьшается в n. Это будет означать, что выгода от добавления каждого дополнительного кластера уменьшается. Я пытаюсь найти либо доказательство, либо простой контрпример.

Я провел несколько симуляций со случайными данными, и это всегда кажется правдой.

...