Кластеризация путем присвоения весов атрибутам - PullRequest
0 голосов
/ 23 ноября 2011

У меня есть набор данных в таблице Excel, который мне нужно сгруппировать, назначив веса. Как мне это сделать?

1 Ответ

1 голос
/ 01 декабря 2011

Вы можете определить функцию, которая вычисляет расстояние между двумя точками по весам атрибутов.Примером этого может быть взвешенное евклидово расстояние

В частности, если для каждой точки в вашем наборе данных имеется k атрибутов и если соответствующие веса для атрибутов равны d1, d2, .., dk, то расстояние между двумя точками Xи Y равно

d (X, Y) = сумма (di * (Xi-Yi) ^ 2) i = 1,2..k, где Xi - значение i-го атрибута для точки X.

Если веса обратны дисперсии атрибута, она уменьшается до расстояния Махаланобиса

http://en.wikipedia.org/wiki/Mahalanobis_distance

После определения функции расстояния вы можете использовать K-средних для кластеризацииваши данные.

...