Рассчитать стандартное отклонение кластера точек данных - PullRequest
0 голосов
/ 30 апреля 2019

Итак, у меня есть список точек данных, в которых все они принадлежат кластеру (каждый элемент представляет собой массив с тремя функциями (представляющий точку)). Я вычисляю их центроид (среднее из точек). Я хочу рассчитать стандартное отклонение точки от центроида. Точнее говоря, я хочу выяснить, сколько стандартных отклонений от точки является точкой от центра тяжести кластера. Пожалуйста, помогите мне в кодировании.

Мой список точек данных выглядит примерно так

([- 5.75204079 8.78545302 8.00800119], ....)

1 Ответ

1 голос
/ 30 апреля 2019

Если точки данных в кластере хранятся в list, называемом data, следующий код будет вычислять standard deviation этого набора данных.

# Calculate mean
mean = sum(data)/len(data)

# Calculate sum of square of difference
# of data points from mean
dev = 0
for rec in data:
    dev += pow((rec - mean),2)

# Calculate variance
var = dev/len(data)

# Calculate standard deviation
std_dev = math.sqrt(var)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...