Я пытаюсь определить среднее значение кластеров, которые я назначил, используя cluster = sample(1:2,n,replace=T)
.Для n=50
и для функции x = rnorm(n), y=rnorm(n)
.
Затем я создал фрейм данных, чтобы я мог видеть x, y и его кластеры, которые назначены случайным образом.
data = data.frame(x,y,cluster)
Что тогда я получил результат:
x y cluster
1 -0.89691455 0.41765075 2
2 0.18484918 0.98175278 1
3 1.58784533 -0.39269536 1
4 -1.13037567 -1.03966898 1
5 -0.08025176 1.78222896 2
6 0.13242028 -2.31106908 2
7 0.70795473 0.87860458 2
8 -0.23969802 0.03580672 1
9 1.98447394 1.01282869 2
10 -0.13878701 0.43226515 2
Что я теперь хотел сделать, это получить среднее значение кластеров.То есть, что означает кластер 1 и 2?
Итак, что я сделал:
m1 = sum(data[data$C==1])/sum(data$cluster==1)
Что не дает мне желаемого значения.То, что я ожидал, было средним из всех значений x и y, объединенных в кластер 1 и 2.