Question

У меня есть следующие данные:

a=c(1:10)
b=c(16:25)
c=c(24:33)
wa=c(3,7,3,3,3,3,3,3,3,1)
wb=c(3,2,3,3,3,3,3,3,3,8)
wc=c(4,1,4,4,4,4,4,4,4,1)
z=data.frame(a,b,c,wa,wb,wc)

Я хочу получить средневзвешенное значение для каждой записи.Итак, я попробовал это:

weight=apply(subset(z,select=c(wa,wb,wc)),1,function(x) x)
z$weightMean=apply(subset(z,select=c(a,b,c)),1,function(x) weighted.mean(x,weight))

, который возвратил следующее сообщение об ошибке:

Error in weighted.mean.default(x, weight) : 
  'x' and 'w' must have the same length

Итак, я попробовал это:

weight=as.vector(weight)
z$weightMean=apply(subset(z,select=c(a,b,c)),1,function(x) weighted.mean(x,weight))

Который также вернул то же самоеошибка.

Что я делаю не так?

Chase · Answer 1 · 26 марта 2012

Это, кажется, делает трюк:

> apply(z, 1, function(x) weighted.mean(x[1:3], x[4:6]))
 [1] 14.7  7.3 16.7 17.7 18.7 19.7 20.7 21.7 22.7 24.3

Вероятно, это будет немного быстрее, хотя и менее понятно, что происходит:

> rowSums(z[,1:3] * z[,4:6]) / rowSums(z[,4:6])
 [1] 14.7  7.3 16.7 17.7 18.7 19.7 20.7 21.7 22.7 24.3

Взвешенное среднее по строке

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.