Для цикла в цикле? - PullRequest
       23

Для цикла в цикле?

1 голос
/ 02 августа 2011

У меня есть два кадра данных:

df1<- as.data.frame(matrix(1:15, ncol=5))
df2<- as.data.frame(matrix(30:44,ncol=5))

Используя два кадра данных, я хочу вычислить zscore. Функции:

z = (X - u)/ O

df1 содержит все значения X, а каждая строка кадра данных df2 содержит значения для вычисления среднего значения и sd. Я генерирую цикл, который вычисляет для каждого значения в первом столбце df1 z балл. Но теперь мой вопрос: как я могу вычислить z-оценку для всего кадра данных?

test <- list()
for (i in 1:nrow(df1) {
  zscore<- (df1[i,1] - (apply(df2[i,],1,mean))) / (apply(df2[i,],1,sd))
  test[[i]] <- matrix(zscore)
  i <- 1+1
}

Спасибо всем!

1 Ответ

8 голосов
/ 02 августа 2011

[Я думаю, что у вас есть строки / столбцы назад здесь.z-оценки обычно применяются к переменным, которые R должен был бы ожидать в столбцах.То, что я пишу ниже, следует обычному соглашению.Измените соответственно, если вы действительно хотите стандартизировать по строкам.]

sweep() - ваш универсальный друг.Мы вычисляем средние значения и стандартные отклонения, а затем вычеркиваем (вычитаем в этом случае) их из кадра данных df1:

## compute column means and sd
mns <- colMeans(df2)     ## rowMeans if by rows
sds <- apply(df2, 2, sd) ## 2 -> 1 if by rows

## Subtract the respective mean from each column
df3 <- sweep(df1, 2, mns, "-")  ## 2 -> 1 if by rows
## Divide by the respective sd
df3 <- sweep(df3, 2, sds, "/")  ## 2 -> 1 if by rows

, что дает:

R> df3
   V1  V2  V3  V4  V5
1 -30 -30 -30 -30 -30
2 -29 -29 -29 -29 -29
3 -28 -28 -28 -28 -28

Мы можем проверитьэто сработало, выполнив вычисления для первого столбца df3 в векторизованном виде:

R> (df1[,1] - mean(df2[,1])) / sd(df2[,1])
[1] -30 -29 -28

Для этой конкретной ситуации можно также использовать функцию scale() и указать собственную centerи scale, соответствующие средства и стандартные отклонения

R> scale(df1, center = mns, scale = sds)
      V1  V2  V3  V4  V5
[1,] -30 -30 -30 -30 -30
[2,] -29 -29 -29 -29 -29
[3,] -28 -28 -28 -28 -28
attr(,"scaled:center")
V1 V2 V3 V4 V5 
31 34 37 40 43 
attr(,"scaled:scale")
V1 V2 V3 V4 V5 
 1  1  1  1  1
...