[Я думаю, что у вас есть строки / столбцы назад здесь.z-оценки обычно применяются к переменным, которые R должен был бы ожидать в столбцах.То, что я пишу ниже, следует обычному соглашению.Измените соответственно, если вы действительно хотите стандартизировать по строкам.]
sweep()
- ваш универсальный друг.Мы вычисляем средние значения и стандартные отклонения, а затем вычеркиваем (вычитаем в этом случае) их из кадра данных df1
:
## compute column means and sd
mns <- colMeans(df2) ## rowMeans if by rows
sds <- apply(df2, 2, sd) ## 2 -> 1 if by rows
## Subtract the respective mean from each column
df3 <- sweep(df1, 2, mns, "-") ## 2 -> 1 if by rows
## Divide by the respective sd
df3 <- sweep(df3, 2, sds, "/") ## 2 -> 1 if by rows
, что дает:
R> df3
V1 V2 V3 V4 V5
1 -30 -30 -30 -30 -30
2 -29 -29 -29 -29 -29
3 -28 -28 -28 -28 -28
Мы можем проверитьэто сработало, выполнив вычисления для первого столбца df3
в векторизованном виде:
R> (df1[,1] - mean(df2[,1])) / sd(df2[,1])
[1] -30 -29 -28
Для этой конкретной ситуации можно также использовать функцию scale()
и указать собственную center
и scale
, соответствующие средства и стандартные отклонения
R> scale(df1, center = mns, scale = sds)
V1 V2 V3 V4 V5
[1,] -30 -30 -30 -30 -30
[2,] -29 -29 -29 -29 -29
[3,] -28 -28 -28 -28 -28
attr(,"scaled:center")
V1 V2 V3 V4 V5
31 34 37 40 43
attr(,"scaled:scale")
V1 V2 V3 V4 V5
1 1 1 1 1