У меня десять фреймов данных с одинаковым количеством строк и столбцов. Они выглядят так:
df1 <- data.frame(geneID=c("AKT1","AKT2","AKT3","ALK",
"APC"),
CDKN2A=c(3490,9447,4368,908,204),
INPP4B=c(NA,9459,4395,1030,NA),
BCL2=c(NA,9480,4441,1209,NA),
IRS2=c(NA,NA,4639,1807,NA),
HRAS=c(3887,9600,4691,1936,1723))
df2 <- data.frame(geneID=c("AKT1","AKT2","AKT3","ALK",
"APC"),
CDKN2A=c(10892,17829,7156,1325,387),
INPP4B=c(NA,17840,7185,1474,NA),
BCL2=c(NA,17845,7196,1526,NA),
IRS2=c(NA,NA,12426,10244,NA),
HRAS=c(11152,17988,7545,2734,2423))
df3 <- data.frame(geneID=c("AKT1","AKT2","AKT3","ALK",
"APC"),
CDKN2A=c(11376,17103,8580,780,178),
INPP4B=c(NA,17318,9001,2829,NA),
BCL2=c(NA,17124,8621,1141,NA),
IRS2=c(NA,NA,8658,1397,NA),
HRAS=c(11454,17155,8683,1545,1345))
Я хотел бы рассчитать z-оценку для каждого фрейма данных на основе среднего значения и дисперсии по нескольким фреймам данных. Z-оценка должна быть рассчитана следующим образом: z-оценка = (x-среднее (x)) / sd (x))).
Я обнаружил, что функция ddply для plyr может выполнять эту работу, но решение было для одного фрейма данных, в то время как у меня есть несколько фреймов данных в виде отдельных файлов с 18214 строками и 269 столбцами.
Буду признателен за любые предложения.
Большое спасибо за вашу помощь! Ольга