Я пишу простую функцию в R для вычисления несмещенного RMSE (ubrmse) с учетом набора наблюдаемых и ожидаемых значений.До сих пор у меня была следующая функция:
library(hydroGOF)
ubRMSE <- function(obs, exp) {
#Combine the observed and expected data into data frame
newDf <- cbind.data.frame(obs, exp)
#Remove any rows containing NA values
newDf <- newDf[complete.cases(newDf), ]
#Calculate r
r <- as.data.frame(gof(sim = newDf[,2], obs = newDf[,1], digit = 4))
r <- r[16,1]
#Calculate ubRMSE
ubRMSEStat <- sqrt(var(newDf[,2]) + var(newDf[,1]) - 2 * r *
sd(newDf[,2]) * sd(newDf[,1]))
return(ubRMSEStat)
}
Кто-нибудь может мне сказать, правильны ли и функция, и формула для несмещенного RMSE?Формула была взята из следующей публикации https://pubag.nal.usda.gov/download/60040/PDF. Я не сталкивался с какими-либо пакетами, которые включают формулу для несмещенного RMSE (hydroGOF, tdr), хотя многие организации, кажется, используют метрику.
ВКроме того, в статье, как представляется, операторы оценки.Может ли это просто рассматриваться как среднее оценочное значение влажности почвы для данного дня, или это нужно учитывать больше?
Cheers,
Matt
* Редактировать: Пунктуация, теги, формула и добавленная цитата