Я просматривал CRAN Random Forest и заметил, что перед подборкой модели код фактически вычитает среднее значение y из самого y.После подбора модели и прогнозирования код добавляет среднее значение к его прогнозам.Какова цель этого, и не приведет ли это к другим результатам, если мы не вычтем среднее?
ymean <- mean(y)
y <- y - ymean
ytest <- ytest - ymean
rfout <- .C("regRF",
x,
as.double(y),
...)
out <- list(call = cl,
type = "regression",
predicted = structure(ypred + ymean, names=x.row.names),
...