Я подгоняю модель (очень упрощенную для воспроизводимой) примерно так:
библиотека (наборы данных)
библиотека (rstanarm)
set.seed(42)
rm(list = ls(all = TRUE))
prediction_data1 <- data.frame(
Petal.Length = 1.4
)
prediction_data2 <- data.frame(
Petal.Length = 1.4
)
model <- stan_glm(
Petal.Width ~ Petal.Length
, data = iris
, chains = 3
, iter = 1000
, warmup = 100
)
new_predictions1 <- as.data.frame(posterior_predict(model, newdata = prediction_data1))
new_predictions2 <- as.data.frame(posterior_predict(model, newdata = prediction_data2))
colnames(new_predictions1) <- c('Petal.Width')
colnames(new_predictions2) <- c('Petal.Width')
median(new_predictions1$Petal.Width)
median(new_predictions2$Petal.Width)
Полагаю, мне не следует ожидать одинаковой медианы для обоих одинаковых наборов данных имитации (например, 0,2216209 и 0,2177802)? Однако является ли приведенный выше скелетный код правильным подходом для моделирования различных сценариев (например, Petal.Length = 1,4 против Petal.Length = 2,4)?