Можно ли в mlr3 прогнозировать новые данные без переподготовки модели? - PullRequest
0 голосов
/ 03 мая 2020

Пример с ирисом. У нас есть некоторые данные, называемые tr.

df = iris
set.seed(1)
sp = sample(nrow(iris), 0.7*nrow(iris))
tr = df[sp,]
newdata = df[-sp,]

Мы строим модель в mlr3 с данными, которые у нас есть:

tsk = TaskClassif$new(id="A", backend=tr, target="Species")
lrn = mlr_learners$get("classif.rpart")
train_set <- sample(tsk$nrow, 0.8*tsk$nrow)
test_set <- setdiff(seq_len(tsk$nrow), train_set)
# train the model
lrn$train(tsk, row_ids = train_set)
# predict data
pred <- lrn$predict(tsk, row_ids = test_set)

Теперь я хочу предсказать новые данные с помощью построенной мной модели. , но я нахожу только row_ids в качестве аргумента для прогнозирования. Набор данных newdata не имеет row_ids в tsk. Я знаю, что могу включить эти данные в модель и переобучиться. Но мой вопрос: есть ли способ предсказать без переподготовки ТСК?

Спасибо!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...