Я получаю сообщение об ошибке: «Ошибка: для переменной 'date' был указан тип« other », но был указан тип« numeri c »»
Я пытаюсь предсказать ожидаемую дату для моего подходящей модели, но кажется, что это может быть категориальная проблема с моим набором данных, но я не знаю где.
Вопрос 2 предсказывает положительные случаи от 3-30 до 4-8 и предсказанные преобразованные интервалы ** потребность для сравнения с исходным масштабом
pred_data = data[data$date>="2020-03-30" & data$date<="2020-04-08",]
pred_data$pos_trans = (pred_data$positive^lam-1)/lam
pred_data$pred = predict(fit_trans,newdata = pred_data)
predict(fit_trans, newdata = pred_data,interval = "predict")
pred_data
data_Test$pos_trans_pred = predict(fit_trans, newdata = data_Test)
pred_error = data_Test$pos_trans_pred-data_Test$pos_trans
pred_error_trans = mean(pred_error^2)
pred_error_trans
pred_error
plot(US$date, US$pos_trans,ylim = c(25,125))
lines(data_Train$date,fit_trans$fitted.values,col=2)
lines(data_Test$date, data_Test$pos_trans_pred, col=3)
Ошибка: переменная 'date' соответствовала типу «other», но был указан тип «numeri c»
Моя первоначальная дата начала следующая:
##Model w/3/16-29
##Train 3/16-3/29
##Test 3/30-4/8
library(data.table)
data = fread('https://covidtracking.com/api/us/daily.csv',data.table=FALSE)
days = 24
loc = which(data[,1]=='20200408')
US = data[loc:(loc+days-1),c(1,3)]
US$date = as.Date(as.character(US$date), format = '%Y%m%d')
fit = lm(positive ~ date, data = US)
train_Ind = 11:24
data_Train = US[train_Ind,]
data_Test = US[-train_Ind,]
fit = lm(positive ~ date, data = data_Train)
library(MASS)
boxcox_fit = boxcox(fit)
lam = boxcox_fit$x[which.max(boxcox_fit$y)]
data_Train$pos_trans = (data_Train$positive^lam-1)/lam
data_Test$pos_trans = (data_Test$positive^lam-1)/lam
US$pos_trans = (US$positive^lam-1)/lam
fit_trans = lm(pos_trans ~ date, data = data_Train)