Я пытаюсь выполнить упражнение Титани c, проблема в том, что когда я пытаюсь сделать прогноз .. ошибка: Ошибка в model.frame.default (Термины, новые данные, na.action = na.omit, xlev = object $ xlevels): имя фактора имеет новые уровни Абельсет, мистер Олаус Йоргенсен, Аллисон, мистер Хадсон Джошуа Крейтон, Астор, полковник Джон Джейкоб, Битт ie, мистер Томсон , ..
В чем ошибка, которую я делаю..´?
Это маленький код:
library(nnet)
library(caret)
library(devtools)
ttrain <- read.csv("../../data/Titanic/titanic_train.csv", stringsAsFactors = F, na.strings = c("NA", ""))
ttest <- read.csv("../../data/Titanic/titanic_test.csv", stringsAsFactors = F, na.strings = c("NA", ""))
ttest$Survived<-NA
todo=rbind(ttrain, ttest)
head(ttrain)
set.seed(2018)
t.id = createDataPartition(ttrain$Survived, p =1, list=F)
x.id = createDataPartition(ttest$Survived, p =1, list=F)
summary(ttrain$Survived)
fit = nnet(Survived ~., data=ttrain[t.id,],
size = 6, decay = 0.1,
maxit = 1500, linout=T, MaxNWts = 10375)
#Converged at 430
#Bonus question
sqrt(mean((fit$fitted.values-ttrain[t.id,"Survived"])^2))
#Here is the problem..
pred = predict(fit, todo[-t.id,])