В чем разница между данными о поездах, испытаниях, валидации и ансамбле, смешанными данными и данными испытаний? - PullRequest
0 голосов
/ 27 апреля 2018

Помогите мне понять разницу между этими двумя фрагментами

1)

set.seed(123)
ss <- sample(1:3,size=nrow(dataframe),replace=TRUE,prob=c(0.6,0.2,0.2))
train <- mtcars[ss==1,]
test <- mtcars[ss==2,]
cvr <- mtcars[ss==3,]

Когда я пытаюсь использовать метод ансамбля

2)

# shuffle and split the data into three parts
set.seed(1234)
finaltrain <- finaltrain[sample(nrow(finaltrain)),]
split <- floor(nrow(finaltrain)/3)
ensembleData <- finaltrain[0:split,]
blenderData <- finaltrain[(split+1):(split*2),]
testingData <- finaltrain[(split*2+1):nrow(finaltrain),]

У меня вопрос при ансамбле, что я делаю по-другому? Я начинающий, помогите мне понять это.

1 Ответ

0 голосов
/ 11 мая 2018

Набор обучающих данных Раньше был похож на модель, набор данных, используемый для обучения модели (вес также смещен в случае нейронной сети) затем модель обучения этих данных.

обычно набор обучающих данных вставляется в формате .csv или .txt, если используемый вами язык программирования - python. и вы также можете использовать матрицу формы для набора данных, но изменения в кодировании должны быть изменены один за другим.

Набор данных проверки выборочные данные, используемые для объективной оценки подходящей модели в наборе обучающих данных проверка правильности набора используется для оценки данной модели.

Проверка набора данных какие тестовые наборы обычно используются для оценки конкурирующих моделей. например, например, при определении победителя в соревновании Kaggle, набор проверки выпускается одновременно с тренировочным набором, а тестовый набор фактически выпускается только после окончания соревнования. и это результат модели на тестовом наборе, чтобы определить победителя. // тестовые наборы обычно заполняются тщательно собранными данными, охватывающими различные классы, с которыми столкнется модель.

...