Хотите создать пользовательскую функцию в R-программировании для разделения данных на обучающие и тестируемые и возвращать выборку, обучающие и тестируемые из функции - PullRequest
0 голосов
/ 18 марта 2020
totalrows=nrow(x)
s=sample(seq(1,totalrows),0.7*totalrows)
train=x[s,]
test=x[-s,]

Как мне поместить эти данные в пользовательскую функцию, чтобы мне не пришлось повторять их, и когда я передаю прочитанный файл, он разделяет данные и возвращает выборку (и), обучает и данные испытаний?

1 Ответ

0 голосов
/ 19 марта 2020

Вы можете использовать эти функции для создания теста и набора поездов.

#Creating train set
create_train_split <- function(dataset){
library(caTools)
set.seed(123) 
split = sample.split(dataset, SplitRatio = 2/3)
training_set = subset(dataset, split == TRUE)
return(training_set)
}

#The same way creating test set
create_test_split <- function(dataset){
library(caTools)
set.seed(123) 
split = sample.split(dataset, SplitRatio = 2/3)
test_set = subset(dataset, split == FALSE)
return(test_set)
}

Вы можете вызвать эту функцию следующим образом

train_set = create_train_split(dataset)
test_set = create_test_split(dataset)

Вы можете редактировать splitRatio и установите для него соотношение, которое вы хотите, чтобы ваш набор данных.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...