Добро пожаловать в Stackoverflow!
- В соглашении
R
вы должны придерживаться оператора <-
для большинства типов заданий (вы можете найти больше информации здесь и здесь ). - Размещенный вами код / вывод действительно неполный (например, вывод после первой строки
length(DataFile)
отсутствует).
Давайте пройдем этот шаг за шагом.
1.Создать фиктивные данные
set.seed(1701)
DataFile <- sample(seq(0, 1, 0.01), 10000, replace = TRUE)
2.Создайте набор данных
# This randomizes the order
DataSet <- sample(DataFile)
3.Сплит поезд и тест
split <- length(DataSet) * 0.7
# You use length() for one-dimensional objects, and
# nrow() for matrices, tables, etc.
DataTrain <- head(DataSet, split)
DataTest <- tail(DataSet, length(DataSet) - split)
# This approach avoids rounding errors when splitting and
# as our dataset is already randomized we can sample linearly.
4.Рассчитать среднее
> mean(DataTrain)
[1] 0.5029891
> mean(DataTest)
[1] 0.496056