Я провел несколько экспериментов, используя CreateDataPartition в R, чтобы разделить данные поезда и теста. Я повторил результаты примерно 500 раз и сделал это на одном ноутбуке. Когда я пытался повторить эксперименты на другом ноутбуке с тем же кодом и данными, это дало мне очень разные результаты и не близко к тому, что у меня было раньше. Я предполагаю, что это может быть связано с исходной проблемой, и я пытаюсь выяснить, как справиться с этим, чтобы я мог воспроизвести по крайней мере почти те же результаты, что и раньше. Любые предложения?
Ниже приведен снимок того, как я делю данные поезда и теста:
for (i in 1:500){
set.seed(i)
index = createDataPartition(data$S, p=.75,list=FALSE,times=1)
train = data[index,]
test= data[-index,]