Проблема с копированием результатов эксперимента - PullRequest
0 голосов
/ 12 февраля 2020

Я провел несколько экспериментов, используя CreateDataPartition в R, чтобы разделить данные поезда и теста. Я повторил результаты примерно 500 раз и сделал это на одном ноутбуке. Когда я пытался повторить эксперименты на другом ноутбуке с тем же кодом и данными, это дало мне очень разные результаты и не близко к тому, что у меня было раньше. Я предполагаю, что это может быть связано с исходной проблемой, и я пытаюсь выяснить, как справиться с этим, чтобы я мог воспроизвести по крайней мере почти те же результаты, что и раньше. Любые предложения?

Ниже приведен снимок того, как я делю данные поезда и теста:

for (i in 1:500){ 
  set.seed(i)
  index = createDataPartition(data$S, p=.75,list=FALSE,times=1)
  train = data[index,]
  test= data[-index,]

1 Ответ

0 голосов
/ 19 февраля 2020

Исходя из того, что я понимаю, вы можете попробовать эти вещи:

У меня была похожая проблема, результаты модели различаются на двух машинах. Вы проверили параметры (если вы строите модель по умолчанию, вы можете получить разные параметры на каждой машине) и версию модели, которую вы строите.

Если вы считаете, что в разделении «Поезд и тест» есть ошибка ( что не случилось со мной, создайте фиктивный столбец с 1-n строками на двух машинах, разделите их с одинаковым кодом и сделайте пересечение фиктивного столбца, вы будете уверены, что обучение и тестирование работают правильно)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...