Я впервые участвую в соревнованиях по борьбе, и у меня возникают проблемы с отправкой таблицы результатов.Я сделал свою модель, используя gbm, и создал таблицу прогнозов, как показано ниже.файл представления содержит 2 столбца с именами «fullVisitorId» и «PredictedLogRevenue»), как и любые другие случаи конкуренции с kaggle.
pred_oob = predict(object = model_gbm, newdata = te_df, type = 'response')
mysub = data.frame(fullVisitorId = test$fullVisitorId, Pred = pred_oob)
mysub = mysub %>%
group_by(fullVisitorId) %>%
summarise(Predicted = sum(Pred))
submission = read.csv('sample_submission.csv')
mysub = submission %>%
left_join(mysub, by = 'fullVisitorId')
mysub$PredictedLogRevenue = NULL
names(mysub) = names(submission)
Но когда я пытаюсь отправить файл, я получаю сообщение «fail», говорящее ...
ERROR: The value '8.893887e+17' in the key column 'fullVisitorId' has already been defined (Line 549026, Column 1)
ERROR: The value '8.895317e+18' in the key column 'fullVisitorId' has already been defined (Line 549126, Column 1)
ERROR: The value '8.895317e+18' in the key column 'fullVisitorId' has already been defined (Line 549127, Column 1)
Не только 3 строки, но еще 8 строк, как это.Я понятия не имею, что я сделал не так.Я также проверил другие ядра, но не смог найти ответ.Пожалуйста помоги!!