Ошибка передачи файла Kaggle (Сантандерское Предсказание Значения) - PullRequest
0 голосов
/ 27 июня 2018

Ошибка при получении:

ERROR: The value '7.63E+15' in the key column 'ID' has already been defined (Line 23029, Column 1).

Ссылка на вызов: https://www.kaggle.com/c/santander-value-prediction-challenge.

Заголовок файла представления:

          ID         target
0      000137c73  5.944923e+06
1      00021489f  5.944923e+06
2      0004d7953  5.944923e+06
3      00056a333  5.944923e+06
4      00056d8eb  5.944923e+06

1 Ответ

0 голосов
/ 02 августа 2018

Полагаю, вы использовали Excel или LibreOffice Calc. Открытие файла в Excel для просмотра вывода свернет ваш формат. Как правило, лучше всего избегать Excel. Вы используете Python? Проще всего загрузить образец представления, заменить целевой столбец и сохранить:

ss = pd.read_csv('sample_submission.csv')
ss.loc[:, 'target'] = preds

ss.to_csv('sub.csv',
      index=False)
...