Вы звучите немного смущенно ...
Ваш predictions.csv
выглядит так:
TARGET Predictions
1 0
0 0
0 0
0 0
и, как я предполагаю из названий столбцов, он содержит основную истину (TARGET
) и Predictions
некоторых (?) Уже запущенных моделей.
Учитывая, что то, что вы делаете в своем опубликованном коде, абсолютно не имеет никакого смысла вообще: вы используете оба этих столбца как функции в вашем X
, чтобы предсказать ваш y
, который это ... точно один из тех же столбцов (Predictions
), который уже содержится в вашем X
...
Ваш график выглядит «странно» просто потому, что вы изобразили , а не ваши точки данных, а данные X
и y
, которые вы здесь видите, являются , а не данными. это следует использовать для подгонки вашего классификатора.
Я еще больше озадачен, потому что в вашем связанном репо у вас действительно правильная процедура в вашем скрипте:
autism = pd.read_csv('10-features-uns.csv')
x = autism.drop(['TARGET'], axis = 1)
y = autism['TARGET']
x_train, X_test, y_train, y_test = train_test_split(x, y, test_size = 0.30, random_state=1)
т.е. чтение ваших функций и меток с 10-features-uns.csv
и, конечно, , а не с predictions.csv
, как вы необъяснимо пытаетесь сделать здесь ...