Мне трудно понять, почему я получаю высокий балл за поезд, но отрицательный результат теста. Если у кого-то есть понимание того, что может быть причиной этой проблемы, это было бы здорово.
a=tayko['Purchase']==1
purchased=tayko[a]
purchased.head()
X2,y2=purchased.iloc[:,17:22],purchased.iloc[:,-1]
X_dum2=pd.get_dummies(X2)
X_dum2.head()
X_train2, X_test2, y_train2, y_test2=train_test_split(X_dum2,y2,random_state=0)
dtr=DecisionTreeRegressor(random_state=0)
dtr.fit(X_train2,y_train2)
print('Decision tree acc on train: {:.2%}'.format(dtr.score(X_train2,y_train2)))
print('Decision tree acc on test: {:.2%}'.format(dtr.score(X_test2,y_test2)))
Это приводит к выводу
Decision tree acc on train: 99.64%
Decision tree acc on test: -13.30%
Любые идеи о том, как исправить? Спасибо.