Итак, ошибка выдается функцией dtree.fit(xtrain, ytrain)
, потому что xtrain
и ytrain
имеют неодинаковую длину.
Проверка части кода, которая его генерирует:
xtrain,ytrain,xtest,ytest=traintestsplit(c,d,testsize=0.30)
и сравнение с примером в документации
import numpy as np
from sklearn.model_selection import train_test_split
[...]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, random_state=42)
Вы можете видеть две вещи:
1 traintestsplit
должно быть train_test_split
2, изменяя порядок переменных слева от =
, вы назначаете разные данные этим переменным.
Итак, ваш код должен быть:
xtrain, xtest, ytrain, ytest = train_test_split(c,d,testsize=0.30)