У меня есть 5 столбцов пустышки, представляющих 5 категорий.Я использую 3 модели классификации, но получил такое же среднее значение оценки перекрестной проверки.Интересно, возможно ли это?
Мой код указан ниже,
from sklearn.model_selection import train_test_split
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=1/3, random_state=88888)
cvL = cross_val_score(LogisticRegression(), x_test, y_test,cv=5)
cvD = cross_val_score(DecisionTreeClassifier(max_depth=5), x_test, y_test,cv=5)
cvF = cross_val_score(RandomForestClassifier(n_estimators=10), x_test, y_test,cv=5)
I get the same score for all 3 model, which is
array([0.78125 , 0.78125 , 0.77777778, 0.77777778, 0.77777778])
Мои вопросы:
- Возможен ли этот результат?Если да, то как узнать, какую модель выбрать?
- Когда я меняю случайное состояние в test_train_split, я мог бы иногда получать разные оценки для другой модели, но это случается редко, и я не знаю, какое случайное состояние мне следует выбрать.
- Почему я получаю одинаковый балл за выборку с 3-го по 5-й, что составляет 0,7777777778