SciKit Классификационная метрика - PullRequest
0 голосов
/ 19 мая 2019

Я запускаю случайный лес и повышение градиента с помощью sklearn для задачи классификации. Я получил точность классификации: 0,770 (0,048), что означает число в скобках?

models = []
models.append(('DT', DecisionTreeClassifier(criterion = "gini", random_state = 10,
               max_depth=3, min_samples_leaf=2)))

models.append(('RF', RandomForestClassifier(n_estimators=500, criterion='gini', max_features='auto',min_samples_split=2)))

models.append(('XT', ExtraTreesClassifier(n_estimators=500,max_features= 8,criterion= 'entropy',min_samples_split= 2,
                                          max_depth= 5, min_samples_leaf= 3)))

models.append(('GB', GradientBoostingClassifier(learning_rate=0.1,n_estimators=700, min_samples_split=2,min_samples_leaf=3,max_depth=4,
                                                max_features='sqrt',subsample=0.6,random_state=10)))

models.append(('ADB', AdaBoostClassifier(n_estimators=500,learning_rate=0.2,random_state=0)))

# evaluate each model in turn
results = []
names = []
for name, model in models:
    kfold = model_selection.KFold(n_splits=10, random_state=seed)
    cv_results = model_selection.cross_val_score(model, x_train, Y_train, cv=kfold, scoring=scoring)
    results.append(cv_results)
    names.append(name)
    msg = "%s: %f (%f)" % (name, cv_results.mean(), cv_results.std())
    print(msg)

1 Ответ

1 голос
/ 19 мая 2019

Вы выполняете 10-кратную перекрестную проверку.

Число в скобках - это стандартное отклонение точности модели для всех 10 сгибов. Это происходит из следующей строки кода:

msg = "%s: %f (%f)" % (name, cv_results.mean(), cv_results.std())
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...