Что оценивает clf.score (X_train, Y_train) в дереве решений? - PullRequest
0 голосов
/ 03 мая 2019

Я новичок в машинном обучении, и сейчас делаю проект для моего финала. Я пытаюсь построить дерево решений и найти следующий код в Интернете.

Мой вопрос:

  • Что оценивает clf.score (X_train, Y_train) в дереве решений? Вывод на следующем скриншоте, мне интересно, для чего это значение?

    clf = DecisionTreeClassifier(max_depth=3).fit(X_train,Y_train) print("Training:"+str(clf.score(X_train,Y_train))) print("Test:"+str(clf.score(X_test,Y_test))) pred = clf.predict(X_train)

    Выход:

    enter image description here

  • И в следующем коде я думаю, что он рассчитывает несколько баллов для модели. Чем выше я установил max_depth, тем выше оценка. Это легко понять для меня. Тем не менее, мне интересно, в чем разница между этим числом и значением для обучения и теста на предыдущем скриншоте?

    enter image description here

  • Моя цель состоит в том, чтобы предсказать цену дома, вне зависимости от того, превышает ли она 20 КБ или нет. Какую оценку мне следует учитывать при выборе наиболее подходящей и простой модели?

1 Ответ

1 голос
/ 03 мая 2019

Как правильно указано в комментариях, это действительно средняя точность обучения;Вы уже должны были догадаться об этом, просто сравнив четыре разных результата на втором скриншоте с тренировочным на первом.Но в любом случае, и прежде чем приступить к открытию таких вопросов здесь, вам следует сначала обратиться к соответствующей документации , которая, вероятно, является вашим лучшим другом в подобных случаях.Цитирование из score метода scikit-learn DecisionTreeClassifier документы :

оценка (X, y, sample_weight = нет)

Возвращает среднюю точность данных испытаний и меток.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...