Что означает кривая обучения в дереве решений по классификации? - PullRequest
0 голосов
/ 11 февраля 2019

Я использовал дерево решений классификации в моем анализе.Сначала я разбил все данные на обучение и тестирование - 60%: 40%.Затем я использовал GridSearch на своем тренировочном наборе, чтобы получить наилучшую оценочную модель (max_depth = 7).Затем я построил кривую обучения на множестве перекрестных проверок и обучающих наборах.Вот график, который я получил.Кажется, что две линии перекрываются.Так что это говорит мне?В моей модели нет переоснащения?И вообще, зачем нам кривая обучения в анализе?

Ссылка на мое изображение кривой обучения

Большое спасибо!

1 Ответ

0 голосов
/ 11 февраля 2019

Ваш график показывает точность как функцию количества обучающих примеров.Чем больше примеров обучения, тем больше точек данных обучения, на которых обучается модель.

Точность обучения - это показатель точности при проверке обученной модели на данных, на которых она обучалась.По сути, он проверяется на данных, которые он уже видел

При перекрестной проверке данные случайным образом разбиваются на наборы для обучения и тестирования.Модель обучается на тренировочном комплекте и тестируется на тестовом наборе.Показатель точности отражает то, насколько точно прогнозируется набор для тестирования.

Линии совпадают, потому что модель, вероятно, хорошо обучена: она так же хороша в предсказании того, чего раньше не видела, как и в вещах.это было обучено.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...