Что я должен проверить, если модель имеет очень хорошие оценки как для поезда, так и для теста? - PullRequest
0 голосов
/ 04 апреля 2019

Я использую случайный лес, чтобы выполнить бинарную классификацию, размер теста 0,3, 5-кратное резюме, как для обучения, так и для теста, точность и отзыв превышают 99%, я перегружаюсь?

Ответы [ 2 ]

0 голосов
/ 04 апреля 2019

Убедитесь, что выборки из обучающих и тестовых наборов данных отличаются, и, возможно, попытайтесь использовать некоторые новые реальные образцы.

0 голосов
/ 04 апреля 2019

Если вы выполнили тестовый раздел 70-30 поездов и 5-кратное резюме только на наборе поездов. после этого получите точность 99% и вспомните тестовый набор, который вы прошли все шаги.

то, что вы можете проверить, это пропорция распределения данных в вашем тесте и разделении поездов. сделать среднее на вашем y_train и y_test. подтвердите, что вы получаете сопоставимые числа.

...