Я использую случайный лес, чтобы выполнить бинарную классификацию, размер теста 0,3, 5-кратное резюме, как для обучения, так и для теста, точность и отзыв превышают 99%, я перегружаюсь?
Убедитесь, что выборки из обучающих и тестовых наборов данных отличаются, и, возможно, попытайтесь использовать некоторые новые реальные образцы.
Если вы выполнили тестовый раздел 70-30 поездов и 5-кратное резюме только на наборе поездов. после этого получите точность 99% и вспомните тестовый набор, который вы прошли все шаги.
то, что вы можете проверить, это пропорция распределения данных в вашем тесте и разделении поездов. сделать среднее на вашем y_train и y_test. подтвердите, что вы получаете сопоставимые числа.