Я пытаюсь настроить свой случайный классификатор леса. Когда я использую GridSearchCV
, лучшие параметры - min_samples_split = 2
, min_samples_leaf = 4
, max_depth = None
, что, на мой взгляд, определенно является перебором. Поэтому я рисую au c как для данных обучения, так и для данных тестирования:
AU C vs глубина
График показывает, что по мере увеличения max_depth
будут увеличиваться как train_au c, так и test_au c; имеет ли этот график смысл? Потому что я думаю, что в какой-то момент, когда мы увеличим глубину, производительность данных тестирования фактически упадет на go.