Я обучаю модель случайного леса и использую постоянное значение random_state
. Я также получаю очень хорошую точность по всем наборам данных для обучения, тестирования и проверки (все около ~ .98). Хотя класс меньшинства составляет всего ~ 10% набора данных.
Вот код, если вам интересно:
model = RandomForestClassifier(n_jobs=-1, oob_score=True, random_state=310, n_estimators=300)
model.fit(subset, train.iloc[:,-1])
Учитывая хорошие оценки точности по наборам данных обучения, проверки и тестирования, влияет ли random_state
на обобщение моей модели?