Я работаю над проблемой классификации машинного обучения, где набор данных разбалансирован. Я изучаю, как различные действия могут повлиять на производительность модели, и в данный момент я работаю с SVM.
Одним из действий, которое я хочу исследовать, является то, как передискретизация может улучшить или не улучшить производительность моего SVM.
Итак, я использую два разных случая StratifiedKFold. Один без передискретизации, а другой с передискретизацией. Оба эти случая инициализируются так:
kfold = StratifiedKFold(n_splits=5, shuffle=True, random_state=1)
Результаты, которые я получил от них обоих, чрезвычайно похожи друг на друга. Создает ли использование одного и того же номера random_state одинаковые разбиения для обоих случаев?