Получу ли я одинаковые разбиения, если использую одно и то же случайное состояние в двух разных перекрестных проверках? - PullRequest
0 голосов
/ 08 апреля 2020

Я работаю над проблемой классификации машинного обучения, где набор данных разбалансирован. Я изучаю, как различные действия могут повлиять на производительность модели, и в данный момент я работаю с SVM.

Одним из действий, которое я хочу исследовать, является то, как передискретизация может улучшить или не улучшить производительность моего SVM.

Итак, я использую два разных случая StratifiedKFold. Один без передискретизации, а другой с передискретизацией. Оба эти случая инициализируются так:

kfold = StratifiedKFold(n_splits=5, shuffle=True, random_state=1)

Результаты, которые я получил от них обоих, чрезвычайно похожи друг на друга. Создает ли использование одного и того же номера random_state одинаковые разбиения для обоих случаев?

...