Я использую методы балансировки классов для наборов данных прогнозирования сбоев программного обеспечения. Соотношение значений класса должно составлять 20-80, то есть 20 процентов отказов и 80 процентов чистых модулей. Мой вопрос: если мы используем функции smote или rose на языке R, откуда эти методы знают, что идеальное соотношение составляет 20-80? Нужно ли вручную указывать это соотношение? Если мы должны указать это вручную, то почему один метод (smote) можно считать лучше другого метода (rose).
Я очень плохо знаком с балансировкой классов в языке R.