Я хотел бы знать, существует ли автоматический способ обработки несбалансированных данных.Допустим, это проблема двоичной классификации, и я хочу использовать перекрестную проверку, например, kfolds.
Знаете ли вы, существует ли какой-либо метод перекрестной проверки, который не только случайным образом перемешивает данные, но ипытается "сбалансировать" метки в наборе поездов, чтобы он составлял 50% -50%?Это помогло бы не получать высокие оценки точности только потому, что в модель внесены более высокие изменения, чтобы выучить больше очков из определенного класса.