Несбалансированные данные и перекрестная проверка - PullRequest
0 голосов
/ 14 февраля 2019

Я хотел бы знать, существует ли автоматический способ обработки несбалансированных данных.Допустим, это проблема двоичной классификации, и я хочу использовать перекрестную проверку, например, kfolds.

Знаете ли вы, существует ли какой-либо метод перекрестной проверки, который не только случайным образом перемешивает данные, но ипытается "сбалансировать" метки в наборе поездов, чтобы он составлял 50% -50%?Это помогло бы не получать высокие оценки точности только потому, что в модель внесены более высокие изменения, чтобы выучить больше очков из определенного класса.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...