Как работать с несбалансированными наборами данных в обобщенных моделях ускоренной регрессии с использованием gbm? - PullRequest
0 голосов
/ 10 июня 2018

Я хотел бы знать, есть ли способ работать с несбалансированными наборами данных с обобщенными моделями ускоренной регрессии.Я использую пакет gbm.

У меня есть 7 групп с разным количеством сайтов и образцов (например, группа A: 15 сайтов, 309 образцов; группа B: 26 сайтов, 662 образца).Я читал, что несбалансированные данные будут влиять на результаты для группы с большим количеством образцов.

Есть ли у кого-нибудь какие-либо предложения о том, как с этим справиться?

...