Обычно, если данные имеют более 70-30 распределений, мы можем сказать, что данные имеют тенденцию к несбалансированности. Теперь, чтобы решить проблему, вы можете попробовать либо при выборке (если данные ОГРОМНЫЕ), либо при избыточной выборке (я предпочитаю это, используя библиотеку SMOTE). Таким образом, вы можете отменить огромный уклон получения 1 на выходе. Я надеюсь, что вы хотели знать, как справиться с дисбалансом данных. Правильно?