Мой фрейм данных состоит из 10 миллионов записей с 6 столбцами.Класс (is_active) очень несбалансирован (1-96%, 0-4%).
Фрейм данных выглядит как -
id age gender salary bonus is_active
1 27 M 76543 762 0
2 36 F 87352 1050 1
3 29 M 76598 7364 1
4 61 M 74632 3475 0
Я хочу фрейм данных, в котором моя зависимая переменная (is_active) рацион должен быть 1-75%, 0-25%.
Как это сделать в python?