Я работаю с сильно несбалансированным набором данных и использую train_test_split из sklearn.model_selection
У меня есть 10000 элементов в этом наборе данных, и соотношение составляет примерно 10/2/2/1 для классов, и я ищу способ сбалансировать разделение train
и я хотел бы прекратить добавлять элементы в самый большой класс, когда он достигает максимального числа.
Можно ли ограничить количество элементов, я знаю, что можно удалить лишние элементы после разделения, но мне интересно, есть ли такая опция?