Я работаю над категориальным набором данных, мне нужно отбирать 3 переменных на основе типа _Box. Каждая категориальная переменная имеет много модальностей. Как я могу иметь одинаковое количество выборок для каждой категориальной переменной для box_type?
Я пытался сначала применить нижнюю выборку под одной переменной, а затем попытаться с помощью split_test, чтобы отобрать каждую модальность для второй переменной со стратификацией первой переменной, но я не получаю одно и то же число, когда изменяется скорость. Есть ли предложение, спасибо?