Это полностью зависит от того, что, если вы уменьшите выборку, сколько данных наблюдений вы оставили, и насколько эффективно класс пониженной выборки сможет приспособиться к разнообразию класса пониженной выборки.например, у вас есть класс 1, который состоит из 100 наблюдений, и класс 2, который содержит 2000 наблюдений (класс 1 составляет ~ 5%).Тогда понижающая выборка не будет иметь смысла, так как не будет достаточно данных наблюдений, чтобы эффективно реализовать модель.100 наблюдений очень меньше.Модель будет иметь большие ошибки обучения.
Но если у вас есть класс 1, который имеет 100 000 наблюдений, и класс 2, имеющий 2 000 000 (снова 5%), то все равно имеет смысл уменьшить выборку, поскольку у вас достаточно наблюдений для обучения модели.
Таким образом, ответ полностью зависит от типа данных, которые вы имеете.Я лично пошел бы с SMOTE.Надеюсь, это поможет.