Привет! Я использую Weka Framework для выполнения задачи интеллектуального анализа данных. Мой набор данных очень дисбаланс. Когда класс состоит из 1463 ярлыков, а другой состоит из 104. Если я выберу выборку, то большее число классов станет 104, а общее число переменных станет 208. Я чувствую, что это потеря информации.
Какой вариант будет наиболее подходящим для использования в таких случаях.