Использование Resample в Weka для балансировки наборов данных - PullRequest
0 голосов
/ 02 ноября 2018

Мне нужно использовать Resample в Weka, чтобы сбалансировать наборы данных путем передискретизации, недостаточной дискретизации, SMOTE и ROSE. Я знаю, что в Weka есть фильтр SMOTE, поэтому я смог разобраться в этом методе. Тем не менее, когда я использую Resample для передискретизации и недосэмплинга (я еще не дошел до ROSE), я не совсем понимаю, как настроить каждый параметр. Существует S (случайное число начальных чисел), Z (размер выходного набора данных в процентах от входного набора данных), смещение (коэффициент смещения к равномерному распределению классов), отсутствие замены (логическое значение) и V (инвертирование selection - логическое значение).

Я знаю, что смещение избыточной выборки и недостаточной выборки используется, но я не знаю, на что установить смещение и нужно ли мне устанавливать какие-либо другие параметры.

Я искал какую-то помощь в Интернете, но не повезло, поэтому я решил спросить здесь.

Спасибо.

...