Для взвешенных SVM (для SVC()
из библиотеки sklearn) есть аргумент с именем 'class_weight'
. Давайте предположим случай двоичной классификации, когда у нас есть выходы 0 и 1. Мы могли бы определить стоимость ошибочной классификации как class_weight:{0:1,1:100}
, что означает, что неправильная классификация класса меньшинства будет наказываться более жестко. Вместо использования 'balanced'
heuristi c, который вычисляет обратное соотношение дисбаланса классов, я хочу выполнить поиск по сетке, чтобы определить оптимальные затраты. аргументы следующим образом:
class_weight:[{0:1, 1:1}, {0:1,1:2}, .., {0:1, 1:100}]
Я знаю, что вы можете использовать np.arange(1,100,1)
для построения сетки от 1 до 100, но я не знаю, как построить сетку этого синтаксиса, который включает ':'
присвоить индивидуальное значение из сетки определенному классу c.