У меня есть помеченный тренировочный набор, на котором я тренировался по линейному SVM, используя 10 функций (двоичная классификация, 10 кратное резюме). Функции стандартизированы (среднее значение равно 0, SD равно 1)
Теперь я выберу определенную функцию, скажем, функцию 5, вес функции - 7, что означает, что высокое значение в этой функции примет решениеперейти к отрицательному классу.
Теперь, если я нанесу распределения значений этого признака для примеров положительного обучения и примеров отрицательного обучения, эти 2 распределения будут выглядеть примерно одинаково.
Насколько я понимаю, это означает, что эта функция на самом деле не очень хорошо различает класс 0 и 1.
Что здесь происходит? Почему высокий вес, если он на самом деле не различает?
7, безусловно, самое высокое значение веса из всех моих возможностей.