Необходимо ли нормализовать / стандартизировать двоичные предикторы при применении машин опорных векторов? - PullRequest
0 голосов
/ 08 марта 2019

Я новичок в машинном обучении. Я понимаю, что непрерывные переменные / предикторы должны быть стандартизированы / нормализованы перед применением метода опорных векторов (SVM). Что мы делаем с категориальными предикторами с категориями C? Разбить их на фиктивные / двоичные предикторы? А что нам делать с двоичными? Оставить их как есть или стандартизировать их?

Мне не имеет смысла вычислять среднее и стандартное отклонение для двоичного предиктора, а затем по существу перекодировать 0 и 1 (значения двоичной переменной) в (0-среднее) /std.dev. и (1-среднее) /std.dev. соответственно. Более того, я понимаю, что причина стандартизации непрерывных предикторов заключается в том, что масштаб / единица измерения, которую они измеряют, не влияет на решение SVM. Имея это в виду, двоичные / фиктивные предикторы, закодированные как 0-1, не должны влиять на решение SVM.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...