Я не эксперт в этом, но я считаю, что центрирование и масштабирование каждого вектора признаков путем вычитания его среднего значения и последующего деления на стандартное отклонение является типичным способом нормализации векторов объектов для использования с SVM.В R это можно сделать с помощью функции масштабирования.
Другим способом является преобразование каждого вектора признаков в диапазон [0,1]:
(x - min(x)) / (max(x) - min(x))
Может быть, некоторые функции могут выиграть отlog-трансформация, если распределение сильно нарушено, но это также изменит форму распределения и не только «переместит» его.
Я не уверен, что вы получите в настройке SVM путем нормализациивекторы по их норме L1 или L2, как это делает PyML со своим методом нормализации.Я думаю, двоичные функции (0 или 1) не должны быть нормализованы.