Нужно ли использовать StandardScaler для y_train и y_test? Если да, то случаи? - PullRequest
0 голосов
/ 01 ноября 2019

Прочитал несколько случаев, когда StandardScaler используется для y_train и y_test, а также там, где он не используется. Есть ли какие-то конкретные правила, где их следует использовать на них?

1 Ответ

1 голос
/ 01 ноября 2019

Цитата из здесь :

Стандартизация набора данных является распространенным требованием для многих оценщиков машинного обучения: они могут вести себя плохо, если отдельные функции не выглядят более или менеекак стандартные нормально распределенные данные (например, гауссиан с 0 средним и единичной дисперсией).

Например, многие элементы, используемые в целевой функции алгоритма обучения (такие как ядро ​​RBF машин опорных векторов или L1 и L2регуляризаторы линейных моделей) предполагают, что все объекты сосредоточены вокруг 0 ​​и имеют дисперсию в одном и том же порядке. Если у функции есть отклонение, которое на несколько порядков больше, чем у других, оно может доминировать в целевой функции и сделать оценщик неспособным правильно учиться на других функциях, как и ожидалось.

Так что, вероятно, когда ваши функции имеютразличные шкалы / распределения вы должны стандартизировать / масштабировать их значения.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...