Question

Прочитал несколько случаев, когда StandardScaler используется для y_train и y_test, а также там, где он не используется. Есть ли какие-то конкретные правила, где их следует использовать на них?

adnanmuttaleb · Answer 1 · 01 ноября 2019

Цитата из здесь :

Стандартизация набора данных является распространенным требованием для многих оценщиков машинного обучения: они могут вести себя плохо, если отдельные функции не выглядят более или менеекак стандартные нормально распределенные данные (например, гауссиан с 0 средним и единичной дисперсией).

Например, многие элементы, используемые в целевой функции алгоритма обучения (такие как ядро RBF машин опорных векторов или L1 и L2регуляризаторы линейных моделей) предполагают, что все объекты сосредоточены вокруг 0 и имеют дисперсию в одном и том же порядке. Если у функции есть отклонение, которое на несколько порядков больше, чем у других, оно может доминировать в целевой функции и сделать оценщик неспособным правильно учиться на других функциях, как и ожидалось.

Так что, вероятно, когда ваши функции имеютразличные шкалы / распределения вы должны стандартизировать / масштабировать их значения.

Нужно ли использовать StandardScaler для y_train и y_test? Если да, то случаи?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нужно ли использовать StandardScaler для y_train и y_test? Если да, то случаи?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы