Прочитал несколько случаев, когда StandardScaler используется для y_train и y_test, а также там, где он не используется. Есть ли какие-то конкретные правила, где их следует использовать на них?
Цитата из здесь :
Стандартизация набора данных является распространенным требованием для многих оценщиков машинного обучения: они могут вести себя плохо, если отдельные функции не выглядят более или менеекак стандартные нормально распределенные данные (например, гауссиан с 0 средним и единичной дисперсией). Например, многие элементы, используемые в целевой функции алгоритма обучения (такие как ядро RBF машин опорных векторов или L1 и L2регуляризаторы линейных моделей) предполагают, что все объекты сосредоточены вокруг 0 и имеют дисперсию в одном и том же порядке. Если у функции есть отклонение, которое на несколько порядков больше, чем у других, оно может доминировать в целевой функции и сделать оценщик неспособным правильно учиться на других функциях, как и ожидалось.
Стандартизация набора данных является распространенным требованием для многих оценщиков машинного обучения: они могут вести себя плохо, если отдельные функции не выглядят более или менеекак стандартные нормально распределенные данные (например, гауссиан с 0 средним и единичной дисперсией).
Например, многие элементы, используемые в целевой функции алгоритма обучения (такие как ядро RBF машин опорных векторов или L1 и L2регуляризаторы линейных моделей) предполагают, что все объекты сосредоточены вокруг 0 и имеют дисперсию в одном и том же порядке. Если у функции есть отклонение, которое на несколько порядков больше, чем у других, оно может доминировать в целевой функции и сделать оценщик неспособным правильно учиться на других функциях, как и ожидалось.
Так что, вероятно, когда ваши функции имеютразличные шкалы / распределения вы должны стандартизировать / масштабировать их значения.