Уменьшает ли стандартизация набора данных в машинном обучении точность? - Короткий ответ, №
Нормализация данных в основном связана с конвергенцией, а не с точностью. Однако существуют модели, которые предполагают конкретное c распределение данных, в таких случаях нормализация может стать очень важной.
В случае 1, объекты не нормализованы, поэтому это немного более длинный путь для алгоритма оптимизации, для случая 2 он равен во всех направлениях, поэтому сходимость немного быстрее, но этот пример сильно применим для минимальной-максимальной нормализации единичного вектора.
Некоторые допущения логистических c регрессий:
- наблюдения должны быть независимыми друг от друга
- небольшая или отсутствие мультиколлинеарности среди независимых переменных
- независимые переменные линейно связаны с логарифмическими коэффициентами
Но регрессия logisti c не предполагает нормализованные данные. Таким образом, это необязательный шаг для подбора регрессионной модели логистики c.
Предполагать, что нормализация повысит точность модели, будет неправильно.
Среднее центрирование и масштабирование до единицы Дисперсия обычно полезна, но все зависит от свойств ваших данных.
Если ваши данные нерегулярны, среднее вычитание может искажать некоторые особенности в направлении, которое приводит к снижению точности, нанося ущерб любому из сильные предположения регрессии logisti c, такие как введение некоторой нелинейности из-за чисел c причин.