почему нормализация данных важна для моделей, когда параметры могут управлять весом / важностью функции - PullRequest
2 голосов
/ 03 мая 2019

Когда мы изучаем нормализацию, приводятся различные факты, объясняющие необходимость.

Самым важным является то, что:

Нормализованный столбец, если он находится в более высоком диапазоне, чем другие, может оказать большее влияние на результаты и сделать наши результаты смещенными.

Простой пример: модель, которая использует такие функции, как возраст человека и зарплата. Возраст может оказывать незначительное влияние на объем производства, так как его очень мало, а зарплата может влиять больше.

Но мой вопрос в том, что модель должна быть достаточно умной, чтобы рассчитывать тета согласно диапазону. Возраст будет выше, тета, а зарплата будет небольшой. И поэтому модель не будет смещена в сторону заработной платы.

Еще одна причина, по которой они говорят, что в ML нормализация помогает быстрее сходиться. Подобная вещь различного диапазона тета также может быть применима здесь, и, следовательно, наш алгоритм будет сходиться с той же скоростью.

Мне нужна помощь в понимании этих концепций нормализации X или определения тета со значениями в диапазоне X.

...