Когда мы изучаем нормализацию, приводятся различные факты, объясняющие необходимость.
Самым важным является то, что:
Нормализованный столбец, если он находится в более высоком диапазоне, чем другие, может оказать большее влияние на результаты и сделать наши результаты смещенными.
Простой пример:
модель, которая использует такие функции, как возраст человека и зарплата. Возраст может оказывать незначительное влияние на объем производства, так как его очень мало, а зарплата может влиять больше.
Но мой вопрос в том, что модель должна быть достаточно умной, чтобы рассчитывать тета согласно диапазону. Возраст будет выше, тета, а зарплата будет небольшой. И поэтому модель не будет смещена в сторону заработной платы.
Еще одна причина, по которой они говорят, что в ML нормализация помогает быстрее сходиться. Подобная вещь различного диапазона тета также может быть применима здесь, и, следовательно, наш алгоритм будет сходиться с той же скоростью.
Мне нужна помощь в понимании этих концепций нормализации X или определения тета со значениями в диапазоне X.