У меня есть следующие зависимые и независимые переменные для моей модели линейной регрессии. Поскольку все они находятся в разных масштабах (некоторые из них являются% непрерывными переменными), мне было предложено взять журнал и нормализовать их перед выполнением регрессии.
Y X2 X3 (%) X1 (%)
Mean 2.9 24.6 0.009517 230.992248
std 2.3 32.2 0.077092 230.992248
Min 0 1 0 0
Max 8 539 1 1
У меня есть следующие вопросы:
Почему я должен взять журнал и затем нормализовать его, а не использовать одно из двух преобразований данных?
Должен ли я регистрировать и нормализовать также мою переменную Y?
Как бы интерпретировать мой коэффициент в конце упражнения? и как я могу сделать их понятными людям для деловой аудитории?
Любая легкая ссылка на документ очень ценится!