Наличие комбинации предикторов не имеет значения для любой формы регрессии, это только изменит то, как вы интерпретируете коэффициенты. Однако имеет значение тип / распределение вашей переменной Y
Случай 1: прогнозирование непрерывного значения Y
А. Достаточно ли будет использовать регрессию Лассо?
Регулярная регрессия OLS будет работать нормально для этого
б. Как мне интерпретировать X-коэффициент, если X стандартизирован и является
числовое значение?
Интерпретация коэффициентов всегда следует формату, как «для изменения X на 1 единицу мы ожидаем величину изменения коэффициента x в Y, сохраняя остальные предикторы постоянными»
Поскольку у вас есть стандартизированный X, ваше подразделение является стандартным отклонением. Таким образом, интерпретация будет звучать так: «для изменения стандартного отклонения в 1 на X мы ожидаем, что величина изменения коэффициента X в Y ...»
с. Как мне интерпретировать X-коэффициент, если X стандартизирован и является
%?
То же, что и выше. Ваши единицы все еще являются стандартными отклонениями, несмотря на то, что изначально они составляли процент
Случай 2: предсказать Y-значное значение Y, например,% используемого ресурса.
а. Должен ли я использовать бета-регрессию? Если так, какой пакет в Python предлагает
это?
Это сложно. Типичная рекомендация состоит в том, чтобы использовать что-то вроде биномиальной логистической регрессии, когда ваш результат Y в процентах.
б. Как мне интерпретировать X-коэффициент, если X стандартизирован и является
числовое значение?
с. Как мне интерпретировать X-коэффициент, если X стандартизирован и является
%?
То же, что и интерпретации выше. Но если вы используете логистическую регрессию, они находятся в единицах логарифмических шансов. Я бы порекомендовал прочитать о логистической регрессии, чтобы глубже понять, как это работает
Если я ошибаюсь в стандартизации X, которые уже являются%,
штрафа использовать эти цифры как 0,30 на 30%, чтобы они попадали в
диапазон 0-1? Так что это означает, что я не стандартизирую их, я буду по-прежнему
стандартизировать другие числовые IV.
Стандартизация отлично подходит для переменных в регрессии, но, как я уже сказал, она меняет вашу интерпретацию, поскольку ваша единица измерения теперь является стандартным отклонением
Окончательная цель для обоих случаев 1 и 2:
Чтобы найти% воздействия IV на Y. Например: когда X1 увеличивается на 1 единицу,
Y увеличивается на 21%
Если ваш Y в процентах, и вы используете что-то вроде регрессии OLS, то именно так вы и будете интерпретировать коэффициенты (при изменении на 1 единицу в X1 Y изменяется на несколько процентов)