Можно ли использовать зависимую переменную в термине взаимодействия? Это вызывает какие-либо проблемы? - PullRequest
0 голосов
/ 05 июня 2019

Итак, я запускаю регрессию, в которой мои гипотезы утверждают, что зависимая переменная влияет на влияние независимой переменной на зависимую переменную, если это имеет смысл. По сути, по мере увеличения зависимой переменной я ожидаю, что бета независимой переменной будет уменьшаться. Я хотел решить эту проблему, используя термин взаимодействия.

y = b0 + b1 * x1 + b2 * x2 + b3 * x2 * y.

Это вызывает какие-либо проблемы. Является ли это статистически жизнеспособным? Я не могу найти никакой информации по этому вопросу, но я не был уверен, должен ли я это делать, поскольку теперь мой b2 меняется со значительно положительного на значительно отрицательный, что кажется странным. b3 является значительно положительным, кстати.

Просто для дополнительного пояснения. Мой набор данных состоит из количества загрузок мобильных приложений (DV), среднего рейтинга (IV) и количества оценок (IV). Теперь гипотеза состоит в том, что менее популярные приложения требуют больше информации, потому что популярность является показателем качества для потребителя. Вот почему я хотел бы включить взаимодействие между популярностью и рейтинговыми переменными. Для меня лучшим показателем популярности, конечно, кажется количество скачиваний.

Мой код, выполненный в r, для регрессии выглядит следующим образом:

an_5 <- lm(new_Install ~ Rating + Reviews + Reviews:new_Install + Rating:new_Install, data=Data_1)
summary(an_5)

Ожидаемые результаты будут все 4 значительными, но последние два будут отрицательными, а первые два положительными, однако обратная ситуация выглядит странной. Я с удовольствием предоставлю больше информации.

1 Ответ

0 голосов
/ 05 июня 2019

Это не является статистически жизнеспособным подходом.По сути, вы просто используете свою независимую переменную в качестве искажения для фактической зависимой переменной, которая эффективно утечка информации, которая никогда не должна быть частью предикторов.бета независимой переменной для уменьшения "Я делаю вывод, что вы хотели бы, чтобы переменная x2 оказывала меньшее предельное влияние на зависимую переменную, когда зависимая переменная становится больше.Вы можете достичь чего-то концептуально похожего, соответствующим образом преобразовав независимые переменные.Например, предполагая, что x2 имеет положительный коэффициент, преобразование log + log_reviews (где log_reviews = log (reviews)) имитирует переменную с уменьшением предельного положительного эффекта.

...