Итак, я запускаю регрессию, в которой мои гипотезы утверждают, что зависимая переменная влияет на влияние независимой переменной на зависимую переменную, если это имеет смысл. По сути, по мере увеличения зависимой переменной я ожидаю, что бета независимой переменной будет уменьшаться.
Я хотел решить эту проблему, используя термин взаимодействия.
y = b0 + b1 * x1 + b2 * x2 + b3 * x2 * y.
Это вызывает какие-либо проблемы. Является ли это статистически жизнеспособным? Я не могу найти никакой информации по этому вопросу, но я не был уверен, должен ли я это делать, поскольку теперь мой b2 меняется со значительно положительного на значительно отрицательный, что кажется странным. b3 является значительно положительным, кстати.
Просто для дополнительного пояснения. Мой набор данных состоит из количества загрузок мобильных приложений (DV), среднего рейтинга (IV) и количества оценок (IV). Теперь гипотеза состоит в том, что менее популярные приложения требуют больше информации, потому что популярность является показателем качества для потребителя. Вот почему я хотел бы включить взаимодействие между популярностью и рейтинговыми переменными. Для меня лучшим показателем популярности, конечно, кажется количество скачиваний.
Мой код, выполненный в r, для регрессии выглядит следующим образом:
an_5 <- lm(new_Install ~ Rating + Reviews + Reviews:new_Install + Rating:new_Install, data=Data_1)
summary(an_5)
Ожидаемые результаты будут все 4 значительными, но последние два будут отрицательными, а первые два положительными, однако обратная ситуация выглядит странной. Я с удовольствием предоставлю больше информации.