Я пытаюсь создать линейную регрессию с посредниками, чтобы выяснить, как различные функции, связанные с электронной торговлей в масштабах всей страны, могут опосредовать взаимосвязь между тенденциями SVI Google и долей рынка конкретного бренда. В настоящее время у меня есть 20 потенциальных переменных-посредников, и я хочу выполнить выбор функции, чтобы упростить модель, текущая форма которой:
lm(share~t1+(.-t1 -gtrends)*gtrends, data = abcd)
Я пытался использовать RFE, но только выяснил, как заставить его работать для стандартных моделей множественной регрессии (без посреднических эффектов). Пробовал использовать рецепты для этой цели, но не мог понять, как заставить их работать (не имел опыта их использования).
Когда я ввожу любое умножение в формулу rfe, я получаю эту ошибку:
control <- rfeControl(functions=lmFuncs, method="cv", number=10)
results <- rfe(share~anything*gtrends,
data = abcd,
rfeControl=control)
Error in `[.data.frame`(x, , bestVar, drop = FALSE) : undefined columns selected
Все переменные в наборе данных являются числовыми и предварительно обработанными, без нулей или отсутствующих значений.
Так есть ли какие-нибудь удобные для новичков методы для выбора функций для модераторов этой конкретной модели? т.е. мне нужно только выбрать элемент для той части, которая находится в скобках первого фрагмента кода.