Я пытаюсь смоделировать бинарную переменную ответа, основанную на некоторых непрерывных переменных (фиксированные эффекты) и категориальных переменных (случайные эффекты).
Вот уравнение модели: Y ijk = β X i + Z j + Z k + ε .
Y ijk : получен ли сеансщелкнуть или нет
X i : исправлены особенности эффекта клиента в сеансе I: num_purchases_cat1, num_purchases_cat2, num_purchases_cat3
Z j : случайный эффект: ad_category (100 категорий)
Z k : случайный эффект: ad_price (5 блоков)
Скажите, что мой data_train содержит все эти столбцы: [clicked, num_purchases_cat1, num_purchases_cat2, num_purchases_cat3, ad_category, ad_price].Два случайных эффекта ad_category и ad_price являются независимыми, и поэтому я хотел бы использовать модель смешанных эффектов со скрещенными эффектами.
Документация Python утверждает, что мне нужно рассматривать весь набор данных как одингруппа, вот что я пытаюсь:
import statsmodels.regression.mixed_linear_model as mlm
lmm = mlm.MixedLM(data_train.clicked, data_train[['num_purchases_cat1', 'num_purchases_cat2', 'num_purchases_cat3']], groups=np.ones(data_train.shape[0]))
Теперь я пытаюсь определить exog_re
и exog_vc
.Я просто ставлю data_train[['ad_category','ad_price']]
или я должен преобразовать его в кодирование в горячем режиме?Как это изменится, если я захочу иметь случайных наклонов против случайных перехватов * только 1070 *?