Простой вопрос:
Допустим, у меня есть pandas.dataframe
, содержащий все переменные, которые я хочу использовать для некоторой регрессии. Некоторые из переменных (зависимая переменная или любая из независимых переменных) являются двоичными и форматируются как числовые (0/1
) или логические (TRUE/FALSE
). Когда я передам X
и y
в statsmodels
, он "поймет", что они должны рассматриваться как фиктивные переменные, или мне нужно это указать? И если так, как я могу сказать модели, что некоторые переменные являются фиктивными?