У меня есть датафрейм pandas с именами столбцов «A, B, C, D». теперь столбец D является целевым столбцом для моего алгоритма машинного обучения, а столбец C - горячим кодированием. Таким образом, столбец C становится C_1, C_2 и C_3. Чтобы настроить мое машинное обучение, я создал цель и переменные параметров.
X = df5.drop(['D'], axis=1) #training parameters
y = df5['D'] #target
Я хочу обучить этому с помощью patsy и попытался настроить регрессионное выражение в нотации patsy
expr = """D ~ A + B + C_1 + C_2 + C_3""" #Target variable D is dependent on all the input parameters
Мой вопрос заключается в том, есть ли команда, которая автоматически выражает D как зависимый от всех параметров X вместо явной записи всех имен параметров?
Итак, я хочу что-то вроде этого:
expr = """D ~ X""" #Target variable D is dependent on all the input parameters without explicitly writing the input parameter names
Есть ли способ сделать это?