эффективно настроить регрессионное выражение в ноты - PullRequest
0 голосов
/ 05 ноября 2019

У меня есть датафрейм pandas с именами столбцов «A, B, C, D». теперь столбец D является целевым столбцом для моего алгоритма машинного обучения, а столбец C - горячим кодированием. Таким образом, столбец C становится C_1, C_2 и C_3. Чтобы настроить мое машинное обучение, я создал цель и переменные параметров.

X = df5.drop(['D'], axis=1)  #training parameters 
y = df5['D'] #target

Я хочу обучить этому с помощью patsy и попытался настроить регрессионное выражение в нотации patsy

expr = """D ~ A + B + C_1 + C_2 + C_3"""  #Target variable D is dependent on all the input parameters

Мой вопрос заключается в том, есть ли команда, которая автоматически выражает D как зависимый от всех параметров X вместо явной записи всех имен параметров?

Итак, я хочу что-то вроде этого:

 expr = """D ~ X""" #Target variable D is dependent on all the input parameters without explicitly writing the input parameter names

Есть ли способ сделать это?

...