Проблема с использованием LogisticRegression, polynmomialFeatures и конвейера - PullRequest
0 голосов
/ 29 апреля 2020

Я новичок в области машинного обучения, и у меня возникла проблема с моим учебным кодом. Когда я запускаю PolynomialFeatures до степени, превышающей или равной 2, файл pipe.fit выходит за пределы памяти. У меня вопрос, делаю ли я что-то не так с этим кодом?

x = np.array(df_train[lista])  #x.shape: (2000, 529)
y = np.array(df_train["label"]) #y.shape: (2000,)

x_train, x_val, y_train, y_val = train_test_split(x, y, test_size=0.2)

scaler = MinMaxScaler()

poly = PolynomialFeatures(2)

clf = LogisticRegression(C = 0.01, max_iter = 4000, class_weight="balanced")

pipeline = Pipeline([("poly",poly),("scaler",scaler),("clf", clf)])

pipeline.fit(x_train, y_train)
...