Получение ValueError: y содержит новые метки: [276 338 339 ...] при попытке подогнать RandomizedSearchCV для X_train и y_train - PullRequest
0 голосов
/ 04 марта 2020

Я пытаюсь настроить гиперпараметры для LGBMClassifier, как показано ниже:

### LGBMClassifier
clf = lgb.LGBMClassifier(silent=True, random_state = 100, metric='roc_auc', n_jobs=4)

### parameters
params ={'cat_smooth' : sp_randint(1, 100), 'min_data_per_group': sp_randint(1,1000), 'max_cat_threshold': sp_randint(1,100)}

fit_params={"early_stopping_rounds":2, 
            "eval_metric" : 'auc', 
            "eval_set" : [(X_train, y_train),(X_test,y_test)],
            'eval_names': ['train','valid'],
            'verbose': 300,
            'categorical_feature': 'auto'}

### RandomizedSearchCV
gs = RandomizedSearchCV( estimator=clf, param_distributions=params, scoring='roc_auc',cv=3, refit=True,random_state=304,verbose=True)

и когда я пытаюсь установить 'gs' с X_train и y_train, как показано ниже:

gs.fit(X_train, y_train, **fit_params)

это дает мне ошибку

ValueError: y содержит новые метки: [276 338 339 ...]

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...