from sklearn.ensemble import GradientBoostingRegressor
gbrt = GradientBoostingRegressor(max_depth=2, n_estimators=3, learning_rate=1.0)
gbrt.fit(X, y)
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
X_train, X_val, y_train, y_val = train_test_split(X, y)
gbrt = GradientBoostingRegressor(max_depth=2, n_estimators=120)
gbrt.fit(X_train, y_train)
errors = [mean_sqaured_error(y_val, y_pred)
for y_pred in gbrt.staged_predict(X_val)]
bst_n_estimators = np.argim(errors)
gbrt_best = GradientBoostingRegressor(max_depth = 2, n_estimators = bst_n_estimators)
gbrt_best.fit(X_train, y_train)
Когда я запускаю этот код, я получаю следующую ошибку
ValueError: could not convert string to float: '<=50K'
Я использую следующие данные
https://archive.ics.uci.edu/ml/machine-learning-databases/adult/adult.data
После повышающего классификатора я хочу проверить повышение производительности в области под кривой, но сначала необходимо исправить вышеуказанную ошибку