Я использую перекрестную проверку для оценки моих моделей ML, но теперь я хочу посмотреть на распределение ошибок, то есть я хочу получить среднюю ошибку конкретных точек данных, когда они находятся в тестовом наборе.
from sklearn import linear_model
from sklearn.model_selection import KFold, cross_val_score
X = #data points
y = #output
lm = linear_model.LinearRegression()
kfold = KFold(n_splits=10)
scores = cross_val_score(lm, X, y, scoring='neg_mean_squared_error', cv=kfold)
rmse_scores = [np.sqrt(abs(s)) for s in scores]
print('Testing RMSE (lin reg): {:.3f}'.format(np.mean(rmse_scores)))
Существует ли простой способ получить отдельные ошибки каждой из точек данных, когда они находятся в тестовом наборе (не ошибка обучения), используя перекрестную проверку с помощью scikit-learn? Спасибо!