Я новичок в машинном обучении, и в книгах и документации, которые я прочитал, всегда есть значение от 0 до 1, что соответствует точности от 0% до 100%.
На моей собственной машине Изучая код в scikit-learn, я получаю значения баллов от -750.880810
до 5154.771036
, что меня смущает.
>>> pipe = Pipeline([("scaler", MinMaxScaler()), ("svr", SVR())])
>>> param_grid = {'svr__C':[0.1, 1, 5],
'svr__epsilon':[0.001, 0.01]}
>>> grid = GridSearchCV(estimator=pipe,
param_grid=param_grid,
cv=GroupKFold(n_splits=24)
)
>>> grid.fit(X, y, groups)
GridSearchCV(cv=GroupKFold(n_splits=24), error_score=nan,
estimator=Pipeline(memory=None,
steps=[('scaler',
MinMaxScaler(copy=True,
feature_range=(0, 1))),
('svr',
SVR(C=1.0, cache_size=200, coef0=0.0,
degree=3, epsilon=0.1,
gamma='scale', kernel='rbf',
max_iter=-1, shrinking=True,
tol=0.001, verbose=False))],
verbose=False),
iid='deprecated', n_jobs=None,
param_grid={'svr__C': [0.1, 1, 5], 'svr__epsilon': [0.001, 0.01]},
pre_dispatch='2*n_jobs', refit=True, return_train_score=False,
scoring=None, verbose=0)
>>> grid.best_score_
-750.880810
Может кто-нибудь объяснить мне это?
Редактировать:
Мои входные данные являются измерениями двигателя.
У меня 12 различных отказов двигателя, и каждый сбой измеряется дважды => 12x2 = 24 разных группы (я также попробую 12 групп). Каждая группа состоит из:
- X данных: 13 различных характеристик (температура, давление, напряжение c и др. c.) С 1200 выборками на группу
- y данные: 1 функция (давление) с 1200 образцами на группу