Я обучил свою модель данным ЭКГ, в которых имеется 8528 файлов ЭКГ, имеющих длину 30s
и частоту дискретизации 300
, поэтому общая длина файла в формате csv составляет 9000
.Данные имеют четыре класса: A
, N
, O
и ~
. Эта модель работает нормально.
Теперь я хочу переобучить модель, используя еще несколько файлов ЭКГ.Который имеет длину 42s
и частоту дискретизации 360
.Таким образом, общий CSV-файл этого сигнала ЭКГ имеет длину 15127
.
Я обучил модель с A
файлом, имеющим длину 15127
, затем я попытался предсказать тот же файл с обученной моделью, но он предсказывает значение классаN
.
Кто-нибудь может представить, как Xgboost узнает, добавив такой файл с большей длиной сигнала?Встречается ли такой файл как выброс?
Если я обучу модель с большим числом A
, имеющим длину 15127
, сможет ли модель правильно ее предсказать?
Дайте мне знать, если требуется какая-либо информация,
Вот пример учебного кода:;
dtrain = xgb.DMatrix(train_data,label=train_labels)
# cross_validate(dtrain)
print('training model.....')
param = {'num_class':4,'objective':'multi:softmax','eval_metric':['merror'],'max_depth':7,'eta':0.04,'subsample':0.8,'min_child_weight':0.5,'max_delta_step':7,'gamma':2,'lambda':10,'colsample_bytree':0.5}
model = xgb.train(param,dtrain,420,[(dtrain,'train')],verbose_eval=20)
print('saving model....')
model.save_model('xgb_model.bin')
print('done!')