Обучающая модель xgboost с большим количеством данных, имеющих различные характеристики - PullRequest
0 голосов
/ 13 апреля 2019

Я обучил свою модель данным ЭКГ, в которых имеется 8528 файлов ЭКГ, имеющих длину 30s и частоту дискретизации 300, поэтому общая длина файла в формате csv составляет 9000.Данные имеют четыре класса: A, N, O и ~

. Эта модель работает нормально.

Теперь я хочу переобучить модель, используя еще несколько файлов ЭКГ.Который имеет длину 42s и частоту дискретизации 360.Таким образом, общий CSV-файл этого сигнала ЭКГ имеет длину 15127.

Я обучил модель с A файлом, имеющим длину 15127, затем я попытался предсказать тот же файл с обученной моделью, но он предсказывает значение классаN.

Кто-нибудь может представить, как Xgboost узнает, добавив такой файл с большей длиной сигнала?Встречается ли такой файл как выброс?

Если я обучу модель с большим числом A, имеющим длину 15127, сможет ли модель правильно ее предсказать?

Дайте мне знать, если требуется какая-либо информация,

Вот пример учебного кода:;

dtrain = xgb.DMatrix(train_data,label=train_labels)
# cross_validate(dtrain)
print('training model.....')
param = {'num_class':4,'objective':'multi:softmax','eval_metric':['merror'],'max_depth':7,'eta':0.04,'subsample':0.8,'min_child_weight':0.5,'max_delta_step':7,'gamma':2,'lambda':10,'colsample_bytree':0.5}
model = xgb.train(param,dtrain,420,[(dtrain,'train')],verbose_eval=20)
print('saving model....')
model.save_model('xgb_model.bin')
print('done!')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...