Я работаю над проблемой прогнозирования ETA. Дело в том, что в то время как моя модель xgb лучше всего подходит для mae 1.12 и для того же набора данных, я также применил простую 3-х уровневую сеть с активацией relu в скрытом режиме и линейную активацию в плотном режиме с adam со значениями по умолчанию beta1 и beta2но с lr = 0,00001 (так как это немного лучше работает). Проблема в том, что xgb работает намного лучше, чем nn с 3,4,5 слоями до 9, хотя после 5 производительность насыщенных комбинаций с выпадениями и нормализацией партии также была протестирована. Ниже приведены графики
XGB моделирования ....

NN Моделирование ... 
Как видите, xgb моделирует актуально довольно точно. Проблема в том, что эта производительность неприемлема для руководства, поэтому мне нужно повысить ее, я не пробовал LSTM или какой-либо другой, так как думал, что это будет слишком много. Любое предложение поможет ...
Спасибо