Мы компилируем xgboost v0.7 из исходного кода на ванильном образе докера Ubuntu.Этот образ запускается на наших экземплярах EC2 в критических по времени настройках.
Недавно мы попробовали новый тип экземпляров EC2 c5, который должен быть процессором Intel Skylake gen.Очень странно, что тот же образ докера на новых C5s дает значительно худшие результаты по времени.В среднем в 3 раза медленнее.
Идеи о том, почему это может иметь место?
Все еще остается верным при компиляции xgboost с -march = skylake-avx512