Я использую XGBoost для прогнозирования количества топлива, которое самолет будет стоить во время полета. У меня возникла проблема, и я хотел бы обратиться за помощью.
В общей теории для конкретной авиакомпании расстояние практически не менялось при каждом полете, а стоимость топлива имеет отрицательную корреляцию с высотой полета. Однако, если я соберу все записи о полетах вместе, в наборе данных будет много авиакомпаний, поэтому расстояние полета будет отличаться друг от друга, стоимость топлива будет меняться в зависимости от высоты, потому что, как правило, чем больше расстояние полета, тем выше будет самолет, и большая дальность полета всегда означает большую стоимость топлива. Таким образом, соотношение fuel_cost и flight_altitude становится положительным. когда я использую XGBoost, модель также обнаружила положительную корреляцию между fuel_cost и flight_altitude, и, очевидно, неправильно, если я использую модель для проведения дополнительного анализа, такого как изменение стоимости топлива в зависимости от высоты полета. Так что мне интересно, как заставить модель узнать правильную корреляцию между характеристиками и переменной отклика?
Выше мой вопрос, надеюсь, я четко его описал, я не очень хорошо спрашиваю на английском, и любой совет будет признателен!