Я должен построить эту модель ML с целью прогнозирования общего времени для определенных дат, которые занимает международный банковский перевод. У меня есть наборы данных с международными транзакциями, их общее время и время, которое отдельные шаги предприняли в нем (т.е. сколько времени от клиента до конвертации, сколько времени до поступления денег на другой банковский счет). Теперь я задаюсь вопросом, является ли хорошей практикой включение этих показателей в мое дерево регрессии в качестве независимых переменных (значительно повышает мою предсказательную силу на тестовом наборе данных, когда я применяю к обучаемому набору данных), следовательно, это должно контролировать избыточную подгонку верно?
Буду очень признателен за отзыв и дайте мне знать, если я что-то не так с сообщением, я впервые здесь.