Я хотел бы использовать регрессию с произвольным лесом для обучения.В моей задаче 700 узлов, 100 переменных (X1,…, X100) и 50 функций.На каждом узле все переменные имеют 50 функций, некоторые из которых являются статическими, а некоторые динамическими.Итак, у меня 70000 строк и 50 столбцов в Excel.На узле с 1 по 700 для X1 статические функции исправлены, но динамические характеристики отличаются.То же самое верно и для других переменных.Мой вопрос заключается в том, должен ли я объединять данные, относящиеся к переменной (например, X1), и делать прогнозы или делать прогнозы со всеми 70000 записями?Если агрегат лучше?Я хотел бы знать, как агрегировать данные, чтобы делать прогнозы, используя случайный лес.