Как собирать данные, чтобы делать прогнозы? - PullRequest
0 голосов
/ 20 сентября 2019

Я хотел бы использовать регрессию с произвольным лесом для обучения.В моей задаче 700 узлов, 100 переменных (X1,…, X100) и 50 функций.На каждом узле все переменные имеют 50 функций, некоторые из которых являются статическими, а некоторые динамическими.Итак, у меня 70000 строк и 50 столбцов в Excel.На узле с 1 по 700 для X1 статические функции исправлены, но динамические характеристики отличаются.То же самое верно и для других переменных.Мой вопрос заключается в том, должен ли я объединять данные, относящиеся к переменной (например, X1), и делать прогнозы или делать прогнозы со всеми 70000 записями?Если агрегат лучше?Я хотел бы знать, как агрегировать данные, чтобы делать прогнозы, используя случайный лес.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...