Прогнозирование таблицы, в которой одно и то же значение целевой переменной существует во многих строках, и все строки имеют различную информацию, кроме первичного ключа. Как использовать всю информацию во многих строках для прогнозирования только одного результата.
Как видите, все 3 строки имеют одинаковый AccountNumber, таким образом, одинаковую скорость роста. Я не знаю, как использовать 3 строки вместе, чтобы предсказать 5%. Но поскольку темпы роста продаж (целевая переменная) связаны с salesAmount, лучше ли мне просто прогнозировать salesAmount? Но если я сделаю это таким образом, информация о росте сверхурочных будет потеряна. Рост был рассчитан с некоторыми другими столбцами, такими как дата, которые я не включил в этот пример.
The data looks like this, where Growth is target variable.
#accountNum sales Product Growth(%)
#1 100 B 5%
#1 200 A 5%
#1 300 C 5%
Я хотел бы увидеть любую прогностическую модель, которая может просто использовать всю информацию в таблице и прогнозировать рост.