Как применить одну модель для разных категорий интересов в питоне? - PullRequest
0 голосов
/ 19 мая 2018

У меня есть ежедневный набор данных о продажах из 4 предметов, который продается через 4 разных франшизы.

Мне нужно построить модель, чтобы прогнозировать еженедельные продажи всех этих четырех товаров для всех франшиз.

Я планирую использовать одну базовую модель для прогнозирования

reg = linear_model.Ridge(alpha=1)

У меня вопрос, как мне написать код, чтобы применить эту модель ко всем 4 продуктам и франшизам.

Я буду признателен за ваше время и усилия, чтобы помочь мне.Спасибо

Мой стол похож на ниже

DepotName    Product    Date        SalesUnits  
    A           A1      2015-01-23  2.0 
    A           A2      2015-01-23  225.0   
    A           A3      2015-01-23  120.0   
    A           A4      2015-01-23  72.0    
    B           A1      2015-01-23  90.0    
    B           A2      2015-01-23  2.0 
    B           A3      2015-01-23  1.0 
    B           A4      2015-01-23  2.0 
    C           A1      2015-01-23  1.0 
    C           A2      2015-01-23  1.0 
    C           A3      2015-01-23  4.0 
    C           A4      2015-01-23  8040.0  
    D           A1      2015-01-23  1590.0  
    D           A2      2015-01-23  1.0     
    D           A3      2015-01-23  1590.0  
    D           A4      2015-01-23  1.0
    A           A1      2015-01-24  2.0 
    A           A2      2015-01-24  225.0   
    A           A3      2015-01-24  120.0   
    A           A4      2015-01-24  72.0    
    B           A1      2015-01-24  90.0    
    B           A2      2015-01-24  2.0 
    B           A3      2015-01-24  1.0 
    B           A4      2015-01-24  2.0 
    C           A1      2015-01-24  1.0 
    C           A2      2015-01-24  1.0 
    C           A3      2015-01-24  4.0 
    C           A4      2015-01-24  8040.0  
    D           A1      2015-01-24  1590.0  
    D           A2      2015-01-24  1.0     
    D           A3      2015-01-24  1590.0  
    D           A4      2015-01-24  1.0

1 Ответ

0 голосов
/ 19 мая 2018

Просто запустите groupby операцию над вашими индикаторами:

for g in data.groupby(['DepotName', 'Product']):
   # g[0]: TUPLE OF CURRENT GROUP NAMES
   # g[1]: DATAFRAME OF CURRENT GROUP

   predictors = [... list of column names ...]

   reg = linear_model.Ridge(alpha=1)
   reg.fit(g[1][predictors], g[1]['SalesUnits'])

   y_pred = reg.predict(g[1][predictors])
   # ...
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...