Python Сохранить функцию. Использовать значение из предыдущей строки в расчете - PullRequest
1 голос
/ 21 апреля 2020
In [10]: df
Out[10]:
     PART AVAILABLE_INVENTORY DEMAND
1    A    12                  6
2    A    12                  2
3    A    12                  1
4    B    24                  1
5    B    24                  1
6    B    24                  4
7    B    24                  3

Требуемый вывод:

     PART AVAILABLE_INVENTORY DEMAND  AI   AI_AFTER
1    A    12                  6       12   6
2    A    12                  2       6    4
3    A    12                  1       4    3
4    B    24                  1       24   23
5    B    24                  1       23   22
6    B    24                  4       22   18
7    B    24                  3       18   15

Код, который у меня есть, приведен ниже, но он не дает вывод, который я ищу:

def retain(df):
    df['PREV_PART'] = df['PART'].shift()
    df['PREV_AI_AFTER'] = df['AI'].shift() - df['DEMAND'].shift()
    df['AI'] = np.where(df['PART'] != df['PREV_PART'], df['AI'], df['PREV_AI_AFTER'])
    df['AI_AFTER'] = df['AI'] - df['DEMAND']

df['AI'] = df['AVAILABLE_INVENTORY']
retain(df)

Что такое самый быстрый способ сделать это с учетом производительности?

Ответы [ 2 ]

1 голос
/ 21 апреля 2020

VERRRY Аналогично Ответ Ben.T . Пожалуйста, выберите ответ, если вам нравится этот подход. Вот как я бы организовал процесс.

def f(d):
    i = d.AVAILABLE_INVENTORY
    c = d.DEMAND.cumsum()
    return pd.concat({'AI': i - c.shift(fill_value=0), 'AI_AFTER': i - c}, axis=1)

df.join(df.groupby('PART').apply(f))

  PART  AVAILABLE_INVENTORY  DEMAND  AI  AI_AFTER
1    A                   12       6  12         6
2    A                   12       2   6         4
3    A                   12       1   4         3
4    B                   24       1  24        23
5    B                   24       1  23        22
6    B                   24       4  22        18
7    B                   24       3  18        15
1 голос
/ 21 апреля 2020

Вы можете сделать это с помощью groupby с cumsum в столбце 'СПРОС' и shift в столбце 'AI_AFTER', только что созданным ранее:

df['AI_AFTER'] = df['AVAILABLE_INVENTORY'] - df.groupby('PART')['DEMAND'].cumsum()
df['AI'] = df.groupby('PART')['AI_AFTER'].shift().fillna(df['AVAILABLE_INVENTORY'])
print (df)
  PART  AVAILABLE_INVENTORY  DEMAND  AI_AFTER    AI
1    A                   12       6         6  12.0
2    A                   12       2         4   6.0
3    A                   12       1         3   4.0
4    B                   24       1        23  24.0
5    B                   24       1        22  23.0
6    B                   24       4        18  22.0
7    B                   24       3        15  18.0
...