Как получить кумулятивную сумму, основанную на условии if, используя булеву переменную - PullRequest
0 голосов
/ 03 мая 2020

У меня есть следующий фрейм данных:

vote_prprtn uniform_votesh  p_by_q    ln_p_by_q   p_ln_p_by_q   match
0.0116     0.009367        1.238434   0.213848   0.002481       False
0.0100     0.009367        1.067616   0.065428   0.000654       True
0.0065     0.009367        0.693950  -0.365355   -0.002375      True
0.0072     0.006000        1.200000   0.182321   0.001313       False
0.0048     0.006000        0.800000  -0.223143   -0.001071      True

Я хочу создать еще один столбец, который имеет значение строки p_ln_p_by_q, когда match = False, и выполняет накопленную сумму, строка за строкой, когда match равно True. Это продолжается до следующего ложного значения. Мой окончательный фрейм данных должен выглядеть так:

vote_prprtn uniform_votesh  p_by_q    ln_p_by_q   p_ln_p_by_q   match   final_val
0.0116     0.009367        1.238434   0.213848   0.002481       False    0.002481
0.0100     0.009367        1.067616   0.065428   0.000654       True     0.003135
0.0065     0.009367        0.693950  -0.365355   -0.002375      True     0.00076
0.0072     0.006000        1.200000   0.182321   0.001313       False    0.001313 
0.0048     0.006000        0.800000  -0.223143   -0.001071      True     0.000242

Любая помощь по этому вопросу действительно поможет мне понять параллели между excel и pandas.

Ответы [ 2 ]

2 голосов
/ 03 мая 2020

groupby с использованием группы, определенной каждым разом match==False, затем выполните cumsum для каждой группы.

df['final_val'] = df.groupby((~df.match).cumsum())['p_ln_p_by_q'].cumsum()

df['final_val']
# 0 0.002481
# 1 0.003135
# 2 0.000760
# 3 0.001313
# 4 0.000242
1 голос
/ 03 мая 2020

Я не знаю, как устроен ваш фрейм данных, но вы можете попробовать что-то в этом стиле:

sum = 0
for row in frame.rows:
 if(row.match == False):
  sum = 0
 sum += row.p_ln_p_by_q
 row.final_val = sum

(позаботьтесь, чтобы адаптировать способ чтения / записи в вашей строке, это просто псевдокод на основе Python).

...