У меня есть фрейм данных, который выглядит следующим образом:
Id Day1 Day2 Day3
1 0.35 0.32 0.29
2 0.63 0.59 0.58
3 0.12 0.10 0.07
Эта таблица показывает вероятность определенного события, происходящего в каждый день, для каждой записи.
Я ищу функцию python, которая даст мне совокупную вероятность события, произошедшего в любой день. Вывод будет выглядеть следующим образом:
Id Day1 Day2 Day3 Cum_Prob
1 0.35 0.32 0.29 0.686
2 0.63 0.59 0.58 0.983
3 0.12 0.10 0.07 0.263
Значения Cum_Prob
в приведенной выше таблице примеров являются правильными, т.е. они представляют собой фактическую вероятность события, произошедшего в любой из 3 дней для каждого значения Id
.
Я сам могу написать эту функцию на пару дней. В действительности, я имею дело с более чем 3 днями, и я считаю, что написание этой функции в течение многих дней будет чрезвычайно утомительным.
Существует ли уже существующая функция, которая может вычислять вероятность из ввод индивидуальных вероятностей? Или есть быстрый способ написать для этого udf за x дней?