Я хочу вычислить отношения между текущей строкой и 1-й строкой. Я сохраню строки в другом фрейме данных, подсчитываю строки со значением True, а затем подсчитываю строки со значением False, а затем нахожу соотношение. Это похоже на то, как соотношение меняется с каждой новой строкой.
Один из способов достижения этого выглядит так:
iterate between 0 to current row:
find_rows where name = 'X'
countTrue
return countTrue/totalCount
Однако, я думаю, что это не разумный подход, потому что у меня DataFrame 4 миллиона строк, и цикл выше будет вычислять для каждой строки.
Я ищу что-то вроде numpy.cumsum
, имея возможность использовать данные только между 1-й и текущей строкой.
Пример кадра данных:
name attendance
0 X True
1 A False
2 B True
3 D False
4 X False
5 C True
6 Z False
7 X True
Предположим, я на восьмой строке, я хочу посмотреть на все предыдущие строки и вычислить X
'истинное' соотношение