Получить строки, где определенное значение столбца присутствует между 1-й и текущей строкой - PullRequest
0 голосов
/ 25 апреля 2018

Я хочу вычислить отношения между текущей строкой и 1-й строкой. Я сохраню строки в другом фрейме данных, подсчитываю строки со значением True, а затем подсчитываю строки со значением False, а затем нахожу соотношение. Это похоже на то, как соотношение меняется с каждой новой строкой.

Один из способов достижения этого выглядит так:

iterate between 0 to current row:    
        find_rows where name = 'X' 
        countTrue 
        return countTrue/totalCount 

Однако, я думаю, что это не разумный подход, потому что у меня DataFrame 4 миллиона строк, и цикл выше будет вычислять для каждой строки. Я ищу что-то вроде numpy.cumsum, имея возможность использовать данные только между 1-й и текущей строкой.

Пример кадра данных:

     name     attendance
0    X        True        
1    A        False
2    B        True
3    D        False
4    X        False
5    C        True
6    Z        False
7    X        True

Предположим, я на восьмой строке, я хочу посмотреть на все предыдущие строки и вычислить X 'истинное' соотношение

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...