Как посчитать значения появления столбца и привести к нескольким столбцам с частотой каждого наблюдения - PullRequest
0 голосов
/ 05 сентября 2018

Мне нужно рассчитать дисперсию каждой строки, учитывая внешний вид в отфильтрованном фрейме данных.

У меня есть df, как это:

TR REP ARV   gij
18  2   5   6.862426088
43  4   2   6.277626188
43  4   1   6.104067722
48  4   4   6.081822411
48  6   5   5.942975638
48  3   2   5.942975638
43  9   1   5.826374178
48  2   3   5.804128866

df должен оставаться отфильтрованным по "gij" Но мне нужно посчитать TR появления, в результате чего-то вроде этого:

TR REP ARV      gij      18    43    48    var
18  2   5   6.862426088   1     0     0
43  4   2   6.277626188   1     1     0
43  4   1   6.104067722   1     2     0
48  4   4   6.081822411   1     2     1
48  6   5   5.942975638   1     2     2
48  3   2   5.942975638   1     2     3
43  9   1   5.826374178   1     3     3
48  2   3   5.804128866   1     3     4

Наконец, мне нужно вычислить и создать этот новый столбец var, составленный из дисперсии появлений (игнорируя 0) в каждой строке Пример: var (1) в строке 1 var (1,1) в строке 2 var (1,2) в строке 3

Нет проблем в создании нового df с подсчетом для вычисления var, моя настоящая проблема в том, как создать несколько столбцов, считающих это, как это.

Есть идеи? Спасибо.

...