Мне нужно рассчитать дисперсию каждой строки, учитывая внешний вид в отфильтрованном фрейме данных.
У меня есть df, как это:
TR REP ARV gij
18 2 5 6.862426088
43 4 2 6.277626188
43 4 1 6.104067722
48 4 4 6.081822411
48 6 5 5.942975638
48 3 2 5.942975638
43 9 1 5.826374178
48 2 3 5.804128866
df должен оставаться отфильтрованным по "gij"
Но мне нужно посчитать TR появления, в результате чего-то вроде этого:
TR REP ARV gij 18 43 48 var
18 2 5 6.862426088 1 0 0
43 4 2 6.277626188 1 1 0
43 4 1 6.104067722 1 2 0
48 4 4 6.081822411 1 2 1
48 6 5 5.942975638 1 2 2
48 3 2 5.942975638 1 2 3
43 9 1 5.826374178 1 3 3
48 2 3 5.804128866 1 3 4
Наконец, мне нужно вычислить и создать этот новый столбец var, составленный из дисперсии появлений (игнорируя 0) в каждой строке
Пример: var (1) в строке 1
var (1,1) в строке 2
var (1,2) в строке 3
Нет проблем в создании нового df с подсчетом для вычисления var, моя настоящая проблема в том, как создать несколько столбцов, считающих это, как это.
Есть идеи?
Спасибо.