Учитывая следующую таблицу данных
DT = dt.Frame({'A':['A','A','A','B','B','B'],
'B':['a','a','b','a','a','a'],
})
, я хотел бы создать столбец 'C', в котором нумеруются строки в каждой группе в столбцах A и B следующим образом:
A B C
0 A a 1
1 A a 2
2 A b 1
3 B a 1
4 B a 2
5 B a 3
Согласно этот поток для pandas cumcount () или rank () будет опциями, но, похоже, он не определен для pydatatable:
DT = DT[:, f[:].extend({'C': cumcount()}),by(f.A,f.B)]
DT = DT[:, f[:].extend({'C': rank(f.B)}),by(f.A,f.B)]
a) Как я могу пронумеровать строки в группах?
б) Есть ли исчерпывающий ресурс со всеми доступными в настоящее время функциями для pydatatable?