Есть ли способ скопировать эту простую pandas функциональность в cuDF?
Обратите внимание, что длины массивов различаются.
Пример ожидаемого вывода с использованием pandas и NumPy (CuPy в случае cuDF) можно найти ниже:
import pandas as pd
import numpy as np
df = pd.DataFrame({'user':[0,1,0,2,1], 'item':[1,2,3,4,5]})
res = df.groupby('user')['item'].apply(np.array)
res
# Output:
# user
# 0 [1, 3]
# 1 [2, 5]
# 2 [4]
# Name: item, dtype: object