Ioannis Kavadakis 28 марта 2020 68

Реализуйте df.groupby ('user') ['item']. Apply (np.array) в cuDF

Ioannis Kavadakis / 28 марта 2020

Есть ли способ скопировать эту простую pandas функциональность в cuDF?

Обратите внимание, что длины массивов различаются.

Пример ожидаемого вывода с использованием pandas и NumPy (CuPy в случае cuDF) можно найти ниже:

import pandas as pd
import numpy as np
df = pd.DataFrame({'user':[0,1,0,2,1], 'item':[1,2,3,4,5]})
res = df.groupby('user')['item'].apply(np.array)
res
# Output:
# user
# 0    [1, 3]
# 1    [2, 5]
# 2       [4]
# Name: item, dtype: object

...