У меня есть датафрейм для панд:
d = {'group' : [1, 1, 2, 2], 'histogram' : [[1,2,3], [4,5,6], [7,8,9],[10,11,12]]}
df = pd.DataFrame(d)
Фрейм данных содержит результаты анализа гистограммы. Цель состоит в том, чтобы создать двумерные массивы для каждой группы. т.е.
для группы 1, двумерный массив numpy будет np.array([[1,2,3],[4,5,6]])
. Форма будет (3,2)
Я попробовал следующее:
df_test = pd.DataFrame(df.groupby("group").agg({'histogram':'count',
'histogram':lambda x: np.vstack(x)}))
однако я получаю следующую ошибку:
Исключение: должен производить агрегированную стоимость
Конечно, я мог бы перебрать данные, отфильтровать по группам и использовать
np.vstack(df_filtered["histogram"])
но я думаю, должен быть более дружелюбный способ для панд. В конце концов я буду анализировать 2D-массивы в модель Keras.