У меня есть фрейм данных, в котором некоторые ячейки содержат списки нескольких значений, например:
import pandas as pd
df = pd.DataFrame(
{'category': [[x,y,z],[x],[y,z],[x,z]]
'value': [20,30,20,10]
}
)
df
Out[10]:
category value
0 [x, y, z] 20
1 [x] 30
2 [y, z] 20
3 [x, z] 10
Я бы хотел сгруппировать данные по уникальным элементам в столбце category
и захватить оба счетчика. каждого элемента и среднего значения value
, в котором этот элемент присутствует.
Предполагаемый вывод должен выглядеть следующим образом:
count mean
x 3 20
y 2 20
z 3 16.7
Я относительно знаком с простыми групповыми функциями, и я возможность создать плоский список уникальных элементов (например, [x, y, z]). Однако я не уверен, как использовать этот плоский список для преобразования данных, как требуется выше. Помощь очень ценится!