Я хотел бы получить статистику по длинам списка в столбце pandas df, таким как средняя длина, минимальное, максимальное, стандартное отклонение и т. Д.
Пример:
import pandas as pd
dfp = pd.DataFrame(
{'trial_num': [[1, 2, 3, 1, 2, 3], [3,4,6,7], [2,2]],
'subject': [[11, 2, 2, 2],[2,2,7],[4]]
}
)
dfp
Вывод:
trial_num subject
0 [1, 2, 3, 1, 2, 3] [11, 2, 2, 2]
1 [3, 4, 6, 7] [2, 2, 7]
2 [2, 2] [4]
Итак, для этого кадра данных мне нужна статистика по столбцам trial_num
и subject
.
Что-то вроде
trial_num
Average: 4
High: 6
Low: 2
Stdev: 2
То, что я пробовал
Я пытался
dfp.describe()
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-90-8a598dabea30> in <module>()
----> 1 dfp.describe()
6 frames
/usr/local/lib/python3.6/dist-packages/pandas/core/algorithms.py in _value_counts_arraylike(values, dropna)
748 # TODO: handle uint8
749 f = getattr(htable, "value_count_{dtype}".format(dtype=ndtype))
--> 750 keys, counts = f(values, dropna)
751
752 mask = isna(values)
pandas/_libs/hashtable_func_helper.pxi in pandas._libs.hashtable.value_count_object()
pandas/_libs/hashtable_func_helper.pxi in pandas._libs.hashtable.value_count_object()
TypeError: unhashable type: 'list'
Единственное решение, которое я могу придумать, - это использоватьдля вычисления среднего значения, максимума и минимума, затем со средним значением снова использовать итерроу для вычисления стандартного значения