Я пытаюсь использовать функцию describe() and unstack()
в dask для получения сводной статистики данных.
Однако я получаю сообщение об ошибке, как показано ниже
import dask.dataframe as dd
df = dd.read_csv('Measurement_table.csv',assume_missing=True)
df.describe().compute() #this works but when I try to use `unstack`, i get an error
На самом деле яя пытаюсь заставить приведенный ниже код Python-панд работать быстрее с помощью dask
df.groupby(['person_id','measurement_concept_id','visit_occurrence_id'])['value_as_number']
.describe()
.unstack()
.swaplevel(0,1,axis=1)
.reindex(df['readings'].unique(), axis=1, level=0)
Я пытался добавить compute()
к каждому выходному каскаду, как показано ниже
df1 = df.groupby(['person_id','measurement_concept_id','visit_occurrence_id'])['value_as_number'].describe().unstack().swaplevel(0,1,axis=1).reindex(df['readings'].unique(), axis=1, level=0).compute()
Я получаюошибка ниже, но same works well in pandas
Может кто-нибудь помочь мне решить эту проблему?