Невозможно преобразовать dask.dataframe с помощью dask.pivot_table - PullRequest
0 голосов
/ 18 апреля 2019

Я хочу преобразовать фрейм данных с помощью dask.pivot_talbe.Сначала я группирую по данным и получаю выходные данные.

agg_dict = {
    'value': ['count', on_count, off_count, 'max', 'min', 'mean', 'std']
}
df = dd.read_csv(filename, engine='python')
df = df.groupby(['addr', 'timestamp']).agg(agg_dict)

df.compute()

Затем я хочу использовать pivot_table для преобразования кадра данных.

df.pivot_table(index='timestamp', columns='addr', values='value')

получить ошибку:

ValueError: 'columns' должно быть именем существующего столбца

как это исправить?

1 Ответ

0 голосов
/ 18 апреля 2019

Как следует из сообщения, вы хотите, чтобы addr был столбцом, но после группировки он будет частью индекса, поэтому вам нужно

df = df.reset_index()

перед сводкой.

Обратите внимание, что это не имеет никакого отношения к Dask, потому что вы позвонили compute(), давая вам обычный фрейм данных Pandas.

...