Как заказать записи в кадре данных Dask для отображения в seaborn? - PullRequest
0 голосов
/ 13 февраля 2019

Я пытаюсь получить барограф Seaborn, содержащий верхние записи n из кадра данных, отсортированные по одному из столбцов.

В Пандах я обычно делал это, используячто-то вроде этого:

df = df.sort_values('ColumnFoo', ascending=False)
sns.barplot(data=df[:10], x='ColumnFoo', y='ColumnBar')

Попытка Dask, тем не менее, (довольно очевидно) не позволяет сортировать данные, поскольку кадры данных являются в значительной степени отложенными объектами, и их сортировка исключает многие преимущества использованияВо-первых, Dask.

Есть ли возможность получить заказанные записи из фрейма данных, или чтобы Seaborn выбрал верхние значения n из столбца фрейма данных?

1 Ответ

0 голосов
/ 20 февраля 2019

Если вы перемещаете данные в seaborn, то они почти наверняка помещаются в память.Я рекомендую просто преобразовать в фрейм данных Pandas и затем выполнить там сортировку.

Как правило, после перехода в режим малых данных нет смысла использовать Dask вместо Pandas.Панды более зрелые и более гладкие.Разработчики Dask Dataframe рекомендуют использовать Pandas, когда это возможно.

...