Dask - Kubernetes - Пример учебника - PullRequest
0 голосов
/ 13 февраля 2019

Я только что закончил настройку Dask в кластере Kubernetes, используя Helm, и теперь, когда я хочу сделать базовые учебные пособия на ноутбуке jupyter, я сталкиваюсь со следующей ошибкой:

error-dask

Также я попытался в другом блокноте проанализировать набор данных объемом 40 ГБ, но очень медленно выполняются следующие команды (я просто импортирую 40 ГБ из GCS, а затем создаю value_counts в двоичном столбце):

import dask.dataframe as ddf
import gcsfs

fs = gcsfs.GCSFileSystem(project='tme-chrome')

fs.ls('tme-churning')

df = dd.read_csv('gs://tme-churning/*.csv')


df['churning'].value_counts().compute()

Большое спасибо за вашу помощь.Кажется, я что-то здесь упускаю.

1 Ответ

0 голосов
/ 20 февраля 2019

Я пытался воспроизвести эту проблему, используя диаграмму руля dask, найденную здесь , но не смог.Вот шаги, которые я предпринял:

1. helm install -n stable-dask stable/dask
2. Go to output Jupyter IP:PORT
3. Run the first few cells in the notebook.

Используете ли вы другую схему рулевого управления?

...