Dask - Понимание диагностики - память: список - PullRequest
1 голос
/ 05 ноября 2019

Я работаю над довольно сложным приложением, использующим Dask Framework, и пытаюсь повысить производительность. С этой целью я смотрю на панель диагностики. У меня есть два варианта использования. Во-первых, у меня есть паркетный файл размером 1 ГБ, разделенный на 50 частей, а во втором случае у меня есть первая часть вышеуказанного файла, разделенная на 5 частей, что используется для следующих диаграмм:

enter image description here

Красный узел называется «память: список», и я не понимаю, что это такое. Когда выполняется больший ввод, это, кажется, блокирует всю операцию.

enter image description here

Наконец, это то, что я вижу, когда захожу внутрь этих узлов:

enter image description here

Я не уверен, с чего мне начать, чтобы понять, что генерирует этот memory:list узел, особенно учитывая, что внутри задачи нет кнопки стека, какэто часто случается. Есть предложения?

1 Ответ

0 голосов
/ 06 ноября 2019

Красные узлы находятся в памяти. Таким образом, это вычисление произошло, и результат находится в памяти на некоторой машине.

Похоже, типом данных является объект Python list. Кроме того, имя задачи - list-159..., поэтому, вероятно, это результат вызова функции list Python.

...