Я нахожусь в ситуации, когда мне нужно записать большой набор данных на диск, и у меня возникают проблемы, которые не позволяют рабочим «зависнуть»: память продолжает увеличиваться, пока не достигнет доли паузы (0,5), а затем больше ничего не происходит (согласно на приборной панели). Я пытался работать на минимальном примере, но не могу воспроизвести такое поведение, так как я читаю большой набор данных.
Как я могу продолжить отладку в такой ситуации?
Платформа - HP C .
распределено настроено в соответствии с:
memory:
target: false # target fraction to stay below
spill: false # fraction at which we spill to disk
pause: 0.50 # fraction at which we pause worker threads
terminate: 0.95 # fraction at which we terminate the worker
Вот обзор графика для записи подмножества из 2 файлов:
dask graph