Question

Какая альтернатива dask.compute(), если коллекция не помещается в памяти?Какое-то отображение памяти?

Я просмотрел эту документацию , но не увидел на первый взгляд.

MRocklin · Answer 1 · 31 января 2019

Вы правы, что при вызове .compute() часто создается объект в памяти, такой как массив NumPy или Pandas DataFrame, который должен помещаться в памяти.

Часто это не проблема, потому что результаты многих анализов имеют тенденцию быть маленькими (как точки данных, которые заканчиваются на графике), или потому что выходные данные намеренно сохраняются, как в случаеdf.to_parquet('...').Однако иногда вы хотите запускать вычисления, но храните данные в распределенной памяти.В этом случае люди склонны использовать метод .persist() вместо .compute().

См. Документацию persist API для получения дополнительной информации.

Dask compute () для коллекции, которая не помещается в памяти

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Dask compute () для коллекции, которая не помещается в памяти

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы