Я пытаюсь объединить несколько кадров данных dask, но это приводит к израсходованию всей моей...
У меня есть большой файл CSV с некоторыми столбцами строкового типа (dtype object) и другими...
Я пытаюсь настроить и запустить Dask-Yarn, как описано на странице: https://yarn.dask
Я хочу сократить время процесса в пандах. Я пытался уменьшить объем памяти панд, используя метод
когда я использую многопроцессорность в обычной программе, она хорошо работает в пандах, но когда я...
Я работал над данными, которые больше моего графического процессора, и сейчас я пытаюсь...
Привет. Я пытаюсь сгладить и проанализировать только 7 из многих ключей: пары значений из 30...
У меня есть 5 CSV файлов примерно по 20 ГБ каждый. Я выполнил весь свой код, чтобы преобразовать и...
Я пытаюсь прочитать CSV-файл, используя dask (также pandas), но я получаю сообщение об ошибке ниже....
Я пытаюсь перенести некоторый код Pandas в Dask, и при чтении csv у меня возникает проблема -...
Я пытаюсь обработать некоторые файлы с помощью функции python и хотел бы распараллелить задачу на...
Это почти продолжение этого вопроса Передача модуля чистого Python работникам Dask У меня похожая...
Я пытаюсь использовать синтаксис groupby-apply с Dask, используя код Pandas в качестве исходного...
Я пытаюсь использовать dask dataframe map_partition, чтобы применить функцию, которая обращается к...
Я могу добавить рабочих в dask-планировщик, и они появляются в веб-интерфейсе, но рабочие...
Я хочу использовать Dask для загрузки определенных столбцов из множества файлов паркета, которые...
Я хочу выполнить N = 1000 начальной загрузки с заменой на сеточные данные.Одно вычисление занимает...
Я использую dask со следующими настройками одного / локального компьютера: ClusterWorkers=8...
Я использую самую легкую / простую dask многопроцессорную систему, которая является некластерной...
Я группирую результаты на основе двух ключей с df, содержащим 10M + строк, 5 столбцов, но после...
Я пытаюсь использовать dask.distributed Python API для запуска планировщика.Пример, приведенный в...
Я хотел бы распределить работу среди моих работников в Apache Airflow, основываясь на состоянии и...
У меня есть файл объемом 1,4 ГБ (около 20 миллионов строк) для чтения и вычисления. Сначала я...
У меня огромное (~ 2 миллиарда точек данных) xarray.DataArray. Я хотел бы случайно удалить (либо...
У меня большой рабочий процесс, который создает два разных массива с одинаковыми формами, но...