У меня есть dask фрейм данных с одним проблемным столбцом, который (я считаю) является источником...
У меня много .7z файлов, каждый файл содержит много больших CSV файлов (более 1 ГБ).Как я могу...
Я хочу уменьшить размерность данных, используя около 3000 строк и 6000 столбцов.Здесь количество...
У меня есть два набора dask с формой X:(nan, 42), y:(nan,).Моя цель - вписать их в модель...
Я использую Dask для распределения работы по кластеру.Я создаю кластер и вызываю .submit() для...
Я пытаюсь объединить несколько фреймов данных панд в большой фрейм данных Dask с полями ["a_id",...
У меня 250 миллионов наборов строк данных с 2 столбцами "id" и "balance" столбцы id = IX43124 Как...
У меня есть фрейм данных dask (df) с примерно 250 миллионами строк (из файла CSV 10 Гб).У меня есть...
Задержки пропускной способности шины PCIE накладывают ограничения на то, как и когда приложения...
У меня есть 2 фрейма данных, один из которых называется аниме ~ 10 тыс. Строк данных, а другой...
Я использую Google Cloud Datalab для моего проекта ML.Одна из моих данных находится в таблице...
Цель = многостолбцовая группа в рамке данных dask и отфильтровать группы, содержащие менее 3 строк....
Я не могу понять, как изящно выпустить выделенный SLURMCluster.Мой код делает это: from dask_import...
Я пытаюсь получить барограф Seaborn, содержащий верхние записи n из кадра данных, отсортированные...
Я только что закончил настройку Dask в кластере Kubernetes, используя Helm, и теперь, когда я хочу...
Когда вы вызываете S3FileSystem (). Open (..., fill_cache = True), похоже, что он все еще идет к s3...
Я работаю над системой HPC ( Cheyenne * от NCAR ) и хочу сделать несколько вещей с большим набором...
Я использую Dask YARN для создания такого приложения: spec = skein.ApplicationSpec( ... ) cluster =...
У меня есть небольшой кластер, на котором я развертываю граф dask, используя: from dask.distributed...
У меня есть кластер с установленным hadoop: hadoop version Hadoop 3.1.1.3.0.1.0-187 Source code...
Я пишу программу на python, которая должна прочитать примерно 300 строк на 30 столбцов (файл csv 51...
Я пытаюсь преобразовать столбец в категорию для выполнения операции сводной таблицы. Я пробовал...
Модуль Python xarray значительно поддерживает загрузку / отображение файлов netCDF, даже лениво с...
Я довольно новичок в Dask и большинство моих файлов было в Avro (перенесено из PySpark).Я попытался...
Взято дословно из учебника по dask from time import sleep def inc(x): sleep(1) return x + 1 def...