Вопросы с тегом Даск

0 голосов

2 ответов

Как сохранить массив dask как файлы .png по частям?

Я использую конвейер машинного обучения для сегментации очень больших трехмерных изображений.Я...

Stefano van Gogh / 10 февраля 2019

0 голосов

1 ответ

Как разделить большой объект только для чтения среди распределенных работников Dask

Проблема Я пытаюсь отправить объект CPython объемом 2 ГБ, доступный только для чтения (может быть...

Hyperspace / 09 февраля 2019

0 голосов

0 ответов

Почему sort_index во время группового индекса занимает относительно много времени?

У меня есть CSV-файл с около 2 миллионов строк.Этот CSV-файл имеет столбец, который я установил в...

Stanko / 09 февраля 2019

0 голосов

1 ответ

Выполнение сценария Dask в кластере GCP

Я новичок в #GCP, и мой вопрос может показаться тривиальным (извините за это).Я уже разработал...

Mojtaba / 09 февраля 2019

0 голосов

1 ответ

Как объединить кадры данных с dask без нехватки памяти?

Слияние нескольких dask-данных приводит к сбою моего компьютера. Привет, Я пытаюсь объединить...

tomasvanoyen / 08 февраля 2019

0 голосов

1 ответ

Почему Dask заполняет "foo" и 1 в моем Dataframe

Я прочитал около 15 CSV-файлов: df = dd.read_csv("gs://project/*.csv", blocksize=25e6,...

Stanko / 08 февраля 2019

0 голосов

1 ответ

Как правильно выполнить многоиндексную нарезку на Dask DataFrame?

Я пытаюсь эффективно нарезать два индекса в Dask. Я пытался использовать .loc на втором уровне, но...

user2367949 / 08 февраля 2019

0 голосов

1 ответ

Что происходит в пустом пространстве на панели управления потоком распределенных задач?

Ниже находится панель управления потоком задач.Что происходит в пустом пространстве?Это когда мой...

kindjacket / 07 февраля 2019

0 голосов

1 ответ

Dask dataframe в файле require.txt?

Мне нужно установить несколько пакетов python в Docker-контейнер через requirements.txt, используя...

giosans / 07 февраля 2019

0 голосов

1 ответ

Как я могу объединить последовательное и параллельное выполнение отложенных вызовов функций?

Я застрял в странном месте.У меня есть куча отложенных вызовов функций, которые я хочу выполнить в...

suvayu / 07 февраля 2019

0 голосов

1 ответ

Взаимодействует ли Dask с HDFS для оптимизации локальности данных?

В распределенной Dask документации они имеют следующую информацию: Например, разработчики Dask...

Tarantula / 07 февраля 2019

0 голосов

1 ответ

Отправлять массивы dask распределенному клиенту, одновременно используя результаты

У меня есть dask массивы, которые представляют кадры видео и я хочу создать несколько видеофайлов.Я...

djhoese / 05 февраля 2019

0 голосов

1 ответ

Dask: Groupby с nlargest автоматически вводит индекс и не разрешает reset_index ()

Я пытался получить самые маленькие строки для группы, следуя методу из этого вопроса .Решение...

user1964692 / 03 февраля 2019

0 голосов

1 ответ

Как поместить одну строку в dask.dataframe?

Я пытаюсь выбрать только одну строку из dask.dataframe с помощью команды x.loc[0].compute()

Kornpob Bhirombhakdi / 02 февраля 2019

0 голосов

1 ответ

внутреннее соединение двух больших панд данных с использованием dask

У меня есть две большие таблицы, одна из которых сравнительно небольшая - 8 миллионов строк и один...

Yousef Oleyaeimotlagh / 02 февраля 2019

0 голосов

1 ответ

Прочитать таблицу ORCL в Dask dataframe

Использование cx_Oracle коннектора для чтения в pandas df работает нормально, например: import...

shanlodh / 01 февраля 2019

0 голосов

0 ответов

«Серия не может выполнить операцию **» в описанной рассылке.

Я использую Dask Distirbuted, статический кластер (1 рабочий).Набор данных довольно мал (1 МБ) и...

Vladyslav Moisieienkov / 01 февраля 2019

0 голосов

1 ответ

Работники Dask в Kubernetes не могут найти файл CSV

Я настроил Dask и JupyterHub на кластере Kubernetes, используя Helm с помощью документации Dask:...

Stanko / 01 февраля 2019

0 голосов

1 ответ

Инициализация состояния работников, распределенных по даскам

Я пытаюсь сделать что-то вроде resource = MyResource() def fn(x): something = dosemthing(x,...

Daniel Mahler / 01 февраля 2019

0 голосов

0 ответов

dask, joblib, ipyparallel и другие планировщики для смущающих параллельных задач

Это более общий вопрос о том, как запустить «смущающе параллельные» проблемы с «планировщиками»...

Wolfgang Kerzendorf / 01 февраля 2019

0 голосов

1 ответ

Dask Задержка кэширования

Каково текущее состояние дел в отношении интеграции кэширования в графы с задержкой времени?У меня...

headsling / 31 января 2019

0 голосов

1 ответ

Слияние DataFrame с Dask и преобразовать его в панд

У меня есть два фрейма данных dataframe1: >df_case = dd.read_csv('s3://../.../df_case

Nasri / 31 января 2019

0 голосов

1 ответ

Каково количество рабочих по умолчанию в вычислении?

@delayed def do_something(): # Does some work pass futures = [do_something() for x in range(100)]...

Geethanadh / 31 января 2019

0 голосов

1 ответ

Ошибка памяти Dask при запуске df.to_csv ()

Я пытаюсь проиндексировать и сохранить большие CSV-файлы, которые не могут быть загружены в память

D.Griffiths / 31 января 2019

0 голосов

1 ответ

Dask compute () для коллекции, которая не помещается в памяти

Какая альтернатива dask.compute(), если коллекция не помещается в памяти?Какое-то отображение...

Ryan McCormick / 31 января 2019