Вопросы с тегом Даск - PullRequest

Вопросы с тегом Даск

2 голосов
1 ответ

Я пытаюсь объединить несколько кадров данных dask, но это приводит к израсходованию всей моей...

Peter Force / 29 мая 2019
0 голосов
1 ответ

У меня есть большой файл CSV с некоторыми столбцами строкового типа (dtype object) и другими...

A. Sarid / 29 мая 2019
0 голосов
1 ответ

Я пытаюсь настроить и запустить Dask-Yarn, как описано на странице: https://yarn.dask

aaron02 / 28 мая 2019
0 голосов
0 ответов

Я хочу сократить время процесса в пандах. Я пытался уменьшить объем памяти панд, используя метод

Himanshu Kumar / 28 мая 2019
0 голосов
1 ответ

когда я использую многопроцессорность в обычной программе, она хорошо работает в пандах, но когда я...

Himanshu Kumar / 28 мая 2019
0 голосов
0 ответов

Я работал над данными, которые больше моего графического процессора, и сейчас я пытаюсь...

Bryce Booze / 28 мая 2019
0 голосов
1 ответ

Привет. Я пытаюсь сгладить и проанализировать только 7 из многих ключей: пары значений из 30...

zim68 / 27 мая 2019
0 голосов
1 ответ

У меня есть 5 CSV файлов примерно по 20 ГБ каждый. Я выполнил весь свой код, чтобы преобразовать и...

nolw38 / 27 мая 2019
0 голосов
0 ответов

Я пытаюсь прочитать CSV-файл, используя dask (также pandas), но я получаю сообщение об ошибке ниже....

amoolya / 27 мая 2019
0 голосов
0 ответов

Я пытаюсь перенести некоторый код Pandas в Dask, и при чтении csv у меня возникает проблема -...

dan / 26 мая 2019
0 голосов
1 ответ

Я пытаюсь обработать некоторые файлы с помощью функции python и хотел бы распараллелить задачу на...

BND / 26 мая 2019
1 голос
1 ответ

Это почти продолжение этого вопроса Передача модуля чистого Python работникам Dask У меня похожая...

Martin Campbell / 26 мая 2019
0 голосов
0 ответов

Я пытаюсь использовать синтаксис groupby-apply с Dask, используя код Pandas в качестве исходного...

shanlodh / 25 мая 2019
0 голосов
1 ответ

Я пытаюсь использовать dask dataframe map_partition, чтобы применить функцию, которая обращается к...

BND / 25 мая 2019
0 голосов
1 ответ

Я могу добавить рабочих в dask-планировщик, и они появляются в веб-интерфейсе, но рабочие...

dan / 25 мая 2019
0 голосов
1 ответ

Я хочу использовать Dask для загрузки определенных столбцов из множества файлов паркета, которые...

Nick Fernandez / 24 мая 2019
3 голосов
0 ответов

Я хочу выполнить N = 1000 начальной загрузки с заменой на сеточные данные.Одно вычисление занимает...

aaron.spring / 23 мая 2019
1 голос
1 ответ

Я использую dask со следующими настройками одного / локального компьютера: ClusterWorkers=8...

javadba / 23 мая 2019
1 голос
0 ответов

Я использую самую легкую / простую dask многопроцессорную систему, которая является некластерной...

javadba / 23 мая 2019
0 голосов
0 ответов

Я группирую результаты на основе двух ключей с df, содержащим 10M + строк, 5 столбцов, но после...

newman / 23 мая 2019
0 голосов
1 ответ

Я пытаюсь использовать dask.distributed Python API для запуска планировщика.Пример, приведенный в...

Alin Bobolea / 22 мая 2019
0 голосов
1 ответ

Я хотел бы распределить работу среди моих работников в Apache Airflow, основываясь на состоянии и...

aidan.plenert.macdonald / 22 мая 2019
0 голосов
0 ответов

У меня есть файл объемом 1,4 ГБ (около 20 миллионов строк) для чтения и вычисления. Сначала я...

Guillaume / 22 мая 2019
2 голосов
1 ответ

У меня огромное (~ 2 миллиарда точек данных) xarray.DataArray. Я хотел бы случайно удалить (либо...

climachine / 22 мая 2019
0 голосов
1 ответ

У меня большой рабочий процесс, который создает два разных массива с одинаковыми формами, но...

Eric Eckert / 21 мая 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...