Я использую утилиту as_pandas из impala.util для чтения данных в форме dataframe, извлеченной из...
Я хочу сделать подсчет частоты.Представьте себе этот список людей и их возраст: IN [110]: b = db
Я пытаюсь освоить dask, чтобы иметь возможность выполнять некоторые вычисления для 18-летнего...
Я попытался применить фильтр для удаления столбцов со слишком большим количеством NA в моем фрейме...
Я действительно новичок в сумерках.Я хочу создать Dask DataFrame из списка кортежей Python.В pandas...
Я использую приведенный ниже код, но получаю сообщение об ошибке после поворота фрейма данных:...
У меня есть набор данных, хранящийся в текстовом файле с разделителями табуляции.Файл выглядит...
Надеюсь, у вас замечательный день! У меня возникла проблема при записи файла .csv, который основан...
Я пытаюсь использовать Ctrl + C, чтобы изящно остановить мой работающий код, включая локальный...
Я пытаюсь добавить несколько столбцов в фрейм данных dask, чтобы сохранить результаты применения...
Я хочу настроить Dask для распространения DAG в Airflow.Я прочитал https://airflow.apache
Я делаю Монте-Карло для модели и решил, что Даск может быть весьма полезен для этой цели.Первые 35...
Я пытаюсь научиться использовать DataFrame dask, у меня две проблемы: Невозможно прочитать набор...
Похоже, что мы можем достичь одной и той же цели, используя pivot_table из обеих библиотек, но...
Я работаю над этим соревнованием Kaggle как финальным проектом для курса, который я беру, и для...
У меня есть динамический кластер Dask Kubernetes.Я хочу загрузить 35 файлов паркета (около 1,2 ГБ)...
Я использовал пользовательский словарь, подобный объекту, чтобы легко хранить результаты Dask-графа...
У меня есть датафрейм, состоящий из 5 миллионов записей.Я пытаюсь обработать его, используя...
Я пытаюсь понять этот простой пример из документации dask-jobqueue : from dask_jobqueue import...
Я пытаюсь выполнить простое смущающее параллельное чтение 24 файлов научных данных, каждый размером...
Можно ли записать dask / pandas DataFrame в паркет, а затем вернуть строку байтов?Я знаю, что это...
Я читаю документацию по dask.distributed и похоже, что я мог бы передавать функции в распределенный...
Я использую dask для задержки вычислений некоторых функций, которые возвращают ряды в моей кодовой...
У меня есть Dask DataFrames , который содержит индекс, который не является уникальным (client_id)
Как лучше всего распределить задачу по набору данных, использующему относительно дорогой для...