Я начинаю с Даск.Для моего собственного понимания (и понимания моих коллег, которому я хочу...
Scikit-Learn уже предоставляет параллельные вычисления на одной машине с Joblib. Но я хочу...
В PySpark всякий раз, когда я выстраиваю ряд сложных операций на очень большом фрейме данных df и...
Я пытаюсь выяснить, как лучше составить карту серии с большим отображением.Простое series
Этот код дает мне самое высокое значение и имя столбца. import numpy as np import pandas as pd...
Действие Попытка создать массив Dask из стека .npy файлов, не записанных Dask. Проблема Dask...
Я пытаюсь понять шаблоны использования Dask на локальной машине. В частности, У меня есть набор...
Как узнать длину кадра данных, используя dask? Например, в пандах я могу сделать: import pandas as...
Я пытаюсь запустить этот тест на небольшом кластере dask, состоящем из двух узлов.Удаленный...
Я только что скачал dask_ml и не могу использовать класс предварительной обработки. Сначала я...
У меня есть продажный DataFrame, который имеет 28M строк, а также некоторые другие кадры данных, а...
У меня есть датафрейм dask с индексом по одному из столбцов.Проблема в том, что если я выполняю df
Я пытаюсь рассчитать суточную Tmax из трехчасового набора глобальных данных.Я могу сделать это с...
Я пытаюсь объединить несколько геоданных, используя пакет Python Dask.При реализации моего...
Следующая операция работает, но занимает почти 2 часа: from dask import dataframe as ddf ddf
У меня есть датафрейм для панд.Я сохраняю его на паркет, используя spark, а затем пытаюсь читать...
Я пытаюсь записать массив dask в файл netcdf и получаю сообщение об ошибке памяти, которое я нахожу...
У меня есть вопрос о форме массива Dask после использования метода apply_along_axis: import dask
Я пытаюсь парализовать некоторые операции, которые нужно выполнить на Dask Dataframe, но я не...
Я пытаюсь запустить работу на большом фрейме данных.По сути, в рамках датафрейма есть две группы, и...
Может ли кто-нибудь объяснить, как исправить эту ошибку Где я могу получить подробную информацию о...
Я реализовал нечеткую строку, сопоставляющую алгоритм между двумя фреймами данных, используя только...
У меня есть программа, в которой каждая задача - это вызов внешней программы C ++ через subprocess
Я пытаюсь свернуть строки кадра данных на основе ключа. Мой файл большой, и панды выдают ошибку...
Выполнение .Shape дает мне следующую ошибку. AttributeError: у объекта 'DataFrame' нет атрибута...