Вопросы с тегом даск - PullRequest

Вопросы с тегом даск

2 голосов
2 ответов

Я прочитал серию CSV-файлов. Каждый содержит историю данных транзакции для другого пользователя....

MikeB2019x / 01 мая 2019
2 голосов
1 ответ

У меня есть большой набор данных (50 миллионов строк), в котором мне нужно выполнить некоторые...

Ivo Leist / 01 мая 2019
0 голосов
0 ответов

Я пытаюсь использовать groupby() на dask dataframe, но получаю ValueError , упомянутую в заголовке,...

Vince_K / 01 мая 2019
0 голосов
1 ответ

Есть ли способ удалить строки, используя условие регулярных выражений в кадре данных dask? У меня...

Rob / 01 мая 2019
1 голос
1 ответ

Я пытаюсь нормализовать массив dask с уменьшением самого себя (например, b = a / a.sum() с a и b,...

willirath / 30 апреля 2019
0 голосов
1 ответ

Как разделить CSV-файл на несколько файлов с помощью Dask? Нижеследующий код, кажется, записывает...

mongotop / 30 апреля 2019
0 голосов
1 ответ

Я распространяю вычисления некоторых функций, используя Dask. Мой общий макет выглядит так: from...

gallamine / 30 апреля 2019
0 голосов
2 ответов
1 голос
1 ответ

Я использую пример кода для вычисления NDVI из Dask.Ссылка на код выглядит следующим образом. код...

parupalu / 30 апреля 2019
0 голосов
0 ответов

Как и в случае агрегирования, divk pivot_table уменьшает количество разделов до 1, что приводит к...

user670186 / 30 апреля 2019
0 голосов
1 ответ

Я хочу извлечь только 50 строк из Dask Dataframe, но не могу. Наконец, я хочу создать новый фрейм...

Haruka I / 30 апреля 2019
0 голосов
1 ответ

Следующий код предназначен для чтения простого файла .csv с четырьмя столбцами со строковыми...

MikeB2019x / 29 апреля 2019
0 голосов
1 ответ

У меня ошибка при чтении файла с dask, который работает с пандами: import dask.dataframe as dd...

Romain Jouin / 29 апреля 2019
0 голосов
0 ответов

Я хочу создать новый столбец из существующего столбца, применяя функцию. Если я пытаюсь...

elexhobby / 28 апреля 2019
2 голосов
2 ответов

Я получаю сообщение об ошибке, когда пытаюсь сохранить dask dataframe в csv.Короче говоря, у меня...

Martin Bobak / 27 апреля 2019
0 голосов
1 ответ

Мне нужно создать мультииндекс для dask, объединив два массива (предпочтительно dask). Я нашел...

mmann1123 / 26 апреля 2019
1 голос
1 ответ

Когда я создаю список отложенных задач и отправляю их для вычисления с scheduler = 'процессы',...

blue / 25 апреля 2019
0 голосов
1 ответ
0 голосов
1 ответ

это мой первый пост на stackoverflow, и я надеюсь, что выбрал правильную категорию.Итак, вот моя...

sgr / 25 апреля 2019
1 голос
1 ответ

Я читаю в 64 сжатых CSV-файлах (вероятно, 70-80 ГБ) в один фрейм данных dask, затем выполняю...

user670186 / 24 апреля 2019
0 голосов
1 ответ

Я преобразую 10 больших файлов фиксированной ширины (в среднем 19 ГБ) в паркет.Я делаю это,...

Phil / 24 апреля 2019
0 голосов
1 ответ

Я обновляю свои параметры каждую итерацию пакетом из очень большого файла.Но прежде чем я сделаю...

Joshua Jones / 24 апреля 2019
0 голосов
0 ответов

Я работаю над алгоритмом, который использует Dask, чтобы избежать ошибок памяти, так как данные...

Ángel / 23 апреля 2019
0 голосов
1 ответ

У меня есть фрейм данных, в котором хранятся журналы транзакций. Каждый журнал имеет свой хэш...

Mike_H / 23 апреля 2019
6 голосов
4 ответов

Из того, что я обнаружил, есть еще 1 такой вопрос ( Ускоренная вложенная перекрестная проверка ),...

DN1 / 23 апреля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...