Я пытаюсь прочитать один большой parquet файл (размер> gpu_size), используя dask_cudf / dask, но в...
В настоящее время я студент бакалавриата по науке о данных и пытаюсь использовать платформу Google...
Я пытаюсь выполнить базовый ETL рабочий процесс для больших файлов среди работников, используя...
Я делюсь своими данными в формате стрелки в виде стрелки в виде потока;и нужно использовать его из...
У меня есть 2000 паркетных файлов в каталоге.Размер каждого файла паркета составляет около 20 МБ
драйвер cuda установлен. CUDF установлен с Конда. Я пытаюсь импортировать cudf, но получается...
Я использую cuML для стохастического градиентного спуска. Я использовал sklearn's train_test_split...
Панд: data = data.dropna(axis = 'columns') Я пытаюсь сделать что-то подобное, используя...
Меня интересуют рекомендуемые и быстрые способы создания фреймов данных cudf из плотных крошечных...