Извинения, потому что я не знаю достаточно, чтобы правильно задать этот вопрос; все, что я знаю,...
Загружая хранилище данных Azure через Polybase, я читаю файлы Parquet, которые находятся в...
Я настраиваю приемника для чтения сообщений kafka, их агрегирования небольшими партиями и помещения...
Я работаю над кластером HDP и пытаюсь прочитать файл .csv из HDFS, используя pyarrow .Я могу...
Вопрос Как использовать Dask Distributed для распараллеливания чтения каталога файлов в отдельные...
Я устанавливаю pyarrow 0.13.0 в виртуальной среде на Ubuntu 16.04, используя pip, и он был успешно...
Вариант использования Я использую файлы Apache Parquet в качестве быстрого формата ввода-вывода для...
Я хочу извлечь и обработать данные изображения (3D-массив), доступные в формате base64, используя...
Я пытаюсь импортировать pandarallel.Во время импорта я получаю эту ошибку: File...
Можно ли издеваться над декларацией import pyarrow.parquet as pq? Я пытаюсь смоделировать это как:...
У меня есть работа Glue, которая записывает файлы паркета в S3 каждые 6 секунд, а у S3 есть папка...
На этой странице документации по Apache arrow https://arrow.apache.org/docs/format/Metadata.html...
Я пытаюсь использовать Пользовательские функции Pandas (a.k.a. Векторизованные пользовательские...
Я собрал libarrow.so и pyarrow из исходного кода, используя gcc7.2 в Redhat 7.4.Тем не менее, я...
Паркет создан Spark v2.4 Parquet-mr v1.10 n = 10000 x = [1.0, 2.0, 3.0, 4.0, 5.0, 5.0, None] * n y...
Я сейчас ломаю голову над этим. Я новичок в этих parquet файлах, и у меня много проблем с ним. Мне...
У меня проблема с объединением двух фреймов данных. Странная часть в том, что это сработало - но...
Какие преобразования вы можете применить к таблице Arrow? Является ли его основное использование...
Я использую Python 3.7.2 и использую Miniconda3 для создания новой среды с именем test-env. Я...
Я хочу написать файл партера, который содержит несколько обычных столбцов с данными 1d-массива и...
Я использую Python со средой Conda и установил pyarrow с: conda install pyarrow После этого...
В Python мы можем проверить zip-файл, используя метод zipfile.is_zipfile https://docs.python
У меня проблема с типами файлов при преобразовании файла паркета в фрейм данных. Я делаю bucket =...
import pyarrow as pa client = pa.hdfs.connect('localhost', 9000) ОШИБКА Traceback (most...
Я хочу сохранить следующий кадр данных pandas в файле паркета с помощью PyArrow: import pandas as...