Вопросы с тегом pyarrow - PullRequest

Вопросы с тегом pyarrow

0 голосов
0 ответов

Извинения, потому что я не знаю достаточно, чтобы правильно задать этот вопрос; все, что я знаю,...

Dan / 19 апреля 2019
0 голосов
1 ответ

Загружая хранилище данных Azure через Polybase, я читаю файлы Parquet, которые находятся в...

Josh D / 17 апреля 2019
0 голосов
0 ответов

Я настраиваю приемника для чтения сообщений kafka, их агрегирования небольшими партиями и помещения...

Eugene / 16 апреля 2019
0 голосов
1 ответ

Я работаю над кластером HDP и пытаюсь прочитать файл .csv из HDFS, используя pyarrow .Я могу...

Sevy / 16 апреля 2019
2 голосов
1 ответ

Вопрос Как использовать Dask Distributed для распараллеливания чтения каталога файлов в отдельные...

Dan / 15 апреля 2019
0 голосов
1 ответ

Я устанавливаю pyarrow 0.13.0 в виртуальной среде на Ubuntu 16.04, используя pip, и он был успешно...

Stella Ella / 06 апреля 2019
2 голосов
1 ответ

Вариант использования Я использую файлы Apache Parquet в качестве быстрого формата ввода-вывода для...

d.arcy / 06 апреля 2019
1 голос
0 ответов

Я хочу извлечь и обработать данные изображения (3D-массив), доступные в формате base64, используя...

Prashant Jain / 05 апреля 2019
2 голосов
1 ответ

Я пытаюсь импортировать pandarallel.Во время импорта я получаю эту ошибку: File...

saeed_ar / 04 апреля 2019
1 голос
1 ответ

Можно ли издеваться над декларацией import pyarrow.parquet as pq? Я пытаюсь смоделировать это как:...

placplacboom / 02 апреля 2019
1 голос
0 ответов

У меня есть работа Glue, которая записывает файлы паркета в S3 каждые 6 секунд, а у S3 есть папка...

prakash / 01 апреля 2019
0 голосов
1 ответ

На этой странице документации по Apache arrow https://arrow.apache.org/docs/format/Metadata.html...

Wrecker / 30 марта 2019
0 голосов
1 ответ

Я пытаюсь использовать Пользовательские функции Pandas (a.k.a. Векторизованные пользовательские...

Jacek Laskowski / 27 марта 2019
0 голосов
1 ответ

Я собрал libarrow.so и pyarrow из исходного кода, используя gcc7.2 в Redhat 7.4.Тем не менее, я...

nasica88 / 26 марта 2019
1 голос
1 ответ

Паркет создан Spark v2.4 Parquet-mr v1.10 n = 10000 x = [1.0, 2.0, 3.0, 4.0, 5.0, 5.0, None] * n y...

colinfang / 18 марта 2019
0 голосов
1 ответ

Я сейчас ломаю голову над этим. Я новичок в этих parquet файлах, и у меня много проблем с ним. Мне...

Anonymous Person / 13 марта 2019
0 голосов
0 ответов

У меня проблема с объединением двух фреймов данных. Странная часть в том, что это сработало - но...

Anonymous Person / 13 марта 2019
0 голосов
1 ответ

Какие преобразования вы можете применить к таблице Arrow? Является ли его основное использование...

marz / 08 марта 2019
0 голосов
1 ответ

Я использую Python 3.7.2 и использую Miniconda3 для создания новой среды с именем test-env. Я...

Nester / 07 марта 2019
0 голосов
0 ответов

Я хочу написать файл партера, который содержит несколько обычных столбцов с данными 1d-массива и...

S.B.G / 04 марта 2019
0 голосов
2 ответов

Я использую Python со средой Conda и установил pyarrow с: conda install pyarrow После этого...

Joe / 04 марта 2019
0 голосов
1 ответ

В Python мы можем проверить zip-файл, используя метод zipfile.is_zipfile https://docs.python

Himalay Majumdar / 26 февраля 2019
0 голосов
0 ответов

У меня проблема с типами файлов при преобразовании файла паркета в фрейм данных. Я делаю bucket =...

clog14 / 25 февраля 2019
0 голосов
0 ответов

import pyarrow as pa client = pa.hdfs.connect('localhost', 9000) ОШИБКА Traceback (most...

wyx / 24 февраля 2019
0 голосов
0 ответов

Я хочу сохранить следующий кадр данных pandas в файле паркета с помощью PyArrow: import pandas as...

SergiyKolesnikov / 22 февраля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...