Вопросы с тегом pyarrow

0 голосов

0 ответов

Ошибка сегментации 11 при отображении файлов HDFS

Извинения, потому что я не знаю достаточно, чтобы правильно задать этот вопрос; все, что я знаю,...

Dan / 19 апреля 2019

0 голосов

1 ответ

Ошибка Polybase from Parquet: Невозможно привести Java.lang.

Загружая хранилище данных Azure через Polybase, я читаю файлы Parquet, которые находятся в...

Josh D / 17 апреля 2019

0 голосов

0 ответов

Есть ли способ проверить успешность операции pyarrow.write_to_dataset () для s3?

Я настраиваю приемника для чтения сообщений kafka, их агрегирования небольшими партиями и помещения...

Eugene / 16 апреля 2019

0 голосов

1 ответ

Что может быть объяснением этого 'pyarrow.lib.ArrowIOError'?

Я работаю над кластером HDP и пытаюсь прочитать файл .csv из HDFS, используя pyarrow .Я могу...

Sevy / 16 апреля 2019

2 голосов

1 ответ

Dask Distributed: распараллеливание чтения и анализа множества отдельных файлов

Вопрос Как использовать Dask Distributed для распараллеливания чтения каталога файлов в отдельные...

Dan / 15 апреля 2019

0 голосов

1 ответ

RuntimeError pyarrow не установлен

Я устанавливаю pyarrow 0.13.0 в виртуальной среде на Ubuntu 16.04, используя pip, и он был успешно...

Stella Ella / 06 апреля 2019

2 голосов

1 ответ

Как назначить произвольные метаданные столбцам pyarrow.Table / Parquet

Вариант использования Я использую файлы Apache Parquet в качестве быстрого формата ввода-вывода для...

d.arcy / 06 апреля 2019

1 голос

0 ответов

Получение ошибки при преобразовании строки base64 в изображение с использованием pyspark

Я хочу извлечь и обработать данные изображения (3D-массив), доступные в формате base64, используя...

Prashant Jain / 05 апреля 2019

2 голосов

1 ответ

Как мне исправить «Нет модуля с именем« pyarrow._plasma »»?

Я пытаюсь импортировать pandarallel.Во время импорта я получаю эту ошибку: File...

saeed_ar / 04 апреля 2019

1 голос

1 ответ

Макет pyarrow.parquet с использованием патча

Можно ли издеваться над декларацией import pyarrow.parquet as pq? Я пытаюсь смоделировать это как:...

placplacboom / 02 апреля 2019

1 голос

0 ответов

Как объединить несколько файлов паркета в клей

У меня есть работа Glue, которая записывает файлы паркета в S3 каждые 6 секунд, а у S3 есть папка...

prakash / 01 апреля 2019

0 голосов

1 ответ

Может ли стрелка Apache поддерживать вложенную структуру бесконечного уровня?

На этой странице документации по Apache arrow https://arrow.apache.org/docs/format/Metadata.html...

Wrecker / 30 марта 2019

0 голосов

1 ответ

Как использовать пользовательские функции Pandas на MacOS Mojave?(может произойти сбой из-за [__NSPlaceholderDictionary initialize], возможно, выполнялся ...)

Я пытаюсь использовать Пользовательские функции Pandas (a.k.a. Векторизованные пользовательские...

Jacek Laskowski / 27 марта 2019

0 голосов

1 ответ

Как мне установить, какой libstdc ++. Чтобы он был связан с libarrow.so?

Я собрал libarrow.so и pyarrow из исходного кода, используя gcc7.2 в Redhat 7.4.Тем не менее, я...

nasica88 / 26 марта 2019

1 голос

1 ответ

Почему страница словаря смещена в 0 для кодировки `plain_dictionary`?

Паркет создан Spark v2.4 Parquet-mr v1.10 n = 10000 x = [1.0, 2.0, 3.0, 4.0, 5.0, 5.0, None] * n y...

colinfang / 18 марта 2019

0 голосов

1 ответ

Невозможно прочитать файл паркета

Я сейчас ломаю голову над этим. Я новичок в этих parquet файлах, и у меня много проблем с ним. Мне...

Anonymous Person / 13 марта 2019

0 голосов

0 ответов

Невозможно объединить кадры данных - MemoryError

У меня проблема с объединением двух фреймов данных. Странная часть в том, что это сработало - но...

Anonymous Person / 13 марта 2019

0 голосов

1 ответ

Выполнение преобразований на столе Arrow

Какие преобразования вы можете применить к таблице Arrow? Является ли его основное использование...

marz / 08 марта 2019

0 голосов

1 ответ

Linux пиарроу неопределенный символ

Я использую Python 3.7.2 и использую Miniconda3 для создания новой среды с именем test-env. Я...

Nester / 07 марта 2019

0 голосов

0 ответов

Pyarrow записывает вложенный массив в паркет

Я хочу написать файл партера, который содержит несколько обычных столбцов с данными 1d-массива и...

S.B.G / 04 марта 2019

0 голосов

2 ответов

Python - модуль 'pyarrow' не имеет атрибута 'Table' error

Я использую Python со средой Conda и установил pyarrow с: conda install pyarrow После этого...

Joe / 04 марта 2019

0 голосов

1 ответ

Проверьте магический номер файла паркета в Python

В Python мы можем проверить zip-файл, используя метод zipfile.is_zipfile https://docs.python

Himalay Majumdar / 26 февраля 2019

0 голосов

0 ответов

Проблемы с типами данных при преобразовании данных паркета в кадр данных Pandas

У меня проблема с типами файлов при преобразовании файла паркета в фрейм данных. Я делаю bucket =...

clog14 / 25 февраля 2019

0 голосов

0 ответов

osx get pyarrow.lib.ArrowIOError: невозможно загрузить libhdfs

import pyarrow as pa client = pa.hdfs.connect('localhost', 9000) ОШИБКА Traceback (most...

wyx / 24 февраля 2019

0 голосов

0 ответов

PyArrow: хранить список диктов в паркете, используя вложенные типы

Я хочу сохранить следующий кадр данных pandas в файле паркета с помощью PyArrow: import pandas as...

SergiyKolesnikov / 22 февраля 2019