Вопросы с тегом pyarrow - PullRequest

Вопросы с тегом pyarrow

0 голосов
1 ответ

Я устанавливаю hadoop по brew install hadoop, а затем использую pip install pyarrow в качестве...

wyx / 21 февраля 2019
0 голосов
0 ответов

Я пытаюсь запустить hadoop ls через python.код:) тоже, но бесполезно.могут ли некоторые вести меня,...

Jeevan / 20 февраля 2019
0 голосов
0 ответов

Вызов pd.read_parquet('foo.parquet') завершается неудачно с: ArrowInvalid: Chunked field...

Georg Heiler / 19 февраля 2019
0 голосов
2 ответов

Я конвертирую большие файлы CSV в файлы Parquet для дальнейшего анализа.Я читаю данные CSV в Pandas...

davidrpugh / 17 февраля 2019
0 голосов
1 ответ

Существует несколько способов, с помощью которых возможен переход от панд к паркету.например,...

RenPen / 13 февраля 2019
0 голосов
0 ответов

У меня есть кластер с установленным hadoop: hadoop version Hadoop 3.1.1.3.0.1.0-187 Source code...

Mikhail_Sam / 12 февраля 2019
0 голосов
1 ответ

Я хотел бы предоставить доступ только для чтения к совместно используемому DataFrame нескольким...

Konstantin / 07 февраля 2019
0 голосов
1 ответ

Я заметил странное поведение при экспорте данных из Vertica и попытке прочитать их позже с паркетом...

Dmitriy Apollonin / 04 февраля 2019
0 голосов
1 ответ

У меня есть большая база данных Impala, состоящая из разделенных файлов Parquet.Я скопировал один...

Ivan / 01 февраля 2019
0 голосов
1 ответ

Поддерживает ли паркет встроенные типы, такие как JSON и BSON, как указано в документации .Я не...

Arun Kumar / 31 января 2019
0 голосов
1 ответ

Здесь у меня есть утилита python для создания нескольких файлов паркета с использованием библиотеки...

Ajay Kharade / 28 января 2019
0 голосов
0 ответов

Я использую Node-red для преобразования информации из ПЛК во Float. Это код для преобразования. Я...

eljuliman / 26 января 2019
0 голосов
0 ответов

Я пытаюсь сохранить dask.dataframe с помощью метода dd.to_parquet в файловой системе NFS. Для этого...

Julio CamPlaz / 23 января 2019
0 голосов
1 ответ

Учитывая доступные методы для указания пользовательских функций в PySpark: Нестандартные...

Jake Spracher / 17 января 2019
0 голосов
1 ответ

У меня есть фрейм данных pandas, и я хочу записать его в виде файла паркета в хранилище файлов...

Cribber / 16 января 2019
0 голосов
2 ответов

У меня есть CSV-файл, который содержит примерно 200+ столбцов и 1 миллион + строк. Когда я...

Yesaya / 15 января 2019
0 голосов
1 ответ

У меня есть dask dataframe, в котором есть столбец типа List [MyClass]. Я хочу сохранить этот фрейм...

cheap_grayhat / 11 января 2019
0 голосов
2 ответов

У меня есть данные в формате паркета, которые слишком велики, чтобы уместиться в память (6 ГБ). Я...

Sjoseph / 02 января 2019
0 голосов
1 ответ

У меня есть изображения TIFF, хранящиеся в файлах tar в HDFS.Я могу скачать tar-файл и поток из...

Ehsan Fathi / 01 января 2019
0 голосов
1 ответ

Я пытаюсь обработать большой файл (5 ГБ) в ОЗУ, но получаю сообщение об ошибке «Недостаточно...

Sjoseph / 25 декабря 2018
0 голосов
0 ответов

Я использую pyarrow для чтения данных паркета из s3, и я хотел бы иметь возможность...

femibyte / 20 декабря 2018
0 голосов
0 ответов

У меня есть поэтапно заполненная секционированная паркетная таблица, построенная с использованием...

Karl Koster / 20 декабря 2018
0 голосов
1 ответ

Ситуация выглядит следующим образом: работая на корпоративном кластере с поддержкой версии 2.3, я...

Ezer K / 16 декабря 2018
0 голосов
1 ответ

Когда я пытаюсь загрузить многораздельный файл паркета, некоторые схемы ошибочно выводятся из-за...

user1111 / 11 декабря 2018
0 голосов
1 ответ

Я использую Apache Arrow в C ++ для сохранения коллекции временных рядов в виде файла паркета и...

motam79 / 07 декабря 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...