Вопросы с тегом паркет - PullRequest

Вопросы с тегом паркет

0 голосов
1 ответ

Может ли кто-нибудь объяснить на примерах, как именно работает предикатный pushdown?

hey_you / 15 февраля 2019
0 голосов
1 ответ

Можно ли хранить N-мерные массивы в Parquet через uber / petastorm ?

Leo Gallucci / 15 февраля 2019
0 голосов
1 ответ

У меня есть куча файлов паркета с полями меток времени в другом формате.Я хотел бы унифицировать...

Rohan Nayak / 13 февраля 2019
0 голосов
1 ответ

Существует несколько способов, с помощью которых возможен переход от панд к паркету.например,...

RenPen / 13 февраля 2019
0 голосов
2 ответов

Я пишу AWS-лямбду, которая читает готовые объекты от Kinesis и хотела бы записать их в s3 в виде...

danieln / 13 февраля 2019
0 голосов
1 ответ

Я хочу сохранить обработанные данные в фрейме данных pandas в лазурные капли в формате файла...

Bhanuday Birla / 13 февраля 2019
0 голосов
2 ответов

У меня есть инструмент, который использует org.apache.parquet.hadoop.ParquetWriter для...

James Wierzba / 12 февраля 2019
0 голосов
1 ответ

Файлы ORC и Parquet сами по себе (без других параметров сжатия, например, snappy) имеют эффекты...

Tom / 12 февраля 2019
0 голосов
0 ответов

В IMPALA мы можем оптимизировать запросы, создавая таблицы, задавая сортировку файлов по некоторым...

Raju / 12 февраля 2019
0 голосов
2 ответов

У меня есть данные датчика в реальном времени.Моя основная цель - сохранить необработанные данные.Я...

ogma / 11 февраля 2019
0 голосов
0 ответов

Мои искры. Фреймы данных импортируются из файлов паркета в ADLS.Есть ли способ найти дату...

Dan / 10 февраля 2019
0 голосов
1 ответ

Я использую Drill 1.15 в распределенном режиме только поверх узлов данных (3 узла с 32 ГБ памяти...

Avik Aggarwal / 09 февраля 2019
0 голосов
1 ответ

Чтобы записать данные из кадра данных pandas в паркет, я делаю следующее: df = pd.DataFrame(DATA)...

Miguel A. Friginal / 09 февраля 2019
0 голосов
0 ответов

Есть ли способ написать файл паркета в python без необходимости сначала создавать фрейм данных?Это...

Miguel A. Friginal / 09 февраля 2019
0 голосов
1 ответ

У меня есть файл паркета, хранящийся в AWS S3, который я хочу запросить.Я хочу получить...

J Hamm / 08 февраля 2019
0 голосов
0 ответов
0 голосов
1 ответ

Есть ли причины, по которым прием Друида должен быть медленным при приеме данных с паркета?Мы...

Vijay Muvva / 07 февраля 2019
0 голосов
0 ответов

У меня есть фрейм данных pandas, в котором все столбцы являются строками, а один столбец является...

Venkata Gogu / 07 февраля 2019
0 голосов
1 ответ

У меня есть данные, загруженные в папку S3 Bucket в виде нескольких файлов паркета.После загрузки...

Swapnil / 06 февраля 2019
0 голосов
0 ответов

При записи набора данных в паркет произошла следующая ошибка. data.write()

Sanket M / 06 февраля 2019
0 голосов
0 ответов

Я пытаюсь использовать pandas для чтения файла паркета и получаю следующую ошибку:...

Ori N / 05 февраля 2019
0 голосов
2 ответов

Я некоторое время боролся с этим и хотел поделиться своим решением.AvroParquetReader - прекрасный...

jd_free / 04 февраля 2019
0 голосов
0 ответов

Было предложено хранилище данных, основанное на Spark на AWS (возможно, Glue ETL, но, возможно,...

rabinnh / 04 февраля 2019
0 голосов
1 ответ

Я заметил странное поведение при экспорте данных из Vertica и попытке прочитать их позже с паркетом...

Dmitriy Apollonin / 04 февраля 2019
0 голосов
1 ответ

У меня есть паркетный файл на HDFS.Ежедневно перезаписывается новым.Моя цель состоит в том, чтобы...

Olivier Solliec / 04 февраля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...