Вопросы с тегом паркет - PullRequest

Вопросы с тегом паркет

1 голос
0 ответов

Я пытаюсь сгенерировать файлы Parquet с помощью Pyspark.Я обнаружил, что в метаданных...

Coolnerd / 28 марта 2019
0 голосов
1 ответ

Чтобы сэкономить место на моем ноутбуке, я сохранил довольно большой набор данных в виде паркетных...

osterburg / 28 марта 2019
0 голосов
0 ответов

Мы храним некоторые данные в многораздельных паркет-файлах для клиента. Хотя это работает без...

BossBolognese / 27 марта 2019
0 голосов
1 ответ

Я отправляю скрипт Python (фактически, pyspark) в Glue Job для обработки файлов паркета и...

Vzzarr / 27 марта 2019
0 голосов
1 ответ

Я пытаюсь импортировать данные из оракула в таблицу улья, используя инкрементное задание sqoop,...

Prabhanj / 27 марта 2019
1 голос
2 ответов

Мой рабочий процесс обычно включает загрузку некоторых данных, обычно из файлов CSV, в кадр данных...

Pythonista anonymous / 25 марта 2019
1 голос
2 ответов

Я получаю ошибку ниже при вставке данных в таблицу формата паркета с именем столбца, имеющим пробел

Nagaraj Vittal / 25 марта 2019
0 голосов
1 ответ

Я загрузил запись из таблицы кустов через программу spark, данные успешно загружены в HDFS, но...

Kanagasubramanian / 25 марта 2019
0 голосов
1 ответ
0 голосов
0 ответов

Я использую AWS Glue Crawler для сканирования грубых 170 ГБ avro-данных для создания таблицы...

Percolator / 24 марта 2019
0 голосов
1 ответ

У меня есть таблица с колонками a, b, c. Хранить данные на hdfs как паркет, можно ли изменить...

Evyatar / 24 марта 2019
0 голосов
0 ответов

Итак, у меня есть каталог с около 600 паркетными файлами, и с помощью parquet-tools я извлек схему...

crystyxn / 23 марта 2019
0 голосов
1 ответ

У меня есть паркетные файлы, сгенерированные некоторым кодом.Я создал DDL для этих данных, добавил...

Dinesh Namburi / 23 марта 2019
0 голосов
0 ответов

Вот архетипический сценарий: Я создаю Dask DataFrame из набора файлов Parquet, написанных...

James Cropcho / 22 марта 2019
0 голосов
0 ответов

Я напишу паркетный файл моего фрейма данных для последующего использования.Информация о типе в...

Eqomatic / 22 марта 2019
0 голосов
2 ответов

Это вопрос, связанный с этим сообщением . Я экспериментирую с файлами Dask и Parquet. Я загрузил...

AJK / 22 марта 2019
0 голосов
1 ответ

Начиная с паркета 1.10.0, паркет вводит две новые индексные структуры: ColumnIndex и OffsetIndex

Liqun Li / 22 марта 2019
0 голосов
1 ответ

Я новичок в Pyspark, и я дергал себя за волосы, пытаясь достичь чего-то, что я считаю довольно...

MGK / 22 марта 2019
0 голосов
1 ответ

Я стремлюсь эффективно сгладить файл паркета в Spark с помощью Scala.Мне было интересно, какой...

Defcon / 20 марта 2019
2 голосов
1 ответ

Использовал сервис Google Dataflow для пакетной загрузки тех же 10 тыс. Json-записей, поступающих...

Amogh Antarkar / 19 марта 2019
0 голосов
1 ответ

У меня есть инструмент, который использует org.apache.parquet.hadoop.ParquetWriter для...

James Wierzba / 19 марта 2019
0 голосов
0 ответов

Пытаюсь прочитать данные JDBC из базы данных SAP HANA с помощью Spark JDBC и записать то же самое,...

kalyan chakravarthy / 19 марта 2019
1 голос
1 ответ

Паркет создан Spark v2.4 Parquet-mr v1.10 n = 10000 x = [1.0, 2.0, 3.0, 4.0, 5.0, 5.0, None] * n y...

colinfang / 18 марта 2019
0 голосов
1 ответ

По ссылке sql-data-sources-parquet Ниже приведен фрагмент кода, в котором хранится формат данных,...

user3198603 / 18 марта 2019
4 голосов
1 ответ

Скажи, что я хочу объединить 3 таблицы A, B, C с внутренним объединением и C очень маленьким....

Simon / 18 марта 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...