Вопросы с тегом паркет - PullRequest

Вопросы с тегом паркет

0 голосов
0 ответов

Привет, я хочу преобразовать CSV в формат паркета в автономной простой Java. нашел много решений,...

user2813604 / 19 ноября 2018
0 голосов
2 ответов

Перед тем, как я записываю фрейм данных в hdfs, я coalesce(1) заставляю его писать только один файл...

Haha TTpro / 19 ноября 2018
0 голосов
0 ответов

У меня есть паркет с несколькими обнуляемыми столбцами Int64. Когда я читаю таблицу паркета,...

micah / 16 ноября 2018
0 голосов
1 ответ

Я провожу несколько экспериментов с размером блока (dfs.block.size) и размером группы строк...

user3685285 / 15 ноября 2018
0 голосов
0 ответов

Есть два стола Hive. Обе эти таблицы используют формат файла Parquet. Таблица A - с 5 столбцами...

Hemant Gupta / 15 ноября 2018
0 голосов
2 ответов

У меня есть приложение, которое пытается прочитать группу csv из директории кластера и записать их...

Pnutz / 15 ноября 2018
0 голосов
2 ответов

Я скачал и собрал parquet-1.5.0 из https://github.com/apache/parquet-mr. Теперь я хочу запустить...

user3685285 / 14 ноября 2018
0 голосов
2 ответов

Я пытаюсь установить паркетные инструменты на машине с FreeBSD. Я клонировал этот репозиторий: git...

user3685285 / 14 ноября 2018
0 голосов
1 ответ

У меня есть CSV-файл, который выглядит примерно так: 39813458,13451345,14513,SomeText,344564,Some...

Gus / 14 ноября 2018
0 голосов
1 ответ

Я использую Confluent KafkaAvroDerserializer для десериализации объектов Avro, отправленных через...

Sharon Gal-Ed / 14 ноября 2018
0 голосов
1 ответ

Я использую Apache Presto 0.212 в EMR 5.19.0, потому что AWS Athena не поддерживает...

Eddie / 13 ноября 2018
0 голосов
2 ответов

Я наткнулся на эту страницу в jira, и я хотел бы знать, как получить такое же представление групп...

user3685285 / 13 ноября 2018
0 голосов
1 ответ

Я написал DataFrame в spark-shell в hdfs и получил следующий вывод.Я хочу понять, что определяет...

user3685285 / 13 ноября 2018
0 голосов
2 ответов

Я хочу загрузить данные из корзины s3 в Pig на EMR, и мой исходный формат файла - паркет: Ниже...

Rahul Kumar Singh / 13 ноября 2018
0 голосов
0 ответов

Я пытаюсь установить размер блока и размер группы строк для моего экземпляра hdfs для тестирования

user3685285 / 13 ноября 2018
0 голосов
2 ответов

Существует файл паркета со столбцом binary (UTF8) с именем abc. Можно ли создать в кусте таблицу...

dmigo / 12 ноября 2018
0 голосов
1 ответ

Есть ли способ обрабатывать разные запросы sparkSQL (запросы на чтение с разными фильтрами и...

Divya / 12 ноября 2018
0 голосов
0 ответов

У меня есть папка (7,7 ГБ) с несколькими кадрами данных панд, которые хранятся в формате файла...

ilpomo / 12 ноября 2018
0 голосов
1 ответ

Я читаю файл CSV с pandas.read_csv, и он автоматически определяет схему, которая похожа на Column1:...

Hamed / 10 ноября 2018
0 голосов
0 ответов

Как я могу написать в паркет с пользовательским разделителем? (partitonBy, по несуществующему...

HideDJeker / 09 ноября 2018
0 голосов
0 ответов

Я пытаюсь объединить несколько файлов паркета в один. Их схемы идентичны на местах, но моя...

micah / 08 ноября 2018
0 голосов
1 ответ

Я получаю ошибку ниже при записи файла паркета имя 'spark_write_parquet' не определено Нужно ли...

Shraddha / 06 ноября 2018
0 голосов
0 ответов

Я пытаюсь перенести данные из Hive в BigQuery. Данные в таблице Hive хранятся в формате файла...

Rush / 06 ноября 2018
0 голосов
0 ответов

Ошибка ниже, при сохранении фрейма данных в виде таблицы в режиме партера, перед тем, как...

ShuBham ShaRma / 06 ноября 2018
0 голосов
0 ответов

У меня есть база данных PostgreSQL с ~ 1000 различными таблицами. Я хотел бы экспортировать все эти...

alexanoid / 05 ноября 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...