Вопросы с тегом паркет - PullRequest

Вопросы с тегом паркет

0 голосов
0 ответов

Я учусь использовать формат Паркет (благодаря этой ссылке https://arrow.apache

Neira / 10 сентября 2018
0 голосов
0 ответов

Я новичок в друидах. Я выполнил локальную настройку друида в локальной системе и могу загружать...

Soumyajit Chatterjee / 10 сентября 2018
0 голосов
0 ответов

Я слышал рекомендации по использованию файла формата Parquet, когда выбираются только некоторые...

DAVID_ROA / 10 сентября 2018
0 голосов
0 ответов

У меня есть DataFrame, у которого есть столбец id, который используется для соединения с другими...

Daniel Melemed / 10 сентября 2018
0 голосов
1 ответ

Я хочу создать простой паркетный файл с одним столбцом (animal varchar (20)), но не хочу...

tooptoop4 / 10 сентября 2018
0 голосов
1 ответ

Я новичок в области больших данных и пытаюсь понять различные способы сохранения и извлечения...

sovan / 09 сентября 2018
0 голосов
0 ответов

Например: у меня есть файл avsc, как показано ниже. [{ "тип": "запись", "namespace": "com.example",...

Vishant Shah / 07 сентября 2018
0 голосов
1 ответ

Итак, я пытаюсь запустить задание импорта sqoop, где я сохраняю файлы паркета на основе моего ключа...

drsalt / 06 сентября 2018
0 голосов
1 ответ

У меня есть две папки для паркета, паркет А имеет 137 столбцов, а паркет В - 110 столбцов. Паркет...

oharr / 06 сентября 2018
0 голосов
1 ответ

Я использую API набора данных с Flink и пытаюсь разбить файлы паркета по ключу в моем POJO,...

john / 06 сентября 2018
0 голосов
1 ответ

Я портирую проект python (s3 + Athena) с использования csv на паркет. Я могу сделать файл паркета,...

kzfid / 06 сентября 2018
0 голосов
1 ответ

У меня есть куча файлов Parquet на S3, я хочу загрузить их в красное смещение наиболее оптимальным...

Richard / 06 сентября 2018
0 голосов
1 ответ

Я пытаюсь импортировать таблицу с сервера SQL в Hive с помощью Sqoop. Ниже приведена команда,...

Hemanth / 05 сентября 2018
0 голосов
2 ответов

В моем проекте есть следующее требование, и мы пытаемся использовать PySpark для обработки данных....

AngiSen / 05 сентября 2018
0 голосов
1 ответ

У меня есть небольшой искровой кластер с одним мастером и двумя рабочими. У меня есть потоковое...

user3243499 / 04 сентября 2018
0 голосов
0 ответов

При использовании pyspark для записи файлов паркета, есть ли способ установить кодировку? Похоже,...

Hammer / 04 сентября 2018
0 голосов
1 ответ

Я работаю с Apache Spark для создания паркетных файлов. Я могу разделить их по дате без проблем, но...

ZenMasterZed / 04 сентября 2018
0 голосов
0 ответов

Я хотел бы знать, возможно ли создать раздел Hive, который будет связан со многими местоположениями

Rolintocour / 03 сентября 2018
0 голосов
0 ответов

Я использую Pyarrow для создания и анализа таблиц Паркет с биологической информацией, и мне нужно...

golobor / 01 сентября 2018
0 голосов
0 ответов

Pandas Dataframe имеет два столбца hero_sku (строка) и neighbors_list (список строк) >>>...

Rupesh More / 31 августа 2018
0 голосов
1 ответ

Я столкнулся с одной проблемой при чтении паркета через искру. Один файл паркета был записан с...

Swapnil Chougule / 31 августа 2018
0 голосов
0 ответов

Я пытаюсь прочитать файл паркета в Scala, используя интерфейс Avro (1.10.). Файл также был создан с...

cesar / 30 августа 2018
0 голосов
1 ответ

Я пытался переименовать существующий столбец в таблице в новый. Но после изменения имени новый...

Adarsh / 30 августа 2018
0 голосов
1 ответ

Impala v2.11.0 + (CDH v5.11.1 +) не может читать временные метки только со значением времени из...

ST415 / 30 августа 2018
0 голосов
1 ответ

Чтение файла паркета работает, но получает формат с отступом вместо желаемого формата вывода JSON....

Justin Wilson / 29 августа 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...