Вопросы с тегом паркет

0 голосов

0 ответов

Написание паркета для HDFS в Python

Я учусь использовать формат Паркет (благодаря этой ссылке https://arrow.apache

Neira / 10 сентября 2018

0 голосов

0 ответов

Загрузка файла паркета в друид

Я новичок в друидах. Я выполнил локальную настройку друида в локальной системе и могу загружать...

Soumyajit Chatterjee / 10 сентября 2018

0 голосов

0 ответов

Формат паркета: полезно ли извлекать все столбцы?

Я слышал рекомендации по использованию файла формата Parquet, когда выбираются только некоторые...

DAVID_ROA / 10 сентября 2018

0 голосов

0 ответов

Spark - Оптимизация паркета для нескольких соединений

У меня есть DataFrame, у которого есть столбец id, который используется для соединения с другими...

Daniel Melemed / 10 сентября 2018

0 голосов

1 ответ

Отобразить одноколоночное значение VARCHAR для паркета без искры

Я хочу создать простой паркетный файл с одним столбцом (animal varchar (20)), но не хочу...

tooptoop4 / 10 сентября 2018

0 голосов

1 ответ

Хранение данных в файлах HBase vs Parquet

Я новичок в области больших данных и пытаюсь понять различные способы сохранения и извлечения...

sovan / 09 сентября 2018

0 голосов

0 ответов

Как применить предикат фильтра к массиву i Parquet (Java)

Например: у меня есть файл avsc, как показано ниже. [{ "тип": "запись", "namespace": "com.example",...

Vishant Shah / 07 сентября 2018

0 голосов

1 ответ

Sqoop Import as-parquetfile на основе значения столбца

Итак, я пытаюсь запустить задание импорта sqoop, где я сохраняю файлы паркета на основе моего ключа...

drsalt / 06 сентября 2018

0 голосов

1 ответ

Объединение двух паркетных файлов с разными схемами

У меня есть две папки для паркета, паркет А имеет 137 столбцов, а паркет В - 110 столбцов. Паркет...

oharr / 06 сентября 2018

0 голосов

1 ответ

Apache Flink - поддерживает ли DataSet API запись вывода в отдельные разделы файла

Я использую API набора данных с Flink и пытаюсь разбить файлы паркета по ключу в моем POJO,...

john / 06 сентября 2018

0 голосов

1 ответ

Как Афина может прочитать файл паркета из ведра S3

Я портирую проект python (s3 + Athena) с использования csv на паркет. Я могу сделать файл паркета,...

kzfid / 06 сентября 2018

0 голосов

1 ответ

Загрузите файлы Parquet в Redshift

У меня есть куча файлов Parquet на S3, я хочу загрузить их в красное смещение наиболее оптимальным...

Richard / 06 сентября 2018

0 голосов

1 ответ

Sqoop - ОШИБКА tool.ImportTool: сбой импорта: невозможно преобразовать тип SQL 2005 при попытке импорта из SQL Server

Я пытаюсь импортировать таблицу с сервера SQL в Hive с помощью Sqoop. Ниже приведена команда,...

Hemanth / 05 сентября 2018

0 голосов

2 ответов

PySpark Чтение нескольких файлов параллельно

В моем проекте есть следующее требование, и мы пытаемся использовать PySpark для обработки данных....

AngiSen / 05 сентября 2018

0 голосов

1 ответ

почему в _spark_metadata все разделенные на паркет файлы внутри 0, а в кластере 2 рабочих?

У меня есть небольшой искровой кластер с одним мастером и двумя рабочими. У меня есть потоковое...

user3243499 / 04 сентября 2018

0 голосов

0 ответов

pyspark пишет файлы Parquet с разной кодировкой

При использовании pyspark для записи файлов паркета, есть ли способ установить кодировку? Похоже,...

Hammer / 04 сентября 2018

0 голосов

1 ответ

Не могу записать заказанные данные на паркет в свече

Я работаю с Apache Spark для создания паркетных файлов. Я могу разделить их по дате без проблем, но...

ZenMasterZed / 04 сентября 2018

0 голосов

0 ответов

Один раздел Hive для многих мест

Я хотел бы знать, возможно ли создать раздел Hive, который будет связан со многими местоположениями

Rolintocour / 03 сентября 2018

0 голосов

0 ответов

Как написать метаданные Паркет с пиарроу?

Я использую Pyarrow для создания и анализа таблиц Паркет с биологической информацией, и мне нужно...

golobor / 01 сентября 2018

0 голосов

0 ответов

Hive Column read NULL для файлов Parquet, написанных с помощью pyarrow

Pandas Dataframe имеет два столбца hero_sku (строка) и neighbors_list (список строк) >>>...

Rupesh More / 31 августа 2018

0 голосов

1 ответ

Поддержка смены типа в свечном паркете

Я столкнулся с одной проблемой при чтении паркета через искру. Один файл паркета был записан с...

Swapnil Chougule / 31 августа 2018

0 голосов

0 ответов

Невозможно прочитать файл паркета с вложенными записями, используя ParquetAvro

Я пытаюсь прочитать файл паркета в Scala, используя интерфейс Avro (1.10.). Файл также был создан с...

cesar / 30 августа 2018

0 голосов

1 ответ

Имя столбца изменения таблицы изменения куста дает 'NULL' переименованному столбцу

Я пытался переименовать существующий столбец в таблице в новый. Но после изменения имени новый...

Adarsh / 30 августа 2018

0 голосов

1 ответ

Импала не может прочитать метку времени без даты из файла Parquet

Impala v2.11.0 + (CDH v5.11.1 +) не может читать временные метки только со значением времени из...

ST415 / 30 августа 2018

0 голосов

1 ответ

Прочитанный паркетный файл Java в вывод JSON

Чтение файла паркета работает, но получает формат с отступом вместо желаемого формата вывода JSON....

Justin Wilson / 29 августа 2018