Я учусь использовать формат Паркет (благодаря этой ссылке https://arrow.apache
Я новичок в друидах. Я выполнил локальную настройку друида в локальной системе и могу загружать...
Я слышал рекомендации по использованию файла формата Parquet, когда выбираются только некоторые...
У меня есть DataFrame, у которого есть столбец id, который используется для соединения с другими...
Я хочу создать простой паркетный файл с одним столбцом (animal varchar (20)), но не хочу...
Я новичок в области больших данных и пытаюсь понять различные способы сохранения и извлечения...
Например: у меня есть файл avsc, как показано ниже. [{ "тип": "запись", "namespace": "com.example",...
Итак, я пытаюсь запустить задание импорта sqoop, где я сохраняю файлы паркета на основе моего ключа...
У меня есть две папки для паркета, паркет А имеет 137 столбцов, а паркет В - 110 столбцов. Паркет...
Я использую API набора данных с Flink и пытаюсь разбить файлы паркета по ключу в моем POJO,...
Я портирую проект python (s3 + Athena) с использования csv на паркет. Я могу сделать файл паркета,...
У меня есть куча файлов Parquet на S3, я хочу загрузить их в красное смещение наиболее оптимальным...
Я пытаюсь импортировать таблицу с сервера SQL в Hive с помощью Sqoop. Ниже приведена команда,...
В моем проекте есть следующее требование, и мы пытаемся использовать PySpark для обработки данных....
У меня есть небольшой искровой кластер с одним мастером и двумя рабочими. У меня есть потоковое...
При использовании pyspark для записи файлов паркета, есть ли способ установить кодировку? Похоже,...
Я работаю с Apache Spark для создания паркетных файлов. Я могу разделить их по дате без проблем, но...
Я хотел бы знать, возможно ли создать раздел Hive, который будет связан со многими местоположениями
Я использую Pyarrow для создания и анализа таблиц Паркет с биологической информацией, и мне нужно...
Pandas Dataframe имеет два столбца hero_sku (строка) и neighbors_list (список строк) >>>...
Я столкнулся с одной проблемой при чтении паркета через искру. Один файл паркета был записан с...
Я пытаюсь прочитать файл паркета в Scala, используя интерфейс Avro (1.10.). Файл также был создан с...
Я пытался переименовать существующий столбец в таблице в новый. Но после изменения имени новый...
Impala v2.11.0 + (CDH v5.11.1 +) не может читать временные метки только со значением времени из...
Чтение файла паркета работает, но получает формат с отступом вместо желаемого формата вывода JSON....