У меня есть сценарий использования, в котором мне нужно запустить собственный алгоритм для каждого...
Я пытаюсь восстановить некоторые архивные файлы резервных копий, сохраненные в формате паркета, и...
нужно сравнить CSV с паркетом и паркет с паркетом с использованием Python. Также файл доступен в...
Я использую Firehose и Glue для загрузки данных и преобразования JSON в файл паркета в S3. Мне...
Я использую настройки, как описано на странице: Как сгенерировать файл паркета с использованием...
Я пытаюсь прочитать файл паркета как информационный фрейм, который будет периодически обновляться...
Используя parquet-tools, я могу просматривать заголовок, но у меня нет способа редактировать....
Предположим, у меня есть Spark DataFrame с байтами в виде строк в его теле. Я хотел бы получить...
Я знаю, что файлы паркета разделяются, если они хранятся в хранилище блоков. Например, хранятся в...
Я создал каталог данных в клей на основе базы данных RDS. Затем я создал задание по преобразованию...
У меня есть функция Python с привязкой ввода BLOB-объектов. Данный блоб содержит файл паркета. В...
Можно ли преобразовать кадр данных Pandas в файл ORC? Я могу преобразовать df в файл паркета, но...
У меня есть файл / папка для паркета (около 1 ГБ), которую я хотел бы загрузить в мою локальную...
Я использую prestodb с метастартом куста для хранения схемы и кеш alluxio в качестве внешнего...
У меня есть таблица, определенная в AWS Glue. Я использую потоки AWS Kinesis для потоковой передачи...
Я использую потоковую трансляцию для создания конвейера данных в реальном времени. Я получаю данные...
Я использую Spark 2.4.4 на AWS EMR и после длительной задержки записи файла партера в S3 произошла...
У меня есть файл партера, который содержит два столбца (идентификатор, функция). Файл состоит из...
У меня есть несколько файлов паркетных файлов в разных каталогах paths =...
Изменение захвата данных в Sqoop-Hive Import Я пытаюсь сделать изменение данных, используя Sqoop,...
Я вручную разбивал файлы на панды (создавая индекс или мультииндекс, а затем записывал отдельный...
Я хотел бы иметь возможность перезаписать мой путь вывода форматом паркета, но он не входит в число...
Я пытаюсь следовать руководству по StreamingFileSink из Stream Processing с Apache Flink. В книгах...
При чтении файлов паркета в спарк, если вы столкнулись с проблемой ниже. Приложение> Исключение в...
Я использую официальную документацию для загрузки данных из файла паркета в представление, чтобы я...