Вопросы с тегом паркет - PullRequest

Вопросы с тегом паркет

0 голосов
0 ответов

У меня есть сценарий использования, в котором мне нужно запустить собственный алгоритм для каждого...

Sagar / 10 ноября 2019
2 голосов
1 ответ

Я пытаюсь восстановить некоторые архивные файлы резервных копий, сохраненные в формате паркета, и...

Javad Bahoosh / 10 ноября 2019
0 голосов
0 ответов

нужно сравнить CSV с паркетом и паркет с паркетом с использованием Python. Также файл доступен в...

Vasanth Swaminathan / 09 ноября 2019
0 голосов
0 ответов

Я использую Firehose и Glue для загрузки данных и преобразования JSON в файл паркета в S3. Мне...

franco phong / 08 ноября 2019
0 голосов
0 ответов

Я использую настройки, как описано на странице: Как сгенерировать файл паркета с использованием...

Mohan / 08 ноября 2019
1 голос
2 ответов

Я пытаюсь прочитать файл паркета как информационный фрейм, который будет периодически обновляться...

wazza / 08 ноября 2019
0 голосов
1 ответ

Используя parquet-tools, я могу просматривать заголовок, но у меня нет способа редактировать....

Tectrendz / 08 ноября 2019
0 голосов
0 ответов

Предположим, у меня есть Spark DataFrame с байтами в виде строк в его теле. Я хотел бы получить...

Jelther Gonçalves / 08 ноября 2019
0 голосов
2 ответов

Я знаю, что файлы паркета разделяются, если они хранятся в хранилище блоков. Например, хранятся в...

Arran Duff / 07 ноября 2019
0 голосов
0 ответов

Я создал каталог данных в клей на основе базы данных RDS. Затем я создал задание по преобразованию...

George Georgiou / 07 ноября 2019
0 голосов
0 ответов

У меня есть функция Python с привязкой ввода BLOB-объектов. Данный блоб содержит файл паркета. В...

Luke G / 06 ноября 2019
0 голосов
0 ответов

Можно ли преобразовать кадр данных Pandas в файл ORC? Я могу преобразовать df в файл паркета, но...

alcor / 06 ноября 2019
0 голосов
1 ответ

У меня есть файл / папка для паркета (около 1 ГБ), которую я хотел бы загрузить в мою локальную...

Jonathan / 05 ноября 2019
0 голосов
1 ответ

Я использую prestodb с метастартом куста для хранения схемы и кеш alluxio в качестве внешнего...

Arsalan Mudni / 05 ноября 2019
0 голосов
1 ответ

У меня есть таблица, определенная в AWS Glue. Я использую потоки AWS Kinesis для потоковой передачи...

Yossi Vainshtein / 04 ноября 2019
0 голосов
1 ответ

Я использую потоковую трансляцию для создания конвейера данных в реальном времени. Я получаю данные...

Rajendra Jangir / 03 ноября 2019
1 голос
0 ответов

Я использую Spark 2.4.4 на AWS EMR и после длительной задержки записи файла партера в S3 произошла...

Jay Ng / 01 ноября 2019
0 голосов
3 ответов

У меня есть файл партера, который содержит два столбца (идентификатор, функция). Файл состоит из...

Salma Elzeheiry / 30 октября 2019
1 голос
1 ответ

У меня есть несколько файлов паркетных файлов в разных каталогах paths =...

theSekyi / 30 октября 2019
0 голосов
1 ответ

Изменение захвата данных в Sqoop-Hive Import Я пытаюсь сделать изменение данных, используя Sqoop,...

Nidhi / 30 октября 2019
0 голосов
1 ответ

Я вручную разбивал файлы на панды (создавая индекс или мультииндекс, а затем записывал отдельный...

ldacey / 30 октября 2019
0 голосов
1 ответ

Я хотел бы иметь возможность перезаписать мой путь вывода форматом паркета, но он не входит в число...

SimbaPK / 30 октября 2019
0 голосов
0 ответов

Я пытаюсь следовать руководству по StreamingFileSink из Stream Processing с Apache Flink. В книгах...

Machinedoll / 30 октября 2019
1 голос
0 ответов

При чтении файлов паркета в спарк, если вы столкнулись с проблемой ниже. Приложение> Исключение в...

Amresh Jha / 30 октября 2019
0 голосов
0 ответов

Я использую официальную документацию для загрузки данных из файла паркета в представление, чтобы я...

Viktor Baert / 29 октября 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...