Вопросы с тегом паркет - PullRequest

Вопросы с тегом паркет

1 голос
1 ответ

У меня есть 2000 паркетных файлов в каталоге.Размер каждого файла паркета составляет около 20 МБ

chochim / 26 сентября 2019
1 голос
0 ответов

Я пишу код для преобразования большого файла паркета, который у меня есть в виде строк: List<org

chrismead / 26 сентября 2019
0 голосов
0 ответов

В моей папке около 10 файлов с одинаковыми именами столбцов.Я хочу добавить все 10 файлов данных...

Dppriya Reddy / 25 сентября 2019
1 голос
1 ответ

У меня есть исходные данные в s3, и мое приложение spark / scala прочитает эти данные и запишет их...

Divzz / 25 сентября 2019
0 голосов
0 ответов

У меня есть некоторый код, который получает файл паркета из AWS S3, используя AWS API.В результате...

user1978816 / 25 сентября 2019
2 голосов
0 ответов

Я создал внешнюю таблицу, используя паркет в улье, используя сжатие snappy.Я хочу настроить размер...

LHS / 25 сентября 2019
0 голосов
0 ответов

Я экспериментирую с памятью, используемой искровым фреймом данных, созданным из файла CSV и файла...

user1124702 / 25 сентября 2019
0 голосов
1 ответ

Я читаю файлы из S3 во фрейм данных Pandas: файлы являются паркетами, которые были разделены.Я буду...

Collin Cunningham / 24 сентября 2019
1 голос
0 ответов

Я использую структурированную потоковую обработку Spark (используйте SSS в качестве сокращения...

jay Wong / 24 сентября 2019
0 голосов
1 ответ

У меня есть объект Python, который, как я знаю, является загруженным в объект файлом паркета.(У...

AnarKi / 23 сентября 2019
0 голосов
0 ответов

У меня есть объект var_1, который содержит: b'PAR1\x15\x....1\x00PAR1 , когда я проверяю тип:...

AnarKi / 23 сентября 2019
0 голосов
1 ответ

Я хочу выполнить моделирование данных с помощью Deep-Learning, поэтому я попытался загрузить данные...

RAHUL VISHWAKARMA / 23 сентября 2019
0 голосов
2 ответов

Это микрокосм проблемы, с которой я сталкиваюсь, где я получаю ошибку.Позвольте мне попытаться...

cph_sto / 19 сентября 2019
0 голосов
0 ответов

Я использую pyspark для ежедневной обработки фиксированного набора записей данных и сохраняю их в...

Y.Su / 19 сентября 2019
0 голосов
1 ответ

Мы знаем, что установка parquet.block.size в качестве размера блока HDFS рекомендуется, но это...

Ranga Vure / 19 сентября 2019
0 голосов
0 ответов

У нас есть вложенная (на нескольких уровнях) json в качестве схемы паркета.Схема используется для...

Vijayant / 19 сентября 2019
0 голосов
0 ответов

Я работаю в ноутбуке JupyterLab, используя Python 3 с pandas и pyarrow.У меня есть некоторые данные...

Hissohathair / 19 сентября 2019
0 голосов
1 ответ
0 голосов
0 ответов

Среда Cloudera, мне нужно реплицировать данные из одного кластера в другой и отбрасывать все...

mdivk / 11 июля 2019
0 голосов
0 ответов

Мы пытаемся использовать parquet как общий файл между R и Python. 1. Использование...

Joseph Berry / 11 июля 2019
1 голос
1 ответ

Spark 2.4.2 в кластере Amazon EMR (1 мастер, 2 узла) с использованием Python 3.6 Я читаю объекты в...

Eric / 10 июля 2019
0 голосов
1 ответ

Используя pyspark, я извлекаю 1500 полей из файла JSON, сохраняю их как паркет и создаю внешнюю...

Ramya / 09 июля 2019
0 голосов
0 ответов

Я пытаюсь экспортировать файл паркетной формы S3 в SQL Server, используя Sqoop, и получаю эту...

Umar / 09 июля 2019
0 голосов
1 ответ

Я пытаюсь использовать Apache Spark для загрузки результатов (большого) запроса SQL с несколькими...

codepringle / 09 июля 2019
0 голосов
0 ответов

Я пытаюсь прочитать данные, хранящиеся в виде партера, в моем хранилище Azure ADLS. Просто...

BadrF / 09 июля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...