Вопросы с тегом паркет - PullRequest

Вопросы с тегом паркет

0 голосов
1 ответ

У меня есть большая база данных Impala, состоящая из разделенных файлов Parquet.Я скопировал один...

Ivan / 01 февраля 2019
0 голосов
0 ответов

Похоже, что в моих файлах партера есть символы UTF 8, которые, когда FetchParquet пытается...

devD / 01 февраля 2019
0 голосов
0 ответов

Я новичок в Big Data, пытаясь понять различные форматы файлов с точки зрения лучшего выполнения...

Varada Santosh / 31 января 2019
0 голосов
1 ответ

Поддерживает ли паркет встроенные типы, такие как JSON и BSON, как указано в документации .Я не...

Arun Kumar / 31 января 2019
0 голосов
1 ответ

Здесь у меня есть утилита python для создания нескольких файлов паркета с использованием библиотеки...

Ajay Kharade / 28 января 2019
0 голосов
0 ответов

У меня есть источник Kafka DataStream, который содержит идентификаторы.У меня также есть база...

AsadSMalik / 28 января 2019
0 голосов
2 ответов

Я очень новичок в scala spark экосистеме, и мне интересно, как лучше всего провести модульное...

user784530 / 28 января 2019
0 голосов
0 ответов

Итак, вот мой искровой код на python, который я выполняю с запущенным в фоновом режиме hadoop: from...

Pedro González / 27 января 2019
0 голосов
1 ответ

Я пытаюсь понять связь между разделением и предикатом pushdown.Представьте, что мы используем AWS...

Dawid / 24 января 2019
0 голосов
0 ответов

Может ли кто-нибудь объяснить преимущества использования таких форматов файлов, как паркет или HDF5...

Michael Schroter / 24 января 2019
0 голосов
0 ответов

Я пытаюсь сохранить dask.dataframe с помощью метода dd.to_parquet в файловой системе NFS. Для этого...

Julio CamPlaz / 23 января 2019
0 голосов
1 ответ

Во-первых, извинения, если это прозвучало плохо, я пытался помочь себе, но мне не ясно, где это...

Tim Edwards / 23 января 2019
0 голосов
0 ответов

Здесь у меня есть сценарий, где я принимаю файлы паркета, используя sparksql, в таблицы кустов.У...

Ajay Kharade / 22 января 2019
0 голосов
1 ответ

Мне нужно использовать библиотеку Parquet-mr для программного чтения файлов Parquet на Java.Мне...

User29519 / 22 января 2019
0 голосов
1 ответ

Я хотел бы создать многослойные файлы TFrecord из большого DataFrame на основе определенного...

Kristof / 22 января 2019
0 голосов
1 ответ

Я читал несколько вопросов по этой теме, а также несколько форумов, и во всех них, похоже,...

Lenny D. / 22 января 2019
0 голосов
0 ответов

Я хотел бы сохранить таблицу базы данных в облачном хранилище объектов в виде файла паркета без...

Madhu / 21 января 2019
0 голосов
1 ответ

У меня есть отсортированный набор данных с разными столбцами и идентификатором. Набор данных...

mly / 21 января 2019
0 голосов
1 ответ

Мы хотим использовать паркетный файл из s3 Мой фрагмент кода такой.Мои входные файлы - это...

Hu Guang / 21 января 2019
0 голосов
1 ответ

У меня есть сценарий использования, который должен прочитать вложенную схему JSON и записать ее...

Am1rr3zA / 18 января 2019
0 голосов
0 ответов
0 голосов
1 ответ

Я вижу странное поведение при попытке выполнить EXPORT TO PARQUET из Vertica на локальный диск....

Dmitriy Apollonin / 17 января 2019
0 голосов
2 ответов

Я получаю следующую ошибку при запуске задания GLUE над партиционированными файлами Невозможно...

Igs / 17 января 2019
0 голосов
1 ответ

Я очень новичок в PySpark. Я собирал tfidf и хочу сохранить его на диске в качестве промежуточного...

lU5er / 16 января 2019
0 голосов
1 ответ

Я пытаюсь написать структуру Go в файле Parquet и загрузить ее на S3. Какой формат и тип указывать...

Piyush Agrawal / 16 января 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...