Вопросы с тегом паркет - PullRequest

Вопросы с тегом паркет

0 голосов
0 ответов

Я создаю Кафку и искровой потоковый трубопровод.Здесь данные автоматически сериализуются с...

Madhusudhan / 24 мая 2018
0 голосов
0 ответов

Попытка преобразовать серию сжатых gz в формат паркета. В процессах пытаются сделать какие-то...

RidinAGrvyTrain / 23 мая 2018
0 голосов
3 ответов

Scala 2.12 и Spark 2.2.1 здесь.Я использовал следующий код для записи содержимого DataFrame в S3:...

hotmeatballsoup / 22 мая 2018
0 голосов
0 ответов

Не удалось заставить его выполнить преобразование data['date']= pd

Ajaxcbcb / 22 мая 2018
0 голосов
1 ответ

Поддерживает ли Parquet хранение различных кадров данных различной ширины (числа столбцов) в одном...

Turo / 22 мая 2018
0 голосов
0 ответов

Я пытаюсь прочитать файл паркета в pandas dataframe, выполнить некоторые манипуляции и записать его...

SSingh / 21 мая 2018
0 голосов
1 ответ

Я пытаюсь создать таблицу AWS Athena из файла Parquet, хранящегося в S3, используя следующее...

Little Bobby Tables / 21 мая 2018
0 голосов
1 ответ

У меня есть следующий код Scala, который я использую для записи данных из файла json в таблицу в...

Neha / 21 мая 2018
0 голосов
1 ответ

Учитывая, что файлы Avro и Parquet содержат и данные, и схему для этих данных, то в Spark должна...

user1888243 / 20 мая 2018
0 голосов
1 ответ

Spark 2.x здесь.Мой код: val query = "SELECT * FROM some_big_table WHERE something >...

hotmeatballsoup / 18 мая 2018
0 голосов
1 ответ

Я много исследовал эту тему. У меня есть набор данных размером 3 ТБ. Ниже приведена схема данных...

Omkar / 17 мая 2018
0 голосов
1 ответ

Я хочу запустить sql для своих данных паркета в spark, используя следующий код, val parquetDF =...

Krishas / 17 мая 2018
0 голосов
0 ответов

Я просто делаю простой запрос, подобный этому, но появляются некоторые исключения. insert overwrite...

vasili / 17 мая 2018
0 голосов
1 ответ

У меня около 8 миллионов строк данных и около 500 столбцов. Когда я пытаюсь записать его с помощью...

Joha / 17 мая 2018
0 голосов
1 ответ

У меня есть куча файлов паркета, и я создал внешние таблицы, используя Impala's CREATE EXTERNAL...

Ponns / 17 мая 2018
0 голосов
1 ответ

Мое Java-приложение потребляет данные в реальном времени, а затем публикует их в файл ORC на S3 ....

DJ180 / 17 мая 2018
0 голосов
1 ответ

У меня есть папка с множеством паркетных файлов, имена которых следующие:...

Markus / 15 мая 2018
0 голосов
1 ответ

Я понял, что снимок hdfs отслеживает добавленные или удаленные файлы из каталога.Каково поведение,...

djohon / 14 мая 2018
0 голосов
1 ответ

Есть несколько путей к паркетному файлу: / A / B / C = 'str1' / д = 'ул' / A / B / C = 'str2' / д =...

Zhang Xin / 13 мая 2018
0 голосов
1 ответ

Я запускаю Spark в автономном режиме с каталогом Hive.Я пытаюсь загрузить данные из внешнего...

kirylm / 12 мая 2018
0 голосов
1 ответ

Я использую паркетные инструменты для объединения паркетных файлов.Но, похоже, что инструментам для...

Xitrum / 11 мая 2018
0 голосов
1 ответ

У меня есть таблица улья, созданная так: CREATE EXTERNAL TABLE test_db.test( region STRING,...

jz999 / 11 мая 2018
0 голосов
2 ответов

Я мог бы найти много ответов в Интернете, используя sparklyr или различные пакеты свечей, которые...

Gerg / 10 мая 2018
0 голосов
2 ответов

Недавно мы обнаружили, что из-за проблемы в нашем ETL наши паркетные блоки содержали повторяющиеся...

Vitaliy / 10 мая 2018
0 голосов
0 ответов

Я пытаюсь запустить параллельные потоки в задании на искру. Это работает без проблем, когда я...

Robin Tanner / 09 мая 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...