Вопросы с тегом паркет - PullRequest

Вопросы с тегом паркет

3 голосов
1 ответ

У меня есть каталог партера, содержащий 5 файлов, как показано ниже: Я использую версию Spark 2.2 и...

Aman / 29 октября 2019
0 голосов
1 ответ

Я хотел бы настроить агент Flume, который должен читать из раздела Kafka, и сохранить данные в...

bocco97 / 28 октября 2019
0 голосов
0 ответов

У меня возникла проблема, когда при повторном запуске задания потоковой передачи, если выходной...

jsell / 28 октября 2019
0 голосов
0 ответов

Я пытаюсь прочитать S3-ключ на стороне клиента ( KMS-CSE ), содержащий паркет отформатированные...

Abhijit / 27 октября 2019
1 голос
0 ответов

Когда я пытаюсь записать фрейм данных в виде паркета, размеры файлов неодинаковы. Хотя я не хочу...

sunny_39 / 27 октября 2019
0 голосов
1 ответ

Паркет имеет Индексы столбцов с 2018 года, однако я не могу найти ни одного пакета, который...

xiaodai / 24 октября 2019
0 голосов
0 ответов

Я пытаюсь записать фрейм данных Pandas в разделенные файлы непосредственно на мой Datalake (Gen2),...

Gaelle Sou / 23 октября 2019
1 голос
1 ответ

Я использую конвейер Beam на SparkRunner с выходными данными файла Parquet (хотя проблема...

stuball321 / 22 октября 2019
0 голосов
1 ответ

Когда я пытаюсь открыть файлы .parquet, которые есть в моем AWS S3, с помощью Jupyter Notebook, он...

J. Doe / 22 октября 2019
0 голосов
1 ответ

В настоящее время я работаю над приложением Pyspark для вывода ежедневных дельта-экстрактов в виде...

Ash / 22 октября 2019
0 голосов
0 ответов

Другая команда создает файл партера на S3 с помощью apache-spark, и они утверждают, что файл...

Quoc_Anh / 21 октября 2019
0 голосов
1 ответ

Я без проблем преобразовал файл паркета в pandas, но имел проблему с преобразованием паркета в...

santoku / 21 октября 2019
0 голосов
1 ответ

Может ли neo4j каким-либо образом считывать файлы паркета напрямую? У меня есть крайний список с...

Georg Heiler / 20 октября 2019
0 голосов
0 ответов

У меня есть файл паркета, который содержит идентификатор, элементы исходные данные . Я хочу вычесть...

Salma Elzeheiry / 19 октября 2019
0 голосов
1 ответ

В документации я нашел, как создать Glue table в JSON формате, но не могу найти, как создать его в...

Marcin / 19 октября 2019
0 голосов
3 ответов

Как мне прочитать разделенный файл паркета в R со стрелкой (без искры) Ситуация созданные файлы...

Alex Ortner / 17 октября 2019
1 голос
0 ответов

Когда я пытаюсь записать файл партера, используя pandas.Timestamp в качестве индекса, я не могу...

hobbitmessiah / 17 октября 2019
0 голосов
0 ответов

Чтение документов "Запись и чтение потоков" . Там использовался следующий код для чтения всего...

Dima Fomin / 17 октября 2019
0 голосов
1 ответ

Я использую искру. Я хочу сохранить значение 2.484, которое повторяется 13849 раз в файле паркета...

Salma Elzeheiry / 17 октября 2019
0 голосов
0 ответов

Согласно моему пониманию, друид поддерживает JsonPath (https://github.com/json-path/JsonPath) для...

Ahmad Masood / 16 октября 2019
0 голосов
0 ответов

Я пытаюсь прочитать несколько файлов паркета из одной подпапки S3 bucket с помощью boto3. У меня не...

Ghenghis / 16 октября 2019
0 голосов
0 ответов

При записи фрейма данных в паркет с помощью fastparquet, если в строке есть значения, которые не...

MatanP / 16 октября 2019
2 голосов
1 ответ

При записи файла паркета обратно в DataLake Gen2 создаются дополнительные файлы. Пример: %python...

Sreedhar / 16 октября 2019
0 голосов
3 ответов

Мне нужен совет! Я пытаюсь загрузить файл партера, расположенный в облачном хранилище Google, в...

Dataland / 15 октября 2019
0 голосов
1 ответ

Я хочу проверить производительность Presto на локальных данных TPCH, закодированных в формате...

Harper / 14 октября 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...