Вопросы с тегом паркет - PullRequest

Вопросы с тегом паркет

0 голосов
0 ответов

Мы используем MapR FS со скользящими томами, и необходимо выровнять файлы секционированного...

ChernikovP / 25 июня 2018
0 голосов
3 ответов

У нас есть сценарий Python для нашей склеенной работы, и запускаемые три раза в час для...

rohith / 25 июня 2018
0 голосов
1 ответ

У меня много проблем с поиском ответа на этот вопрос.Допустим, я пишу информационный кадр для...

Adam / 13 июня 2018
0 голосов
2 ответов

Рассмотрим следующий фрейм данных import pandas as pd import numpy as np import pyarrow.parquet as...

ℕʘʘḆḽḘ / 12 июня 2018
0 голосов
1 ответ

У меня есть файл CSV, который хранится в формате hdf в следующем формате: Business Line,Requisition...

G.Marwah / 12 июня 2018
0 голосов
2 ответов

У меня есть следующий код, который получает некоторые данные из системы Marketo from...

STORM / 12 июня 2018
0 голосов
1 ответ

Я использую WriteSupport, который знает, как записать мой пользовательский объект 'T' в Parquet

nirmal / 12 июня 2018
0 голосов
0 ответов

Я создал таблицу (test_load) на основе схемы другой (test).Затем я вставил test_load в другую...

djohon / 11 июня 2018
0 голосов
1 ответ

Я новичок AWS Glue, который пытается прочитать некоторые объекты паркета, которые есть у меня в S3,...

selle / 11 июня 2018
0 голосов
2 ответов

Я пытаюсь сохранить очень большой набор данных, используя pandas to_parquet, и он выходит из строя...

kenissur / 10 июня 2018
0 голосов
2 ответов

Я понимаю, что Pandas может читать и записывать файлы Parquet и из них, используя разные бэкэнды:...

Cedric H. / 08 июня 2018
0 голосов
1 ответ

Можно ли открывать файлы паркета и выполнять итерацию построчно, используя генераторы?Это...

Alpha / 08 июня 2018
0 голосов
0 ответов

Я пытаюсь отредактировать конфигурацию размера блока hadoop через оболочку spark, чтобы...

Sparky / 08 июня 2018
0 голосов
1 ответ

Мы пишем файлы из спарк и читаем из Афины / Улья.У нас возникла проблема с отметкой времени при...

user2201536 / 06 июня 2018
0 голосов
0 ответов

Я новичок в программировании на spark / scala.Я пытаюсь сохранить наборы данных spark в файл...

Manish / 05 июня 2018
0 голосов
1 ответ

В озере данных паркета, разделенном на year и month, с spark.default.parallelism, равным, например,...

TMichel / 05 июня 2018
0 голосов
1 ответ

Я использую следующий метод для записи данных в файл паркета: static void toParquet() { String...

User_qwerty / 04 июня 2018
0 голосов
1 ответ

В Spark 2.2 доступно ли сжатие предикатов для сжатых файлов Parquet (например, GZIP, Snappy)?

Mr.Teen / 02 июня 2018
0 голосов
1 ответ

У меня есть чуть более 1200 JSON-файлов в AWS S3, которые мне нужно преобразовать в Parquet и...

Jørgen Frøland / 01 июня 2018
0 голосов
0 ответов

Я знаю, что паркет поддерживает чтение только выбранных пользователем столбцов.Но когда я использую...

Lionel / 01 июня 2018
0 голосов
1 ответ

Я пытаюсь прочитать очень большой файл паркета (10 ГБ), который я не могу контролировать, как...

nate / 31 мая 2018
0 голосов
1 ответ

У меня есть некоторые данные CSV со следующими столбцами: country, region, year, month, price,...

ashic / 31 мая 2018
0 голосов
2 ответов

Я пытаюсь преобразовать файл .csv в файл .parquet. Файл csv (Temp.csv) имеет следующий формат 1,Jon...

inquisitiveProgrammer / 30 мая 2018
0 голосов
1 ответ

Предполагается, что файлы паркета на AWS S3 (используются для запросов в AWS Athena). Мне нужно...

Nir / 30 мая 2018
0 голосов
1 ответ

Следующая операция работает, но занимает почти 2 часа: from dask import dataframe as ddf ddf

Daniel Mahler / 24 мая 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...