Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

0 голосов
0 ответов

Я хочу иметь возможность уничтожать СДР после завершения отправленной работы. Или, если существует...

Hamzah Jamal / 03 октября 2019
0 голосов
0 ответов

У меня есть кластер Hadoop с двумя узлами и одним мастером. У меня будет API, который отправляет...

Andrea Calvo / 03 октября 2019
0 голосов
0 ответов

Мне нужно было бы полностью сгладить многие (10TB +) все столбцы json в каждом файле. Моя структура...

OT Dani / 03 октября 2019
0 голосов
1 ответ

У меня есть схема данных ниже, как df.currentSchema, и мне нужно получить ожидаемую схему как df

Anil Kumar K B / 03 октября 2019
0 голосов
0 ответов

Оптимизирует ли Spark DAG при обнаружении действия? Мне известно, что DAGScheduler конвейерно...

A Beginner / 03 октября 2019
0 голосов
1 ответ

У нас есть простой искровой поток из темы кафки (с 8 разделами), созданный как показано ниже и...

vakarami / 03 октября 2019
0 голосов
1 ответ

По моим выводам, запуск нескольких sparksqls с разными группами заданий не помещает их в указанные...

Navdeep Poonia / 03 октября 2019
0 голосов
0 ответов

Я сгенерировал файл паркета с одним из типов данных столбца: datetime64. Когда я читаю этот файл...

Naveen / 03 октября 2019
0 голосов
1 ответ

У меня есть автономный кластер с искрой (3 узла), где программа драйвера работает на главном (1...

yguw / 03 октября 2019
0 голосов
2 ответов

Я написал функцию FilterFunction в Spark для фильтрации строк из набора данных. Он работает...

DilTeam / 03 октября 2019
0 голосов
0 ответов

У меня есть 2 таблицы, Staging: это таблица кустов. Куратор: это дельта-таблица Databricks. Мне...

Sathya / 03 октября 2019
0 голосов
2 ответов

Я подключился через SSH к конечной точке Dev в Glue. Работает Spark 2.4.1. Я хочу выполнить простой...

Joe / 03 октября 2019
0 голосов
0 ответов

У меня есть фрейм данных Pyspark, где один из столбцов является массивом строк (длина массива может...

nciao / 03 октября 2019
0 голосов
1 ответ

У меня есть следующие Sequence и DataFrames: df1.select("link1", "link2").show...

Pat64 / 03 октября 2019
1 голос
1 ответ

Есть хорошие примеры его использования, как здесь , но для spark-shell "... createDF не является...

Peter Krauss / 02 октября 2019
0 голосов
2 ответов

У меня есть такой фрейм данных: | ID_VISITE_CALCULE|...

Olivier GSCHWIND / 02 октября 2019
0 голосов
1 ответ

У меня есть кластер EMR в AWS. Я создаю сервер RStudio для использования этого кластера. Я могу...

klaasb01 / 02 октября 2019
0 голосов
1 ответ

Я очень новичок в Apache Spark. У меня есть очень простой вопрос: что лучше с точки зрения...

Ioana / 02 октября 2019
0 голосов
0 ответов

Я попытался записать данные в couchbase, используя потоковую структуру, я сослался на соединитель...

Paun Raj / 02 октября 2019
0 голосов
0 ответов

При записи фрейма данных в файл csv с запятой, разделенной в некотором месте, целью является...

user3611241 / 02 октября 2019
0 голосов
0 ответов

Я читаю файлы Json со следующей схемой: root |-- events: struct (nullable = true) | |-- profile:...

3nomis / 02 октября 2019
0 голосов
2 ответов
0 голосов
1 ответ

Я настроил pyspark на машине EC2 с двумя узлами. Я запускаю pyspark с помощью команды pyspark...

Jaskaran Singh Puri / 02 октября 2019
0 голосов
0 ответов

Получение нулевых исключений или никаких действий при попытке использовать искру под foreachrdd и...

msmb / 02 октября 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...