Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

0 голосов
1 ответ

Я новичок в поиске и пытаюсь отфильтровать один RDD на основе другого, как описано здесь . Мои...

Mehmet Ataş / 11 сентября 2018
0 голосов
2 ответов

Я создаю внешнюю секционированную таблицу в улье.в логах он показывает numinputrows.это означает,...

Sam / 11 сентября 2018
0 голосов
0 ответов

Я определил конвейер, который читает тему Кафки, выполняет некоторые шаги и публикует результаты в...

Ali Ait-Bachir / 11 сентября 2018
0 голосов
2 ответов

Я использую Spark (2.3.1) для обработки некоторых наборов данных.По какой-то причине я хотел бы...

Nakeuh / 11 сентября 2018
0 голосов
2 ответов

У меня есть несколько RDD с одним общим полем CustomerId. Например: debitcardRdd имеет данные как...

Abhinay / 11 сентября 2018
0 голосов
1 ответ

Сценарий немного отличается от классического объединения поток-поток streamA : поток транзакций:...

Benedetto / 11 сентября 2018
0 голосов
2 ответов

У нас есть кластер Spark, предназначенный для выполнения анализа различных наборов финансовых...

aco / 11 сентября 2018
0 голосов
1 ответ

Учитывая набор данных, как вы видите в приведенном ниже коде (df), я должен иметь возможность...

sujit / 11 сентября 2018
0 голосов
2 ответов

Привет, я новичок в Spark и Kafka, я пишу пример кода для использования сообщений из темы Kafka с...

Niketa / 11 сентября 2018
0 голосов
1 ответ

У меня есть программа tenorflow, которую я хочу запустить на главном узле кластера AWS EMR, который...

MrCartoonology / 11 сентября 2018
0 голосов
0 ответов

Мне было интересно, когда Spark назначает раздел каждому работнику во время операции map (). Я...

James Gan / 11 сентября 2018
0 голосов
1 ответ

У меня есть док-контейнер с установленной искрой, и я пытаюсь отправить работу на пряжу в другом...

user_01_02 / 11 сентября 2018
0 голосов
1 ответ

Как видно из заголовка, у меня есть последовательность векторов (в столбце DataFrame, но ее можно...

kingledion / 10 сентября 2018
0 голосов
1 ответ

Что-то в строках: rdd.map (x => x x) против rdd.mapPartions (x => x.map (c => c c)) будет ли...

Duckling / 10 сентября 2018
0 голосов
0 ответов

Мы запускаем приложение Spark в кластере Amazon EMR. Наш код принимает данные JSON, преобразует их...

JOSE MANUEL RAMIREZ LEON / 10 сентября 2018
0 голосов
0 ответов
0 голосов
1 ответ

Я использовал kmeans и PCA, чтобы попытаться визуализировать многомерные кластеры k-средних в двух...

Andrew Davidson / 10 сентября 2018
0 голосов
1 ответ

Если я использую sc.textFile("/my/dir1") для создания СДР для всех файлов в каталоге, и...

gotch4 / 10 сентября 2018
0 голосов
1 ответ

Я пытаюсь разобрать читаемый PDF-файл, находящийся в hdfs. Я импортировал требуемые банки Проблема,...

RData / 10 сентября 2018
0 голосов
1 ответ

Я пытаюсь получить данные из базы данных Oracle и поместить их в AWS S3 , используя Apache Spark 2

Rinaz Belhaj / 10 сентября 2018
0 голосов
0 ответов

отсутствует или обнаружена неверная зависимость при загрузке файла класса 'KafkaUtils.class. Не...

Sachin Patil / 10 сентября 2018
0 голосов
1 ответ

Недавно я разработал приложение Spark Streaming с использованием Scala и Spark. В этом приложении я...

Krishna / 10 сентября 2018
0 голосов
0 ответов

Мое искровое приложение отлично работает в режиме клиента с мастером local[*] в режиме EMR и в...

tom10271 / 10 сентября 2018
0 голосов
1 ответ

Я использую Spark Structured Streaming (2.3) для записи данных паркета в контейнеры в облаке...

scalacode / 10 сентября 2018
0 голосов
0 ответов

У меня есть кластер EMR на AWS с одним мастером и двумя работниками. Каждая из трех машин (один...

Ashish Jha / 10 сентября 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...