Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

0 голосов
2 ответов

У меня есть парный RDD, который выглядит как (a1, (a2, a3)) (b1, (b2, b3)) ... Я хочу сгладить...

Random Certainty / 10 октября 2018
0 голосов
1 ответ

С помощью Spark DStreams я могу указать длину скользящего окна следующим образом: val...

Igorock / 10 октября 2018
0 голосов
0 ответов

мой фрейм данных выглядит следующим образом здесь, что я хочу всякий раз, когда первое вхождение...

stackoverflow / 10 октября 2018
0 голосов
1 ответ

У меня есть длительное выполнение задания на Spark , которое после нескольких часов работы не...

Waqar Ahmed / 10 октября 2018
0 голосов
0 ответов

Структура потоковой передачи Sparks записывает данные в Kafka, выдавая исключение: Невозможно...

simonqian / 10 октября 2018
0 голосов
1 ответ

В приведенном ниже коде не удалось захватить записи с нулевым значением.Снизу df1, столбец НЕТ.5...

RK. / 10 октября 2018
0 голосов
0 ответов
0 голосов
2 ответов

Я хочу распространить rdd, используя карту списка. входная выборка Log("key1",...

sproutee / 10 октября 2018
0 голосов
1 ответ

Мы потребляем данные из EventHub с использованием потоковой передачи.Входящий поток содержит JSON...

Piyush Sagar / 10 октября 2018
0 голосов
0 ответов
0 голосов
1 ответ

У меня в кластере Hortonworks запущено задание потоковой передачи.Я запускаю его в режиме кластера...

dileepVikram / 10 октября 2018
0 голосов
1 ответ

Я пытался улучшить производительность некоторого существующего фрейма данных spark, добавив в него...

zfy / 10 октября 2018
0 голосов
2 ответов

Я пытаюсь вставить данные в таблицу Hive External из Spark Sql.Я создал внешнюю таблицу улья с...

Ayan Biswas / 10 октября 2018
0 голосов
0 ответов

У меня есть проблема, которую я пытаюсь решить в Spark, определяя свой собственный UDAF, пытаясь...

PMende / 10 октября 2018
0 голосов
2 ответов

У меня есть датафрейм со значениями, такими как List [INTERSTED_FIELD: details].Я пытаюсь получить...

user3407267 / 10 октября 2018
0 голосов
1 ответ

Я искал некоторую информацию на форумах MSDN, но не смог найти хороший форум / При чтении на...

Harry Leboeuf / 09 октября 2018
0 голосов
0 ответов

Я немного запутался, пытаясь понять, выполняет ли коннектор spark-cassandra запросы на основе...

Miguel A. Friginal / 09 октября 2018
0 голосов
2 ответов

У меня есть набор данных со столбцами month, id и value, что-то вроде этого: val df = Seq( (201801,...

Carolina / 09 октября 2018
0 голосов
0 ответов

У меня проблема с производительностью Spark в AWS EMR, при использовании Windows для агрегирования...

Tom Lous / 09 октября 2018
0 голосов
1 ответ

У меня есть таблица Aurora, в которой 500 миллионов записей.Мне нужно выполнить анализ больших...

Atharv Thakur / 09 октября 2018
0 голосов
0 ответов

У меня работает сервер Hive Thrift, и я подключаюсь к нему через Билайн.Я делаю:...

user3685285 / 09 октября 2018
0 голосов
0 ответов

Я пытаюсь загрузить таблицу RDBMS из postgres в таблицу Hive на postgres.Для этого я написал...

Photon / 09 октября 2018
0 голосов
0 ответов

Я установил очень высокое значение spark.sql.autoBroadcastJoinThreshold, равное 20 ГБ.Я...

Venkat Dabri / 09 октября 2018
0 голосов
1 ответ

У меня есть приложение Spark Streaming (Scala), работающее на CDH 5.13, использующее сообщения от...

sparker / 09 октября 2018
0 голосов
0 ответов

Я брожу по Spark и пытаюсь читать из файлового потока.Это мой пример кода: JavaStreamingContext...

somebody / 09 октября 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...