Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

0 голосов
1 ответ

Я хотел бы создать json из 2-х фреймов данных (один родительский, а другой дочерний). Дочерние...

Lux / 06 сентября 2018
0 голосов
1 ответ

Введение R-код написан с использованием пакета Sparklyr для создания схемы базы данных....

Shree / 06 сентября 2018
0 голосов
1 ответ

У меня проблемы с чтением данных из AWS Redshift в мой кластер Spark. Время чтения истекло, что...

vaer-k / 06 сентября 2018
0 голосов
1 ответ

У меня есть пример данных, как показано ниже: UserId,ProductId,Category,Action 1,111,Electronics...

Harshit Kakkar / 05 сентября 2018
0 голосов
0 ответов

У меня возникла проблема с сохранением Spark ML Pipeline. Я использую Scala 2.11 и Spark 2.3.1. val...

merenptah / 05 сентября 2018
0 голосов
2 ответов

Объединение двух данных приводит к почти 60 столбцам. Большинство из них предполагают, что они...

Dan / 05 сентября 2018
0 голосов
0 ответов

Я запускаю приведенный ниже код, который содержит фильтр, объединение и некоторые вычисления, такие...

SAHIL / 05 сентября 2018
0 голосов
3 ответов

Можно ли настроить несколько исполнителей для приложения Spark Streaming в локальном режиме,...

Cassie / 05 сентября 2018
0 голосов
2 ответов

DF1 - это то, что у меня сейчас, и я хочу, чтобы DF1 выглядел как DF2. Желаемый вывод: DF1 DF2...

Allen / 05 сентября 2018
0 голосов
0 ответов

Пример с плагиномasticsearch4hadoop: SELECT root.toto.toto FROM elasticsearch_table Spark вызывает...

Thomas Decaux / 05 сентября 2018
0 голосов
1 ответ

В настоящее время я выполняю алгоритм K-Means в кластере. Между последовательными выполнениями в...

J Gogh / 05 сентября 2018
0 голосов
0 ответов

Я пытаюсь использовать защищенную тему Кафки (используя SASL_PLAINTEXT, метод ScramLogin). Spark...

Sumit Baurai / 05 сентября 2018
0 голосов
1 ответ

Моя проблема в том, что у меня есть несколько вариантов использования. Например, у меня есть все...

jyoti / 05 сентября 2018
0 голосов
1 ответ

У меня есть имя таблицы "data", которая имеет 5 столбцов и каждый столбец содержит несколько...

Shree Batale / 05 сентября 2018
0 голосов
1 ответ

У меня есть вопрос о разделении Spark DataFrame, в настоящее время я использую Spark 1.6 для...

Giorgio / 05 сентября 2018
0 голосов
1 ответ

Я использую версию 2 для записи и сохранения фрейма данных, используя bucketBy. Таблица создается в...

vikrant rana / 05 сентября 2018
0 голосов
0 ответов

Я включил агрегирование журналов пряжи, используя Spark на Cloudera, но когда не удалось выполнить...

Tim Raynor / 05 сентября 2018
0 голосов
1 ответ

У меня есть кластер Spark с 17 исполнителями. Я интегрировал Spark 2.1 с Kafka и читаю данные из...

Naman Agarwal / 05 сентября 2018
0 голосов
1 ответ

Я хочу преобразовать этот базовый SQL-запрос в Spark select Grade, count(*) * 100.0 / sum(count(*))...

Pradeep yadav / 05 сентября 2018
0 голосов
1 ответ

Фрагменты кода: Файл 1: master.py # Spark Imports from pyspark import SparkContext,SparkConf from...

user3243478 / 05 сентября 2018
0 голосов
1 ответ

У меня есть сценарий, в котором я должен получить разницу между текущей датой и датами в столбце из...

sonia / 05 сентября 2018
0 голосов
2 ответов

У меня есть этот большой фрейм данных, длиной 7 миллионов строк, и мне нужно добавить столбец,...

Vítor Batista / 05 сентября 2018
0 голосов
1 ответ

Контекст оболочки Apache: как установить количество разделов при использовании оболочки: в...

Miguel A. Friginal / 05 сентября 2018
0 голосов
1 ответ

У меня есть RDD (Int, Iterable [String]). Как сделать RDD из итерируемой части? scala> val...

Rupesh Kumar / 04 сентября 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...