Вопросы с тегом Apache-искра - PullRequest

Вопросы с тегом Apache-искра

0 голосов
1 ответ

Я пытаюсь получить application_number запись из таблицы hive и собрать ее в виде списка. и из этого...

user6325753 / 10 мая 2018
0 голосов
1 ответ

У меня есть скрипт Python, который в настоящее время работает на моем рабочем столе. Он принимает...

Actuary / 09 мая 2018
0 голосов
0 ответов

У нас есть DStreams, который использует сообщения JSON, используя пользовательский получатель. Это...

user2959204 / 09 мая 2018
0 голосов
1 ответ

У меня есть Dataset DS1 ниже. Я хочу собрать DS2 с использованием Spark Java API. DS1:...

OOvic / 09 мая 2018
0 голосов
1 ответ

У меня есть одна ситуация, когда в случае, если определенное условие не выполняется, нет...

Amit Kumar / 09 мая 2018
0 голосов
2 ответов

Я наткнулся на следующий фрагмент кода Apache Spark: JavaRDD<String> lines = new...

Mahesha999 / 09 мая 2018
0 голосов
2 ответов

В pysparkSQL у меня есть DataFrame с именем bmd2, например: DataFrame[genres: string, id: int,...

iPrince / 09 мая 2018
0 голосов
1 ответ

Я новичок в pyspark ... У меня есть большой файл журнала, который содержит данные, как показано...

Rudrashis / 09 мая 2018
0 голосов
2 ответов

У меня есть два кадра данных, DF1 и DF2, DF1 - мастер, который хранит любую дополнительную...

Murali / 09 мая 2018
0 голосов
2 ответов

Давайте рассмотрим такой фрагмент псевдокода Python, используя spark. rdd1 = sc.textFile("..

Michocio / 07 мая 2018
0 голосов
0 ответов

У меня есть искровой фрейм данных с 10 миллионами строк и только 3 столбцами. Один из столбцов -...

Nilanjan / 07 мая 2018
0 голосов
1 ответ

Я пытаюсь сделать простой поиск и агрегацию (больших) CSV из грамм Google. Для этого у меня есть...

Arnaud / 07 мая 2018
0 голосов
0 ответов

Я пытаюсь использовать пакет построения искрового дерева для визуализации дерева решений. В этой...

vanshika gupta / 07 мая 2018
0 голосов
1 ответ

Я написал функцию, которую хочу применить к фрейму данных, но сначала мне нужно преобразовать фрейм...

Lisa Chen / 07 мая 2018
0 голосов
1 ответ

Я только начал изучать программирование на Spark и Python: не могли бы вы помочь мне понять мою...

Vinod / 06 мая 2018
0 голосов
1 ответ

У меня есть rdd следующего вида: rdd = sc.parallelize([(2, [199.99, 250.0, 129.99]), (4, [49.98,...

juamd / 06 мая 2018
0 голосов
1 ответ

Я изучаю Spark с базовыми знаниями Java. В моей первой программе Spark я увидел код, который...

Andrea / 06 мая 2018
0 голосов
1 ответ

Это очень неубедительный вопрос, но я действительно хочу знать, по какому пути следуют в этом. Я...

Elena / 06 мая 2018
0 голосов
0 ответов

Я сталкиваюсь со следующей ошибкой при выполнении команды spark-submit только в режиме искрового...

user2873311 / 06 мая 2018
0 голосов
2 ответов

Я пытаюсь преобразовать значение строки искрового фрейма как отношение каждого другого значения той...

Santhosh Chandran / 05 мая 2018
0 голосов
1 ответ

У меня есть действие rdd.foreachPartition(some_function) в pyspark. Функция some_function...

Adiga / 05 мая 2018
0 голосов
1 ответ

Мне нужно предложение по запросу ниже. В Amazon S3 хранится огромное количество zip-файлов. Шаблон...

user2426785 / 05 мая 2018
0 голосов
3 ответов

Я использую PyCharm 2018.1, используя Python 3.4 с Spark 2.3, установленным через pip в virtualenv....

Jared / 05 мая 2018
0 голосов
2 ответов

У меня есть работа с python-кодом aws, которая объединяет две таблицы Aurora и записывает / выводит...

Kiran / 05 мая 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...