Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

0 голосов
0 ответов

Я выполнил задание потокового воспроизведения, которое опрашивает массаж от Кафки и сохраняет его в...

Elisabetta / 05 июня 2019
0 голосов
1 ответ

У меня есть поток данных, поступающих от устройств IoT, которые имеют идентификатор (uuid) и...

ivanmp / 05 июня 2019
0 голосов
0 ответов

Я пытаюсь запустить код для загрузки данных из моей таблицы HBase в Spark RDD. Однако, когда я...

Christopher Ferris / 05 июня 2019
1 голос
2 ответов

У меня есть файл паркета, который разбит на части по столбцу даты, что может быть оптимизированным...

Pavan_Obj / 05 июня 2019
0 голосов
1 ответ

У меня есть требование выбрать каталоги даты (в формате yyyyMMdd), превышающие определенную дату....

sandy kay / 05 июня 2019
1 голос
0 ответов

В двух разных программах, которые используют разные типы записи в коллекцию MongoDB, в эту...

Jonathan Myers / 05 июня 2019
0 голосов
0 ответов

Журналы приложений не отображаются в журналах пряжи, когда задание отправляется в кластер пряжи....

Radu Oleanu / 05 июня 2019
0 голосов
1 ответ

Я наткнулся на приведенный ниже пример: lines = sc.textFile("some_file.txt") //line_1...

emilly / 05 июня 2019
3 голосов
0 ответов

На ноутбуке Zeppelin, с работающим интерпретатором spark / scala, я пытаюсь выполнить простейшую...

Checko Bech / 05 июня 2019
0 голосов
3 ответов

У меня есть dataframe с полями from_date и to_date: (2017-01-10 2017-01-14) (2017-01-03 2017-01-13)...

Adrian / 05 июня 2019
0 голосов
1 ответ

У меня есть список массивов, для которых мне нужно найти элемент с самой высокой частотой для...

stan.steve / 05 июня 2019
1 голос
1 ответ

В качестве входных данных для программы spark у нас есть файл JSON (который описывает определение...

Manoj Dhake / 05 июня 2019
1 голос
2 ответов

У меня есть фрейм данных, который я по-разному преобразовываю, прежде чем присоединить результат к...

Oleg / 05 июня 2019
1 голос
0 ответов

У меня есть крошечный фрейм данных pyspark с отношениями и функцией, которая вычисляет транзитивное...

RickyG / 05 июня 2019
0 голосов
0 ответов

Я использую кластер Spark с автономным диспетчером кластеров, и мне интересно, следует ли мне...

Brian / 05 июня 2019
1 голос
1 ответ

Я экспериментировал с 'flatMapGroupsWithState' со структурированной потоковой передачей Spark, идея...

posthumecaver / 05 июня 2019
0 голосов
2 ответов

У меня есть два файла ниже: file1 0000003 杉山______ 26 F 0000005 崎村______ 50 F 0000007 梶川______ 42 F...

Công Anh / 05 июня 2019
0 голосов
0 ответов

Я работаю над проблемой MapReduce, в которой я хочу отфильтровать каждый вывод раздела Map. Я хочу...

Yash / 05 июня 2019
0 голосов
1 ответ

Я должен посчитать повторяющиеся значения в массиве val arr = Array(1,2,2,3,4,5,5,5) Например, как...

Ch_03 / 05 июня 2019
0 голосов
1 ответ

Я пытаюсь преобразовать фрейм данных pandas на каждом рабочем узле (RDD, где каждый элемент...

Allen Wang / 05 июня 2019
1 голос
1 ответ

Ниже приведена моя Spark-функция, которая обрабатывает пустые значения в столбце DataFrame...

Pavan_Obj / 05 июня 2019
0 голосов
2 ответов

Я только что объединил два фрейма данных в pyspark, и вместо того, чтобы объединить строки с...

Hunter Mitchell / 04 июня 2019
0 голосов
1 ответ

Следующий воспроизводимый код делает то, что я хочу, но медленно.Я не уверен, правильно ли я...

Clay / 04 июня 2019
0 голосов
1 ответ

Я использовал приведенный ниже код для извлечения необходимых мне строк в Spark SQL.Но теперь я...

notulysses / 04 июня 2019
0 голосов
0 ответов

Я пытаюсь запустить свой кластер на своем внешнем IP, чтобы у меня могли быть рабочие с нескольких...

Stanciu Vlad / 04 июня 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...