Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

0 голосов
2 ответов

Мне нужно использовать следующие библиотеки - import org.apache.spark.SparkConf import org.apache

zzmay / 05 мая 2018
0 голосов
1 ответ

Мы планируем выполнять пакетную обработку ежедневно. Мы генерируем 1 ГБ файлов CSV каждый день и...

milad ahmadi / 05 мая 2018
0 голосов
0 ответов

Я пытаюсь вычислить инверсию 25 ГБ матрицы в искре, я работаю в локальном режиме с машиной 6 ГБ в...

Lamine Lazreg / 05 мая 2018
0 голосов
2 ответов

Я пытаюсь увидеть, сможем ли мы создать новые столбцы из значения в одном из столбцов в фрейме...

Lux / 04 мая 2018
0 голосов
1 ответ

Я передаю тип в плоскую карту следующим образом; val customData: RDD[(Text/String, Custom)] =...

SparkleGoat / 04 мая 2018
0 голосов
1 ответ

У меня проблема с контрольными точками в рабочей среде, когда spark не может найти файл из папки...

Yuriy Bondaruk / 04 мая 2018
0 голосов
1 ответ

Я поместил текстовый файл с именем Linecount2.txt в hdfs и построил простой rdd для подсчета...

abdul rahim / 04 мая 2018
0 голосов
1 ответ

У меня проблемы с попыткой обработки огромного количества данных в кластере. код: val (sumZ,...

decay / 04 мая 2018
0 голосов
1 ответ

Я использую paramGrid для точной настройки параметров моей модели. Вот следующий код. windowSize =...

Muss / 04 мая 2018
0 голосов
1 ответ

Я хочу запустить несколько параллельных SQL в одном кластере, чтобы я мог использовать весь...

Krishas / 04 мая 2018
0 голосов
1 ответ

У меня есть следующая схема: root |-- Id: long (nullable = true) |-- element: struct (containsNull...

Alina / 04 мая 2018
0 голосов
1 ответ

Я пытаюсь сделать левое внешнее соединение между двумя Kafka Stream, используя PySpark и Structured...

Eric Bellet / 04 мая 2018
0 голосов
2 ответов

Я хочу создать файл Excel из моего DataSet? SomeBody может помочь мне с примером выражения.

OOvic / 04 мая 2018
0 голосов
1 ответ

Когда я создаю поток данных в искре для входящих данных из kafka, я получаю следующее...

Rajendra Jangir / 04 мая 2018
0 голосов
0 ответов

Я использую потоковую передачу pyspark для выполнения преобразования с сохранением состояния....

fali / 04 мая 2018
0 голосов
2 ответов

Теперь версия spark - 2.3. Я видел maven центральное хранилище: https://search.maven

Joe / 04 мая 2018
0 голосов
0 ответов

Я написал простую программу для чтения данных из HBase, программа работает в Cloudera с поддержкой...

Alchemist / 04 мая 2018
0 голосов
2 ответов

У меня есть отсортированный набор данных, который обновляется (фильтруется) внутри цикла в...

Daniele Foroni / 04 мая 2018
0 голосов
1 ответ

Я выполняю запрос диапазона в СДР точек (x, y) в pyspark. Я разделил пространство xy на сетку 16 *...

user302787 / 04 мая 2018
0 голосов
1 ответ

Я пытаюсь отобразить различное количество пары разных столбцов в кадре данных spark, а также...

CaroV1x3n / 04 мая 2018
0 голосов
1 ответ

Когда я захотел сделать проект по анализу настроений, я много раз искал в Интернете, и, наконец, я...

Mohammed Zubair Khan / 03 мая 2018
0 голосов
1 ответ

До недавнего времени parquet не поддерживал null значения - сомнительная предпосылка. Фактически,...

javadba / 03 мая 2018
0 голосов
0 ответов

Я хотел бы взять каждую строку моего кадра данных Spark и обработать данные через микросервис,...

SriK / 03 мая 2018
0 голосов
0 ответов

Я работаю над анализом логов (в формате Json) в Scala. Я не знаю, как поступить. Я могу получить...

oortcloud_domicile / 03 мая 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...