Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

0 голосов
0 ответов

У меня есть этот исходный DF и некоторые переменные: val sourceDF = Seq( ("123",...

Piotr / 28 октября 2019
0 голосов
1 ответ

Я только что установил Anaconda, Apache spark, Pyspark, Scala на новую установку Linux Mint (все...

Jessica Chambers / 28 октября 2019
0 голосов
0 ответов

Из того, что я вижу, каждый драйвер занимает как минимум 1 процессор. Поэтому я хотел бы оставить...

Hoang Ong / 28 октября 2019
0 голосов
0 ответов

Я использовал pyspark для обработки нескольких файлов журнала, в которых запись разбита на...

kuixiong / 28 октября 2019
0 голосов
1 ответ

Я пытаюсь суммировать поле, содержащее массив, a = sc.parallelize([("a", [1,1,1]),...

RobinL / 28 октября 2019
0 голосов
1 ответ

Сводка Я попытался создать ExecutorPlugin . Я реализовал свой класс плагина внутри JAR приложения и...

user19650 / 28 октября 2019
0 голосов
1 ответ

/ Что я пытаюсь / Я хочу выполнить преобразование Spark UDF для нескольких блоков HDFS, содержащих...

somnathchakrabarti / 28 октября 2019
0 голосов
0 ответов

Я пытаюсь читать и записывать файлы из корзины S3. Я создал пользователя IAM на своем портале AWS....

Aswin Murugesh / 28 октября 2019
0 голосов
0 ответов
0 голосов
0 ответов

Я получаю это сообщение об ошибке при попытке запустить интерпретатор Spark из Zepplein 0.8.2 java

Babu / 27 октября 2019
1 голос
1 ответ
0 голосов
0 ответов
0 голосов
1 ответ

Я пытаюсь перебрать много файлов во многих папках в файле данных. Я две идеи, как показано ниже. //...

asher / 27 октября 2019
0 голосов
1 ответ

Я пытаюсь использовать HashTF в Spark, но у меня есть одна серьезная проблема. Если у inputCol есть...

JoSKa / 27 октября 2019
1 голос
1 ответ

Если мое значение СДР равно: val a = sc.parallelize(1 to 5) и после некоторого кода, если я забыл,...

learner / 27 октября 2019
0 голосов
1 ответ

У меня есть файл json, который имеет следующую структуру: root |-- header: struct (nullable = true)...

Haitam Abdoullah / 27 октября 2019
1 голос
1 ответ

У меня есть два кода Scala - MyMain.scala и MyFunction.scala, построенные отдельно, а встроенная...

somnathchakrabarti / 27 октября 2019
3 голосов
0 ответов

В моем коде мне нужно объединить список на основе ключей Dstream. Моя цель - создать список слов,...

Sophie / 27 октября 2019
1 голос
0 ответов

Когда я пытаюсь записать фрейм данных в виде паркета, размеры файлов неодинаковы. Хотя я не хочу...

sunny_39 / 27 октября 2019
1 голос
1 ответ
0 голосов
1 ответ

Я новичок в Python и Apache Spark и пытаюсь понять, как работает функция "pyspark.sql.functions

python_deua / 27 октября 2019
0 голосов
3 ответов

Я планирую улучшить свой навык Apache Spark. Я хотел знать, существуют ли какие-либо веб-сайты,...

Venkatesan Muniappan / 27 октября 2019
3 голосов
0 ответов

У меня есть одно преобразование, единственная цель которого - удалить дубликаты. При использовании...

Jesse / 26 октября 2019
0 голосов
0 ответов

У нас есть приложение Spark Streaming (Kafka), которое также выступает в роли продюсера, создавая...

bitan / 26 октября 2019
2 голосов
0 ответов

Я использую следующую команду для выполнения скрипта pyspark: spark-submit \ --packages org.apache

g grey / 26 октября 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...