Вопросы с тегом апаш-искра

0 голосов

0 ответов

связь записи Python с искрой

Ниже приведена запись пакета пакета сравнения.Я хочу передать искровой фрейм данных или RDD вместо...

vishal / 01 декабря 2018

0 голосов

1 ответ

scala Неуказанные значения параметров

Я хочу расширить класс SparkSession в спарк.Я скопировал конструктор оригинальной SparkSession,...

user3685285 / 30 ноября 2018

0 голосов

1 ответ

StreamingContext не имеет конструктора

Я имею в виду очень простой код Spark Streaming Scala.Код указан ниже import org.apache.spark

Shashi / 30 ноября 2018

0 голосов

0 ответов

Почему простой расчет - без каких-либо агрегатов или объединений - приводит к появлению OOME в Spark SQL?

Учитывая, что умеренно сложный sql - который выполняет агрегацию (collect_list и set_of_strings), а...

javadba / 30 ноября 2018

0 голосов

0 ответов

Итерация искровой программы для загрузки истории

У меня есть искровая работа, которую я зацикливаю, чтобы загрузить историю.Когда цикл работает, он...

Srinivas / 30 ноября 2018

0 голосов

0 ответов

Spark даже распределение данных

Я пытаюсь решить проблему перекос данных в кадре данных.Я ввел новый столбец, основанный на...

Waqar Ahmed / 30 ноября 2018

0 голосов

1 ответ

Операция записи Spark Dataframe очищает кэшированный Dataframe

Spark очищает кэшированный RDD после того, как на некоторые кадры данных, поступившие из этого кэша...

Bay Max / 30 ноября 2018

0 голосов

0 ответов

Изображение Spark Docker

Я хочу создать образ док-станции spark 2.4. Я следую инструкциям по ссылке Команда, которую я...

learninghuman / 30 ноября 2018

0 голосов

0 ответов

Как настроить Spring Spark Cassandra с XML?

Я пытаюсь построить анализ временных рядов арима, используя Apache Spark Mllib с Cassandra в рамках...

user3902602 / 30 ноября 2018

0 голосов

1 ответ

SparkException: задача не выполнена при записи строк

Использование spark-streaming для получения данных из Kafka и последующей записи их в HDFS в...

user2894829 / 30 ноября 2018

0 голосов

2 ответов

Искра ловит все исключения и печатает в строку

У меня есть некоторый искровой код, мне нужно по какой-то причине перехватить все исключения и...

user3607698 / 30 ноября 2018

0 голосов

0 ответов

Apache SQL Server Connect

Я хотел бы перенести таблицы с одного сервера на другой сервер через блокнот Jupyter в Apache Spark

İlknur Özgen / 30 ноября 2018

0 голосов

1 ответ

Можно ли использовать потоковый кластер для буферизации данных?

Я впервые использую потоковую передачу Spark.У нас есть сценарий использования, когда мы направляем...

Frankenstein / 30 ноября 2018

0 голосов

1 ответ

Расчет плотности ядра каждого столбца в кадре данных Spark

Есть ли способ рассчитать KDE каждого столбца DataFrame? У меня есть DataFrame, где каждый столбец...

Markus Wilhelm / 30 ноября 2018

0 голосов

3 ответов

Как динамически генерировать наборы данных на основе схемы?

У меня есть несколько схем, как показано ниже, с разными именами столбцов и типами данных.Я хочу...

user3190018 / 30 ноября 2018

0 голосов

0 ответов

Активные партии накапливаются с искровым потоком с Кафкой

Я разработал потоковую искру (1.6.2) с Kafka в модели приемника и выполняю это задание с размером...

Bab / 30 ноября 2018

0 голосов

0 ответов

Исключение scala.collection.immutable.List возникает при развертывании баночки пружинной загрузки на автономном кластере искры.

"невозможно назначить экземпляр scala.collection.immutable.List $ SerializationProxy полю org

Keep / 30 ноября 2018

0 голосов

1 ответ

Искра создать Dataframe в UDF

У меня есть пример, я хочу создать Dataframe в UDF.Нечто похожее на приведенное ниже import org

xuguozheng / 30 ноября 2018

0 голосов

1 ответ

Как найти журнал драйверов при отправке искровых заданий

packages=( 'org.apache.spark:spark-core_1.11:2.2.0' 'org.apache.spark:spark-sql_2

Frank Cheng / 30 ноября 2018

0 голосов

1 ответ

Вывод записи Spark как фиксированная ширина

Чтение файла фиксированной ширины в Spark легко, и для этого есть несколько способов.Однако я не...

Naren / 30 ноября 2018

0 голосов

1 ответ

Spark поддерживает перекос подсказки?

У меня проблемы с перекосом данных, и я хотел посмотреть, могут ли подсказки Spark помочь мне.Тем...

alexgbelov / 30 ноября 2018

0 голосов

1 ответ

Как использовать приблизительно количество по группе?

Spark имеет функцию SQL percentile_approx(), а его аналог Scala равен df.stat.approxQuantile()....

Dzmitry Lazerka / 30 ноября 2018

0 голосов

0 ответов

Исключительная ситуация тайм-аута при записи в HDFS - java.util.concurrent.TimeoutException: время ожидания фьючерса истекло после [100000 миллисекунд]

Ценю вашу помощь заранее.Уже 2-й день я продолжал пробовать все перестановки и комбинации, не мог...

Eyedia Tech / 30 ноября 2018

0 голосов

1 ответ

После прочтения многострочного файла JSON в Apache Spark, как получить вложенные атрибуты в виде столбцов?

Я использую Spark 2.3.2 и читаю многострочный файл JSON.Это вывод df.printSchema(): root |-- data:...

ScalaBoy / 30 ноября 2018

0 голосов

1 ответ

Сбой Apache Spark при выборе определенных столбцов из вложенного JSON

Я пытаюсь прочитать данные JSON и явно указываю схему для данных.Но я получаю исключение при...

Reddevil / 29 ноября 2018