Вопросы с тегом апаш-искра

0 голосов

2 ответов

Перекрестные версии конфликтов с Spark и Azure-Cosmosdb

Я бился головой об этом некоторое время, и я официально застрял.Я пытаюсь скомпилировать jar-файл,...

downer / 24 мая 2018

0 голосов

1 ответ

CrossValidator, настраивающий искру ML, терпящий неудачу на параметрах "Посторонний Param был найден" при сохранении модели

Я выполняю перекрестную проверку spark ml с помощью regParam для логистической регрессии как части...

KSeeker / 23 мая 2018

0 голосов

1 ответ

Как проверить преобразование типов данных во время приведения

У нас есть скрипт, который отображает данные в фрейм данных (мы используем pyspark).Данные...

QPSK / 23 мая 2018

0 голосов

1 ответ

Как spark.csv определяет количество разделов при чтении?

В Spark 2.2.0: я читаю в одном файле, используя spark.csv.read("filepath").load().rdd

L. Chu / 23 мая 2018

0 голосов

1 ответ

Существует ли общая переменная между задачами в одном исполнителе

Аккумуляторы и широковещательные переменные - это способ иметь общие переменные во всех узлах...

nikniknik / 23 мая 2018

0 голосов

1 ответ

Смещения, зафиксированные не по порядку, с потоковым приемником Hive Spark DataSource API V2

Я использую приемник для сохранения Spark (2.3) Структурированного потокового фрейма данных в...

carl / 23 мая 2018

0 голосов

1 ответ

Apache Spark Pivot Query Stuck (PySpark)

У меня есть простые данные как: +--------------------+-----------------+-----+ | timebucket_start|...

david nadal / 23 мая 2018

0 голосов

0 ответов

Проблема при использовании beeline для подключения к Spark Thrift Server

Я запустил SpriK-сервер Spark на порте 10015. Он запустился успешно, и я также могу подключиться к...

hu li / 23 мая 2018

0 голосов

1 ответ

Создание вложенных данных после объединения в Spark Scala

Моя цель состоит в том, чтобы подготовить в spark / Hadoop информационный фрейм, который я буду...

Nabil / 23 мая 2018

0 голосов

1 ответ

Искра Исключение: java.lang.NoSuchMethodError: org.apache.http.conn.ssl.SSLConnectionSocketFactory

Когда я запускаю свой код в локальном коде, он работает нормально.Однако, когда я запускаю его в...

Markus / 23 мая 2018

0 голосов

2 ответов

Spark Структурированная потоковая передача - ограничения?(Производительность источника, неподдерживаемые операции, интерфейс Spark)

Я начал исследовать Spark Structured Streaming, чтобы написать несколько приложений, которые до...

jf2010 / 23 мая 2018

0 голосов

1 ответ

Scala SparkSQL Создать UDF для обработки исключений, когда столбец может быть когда-то структурой, а иногда строкой

Я изо всех сил пытаюсь создать udf для извлечения некоторых данных столбца.Столбец хитрый,...

Benny Elgazar / 23 мая 2018

0 голосов

0 ответов

Расписание задач в спарк

Я запускаю приложение pyspark, которое состоит из одного этапа.Количество задач на этапе зависит от...

Prakshi Yadav / 23 мая 2018

0 голосов

1 ответ

Как работает Spark rdd.collectAsMap ()?Почему время, затрачиваемое на обучение, увеличивается?

Используя Spark для обучения модели, параметры трансляции обновляются во время обучения, и в начале...

danche / 23 мая 2018

0 голосов

1 ответ

Spark Structured Streaming: консольный приемник не работает должным образом

У меня есть следующий код для чтения и обработки данных Kafka с использованием структурированной...

KarthikJ / 23 мая 2018

0 голосов

1 ответ

Как проверить, работает ли векторизация орков в приложении Spark?

Я включил перечисленные ниже конфигурации в мое приложение для потоковой передачи искры, но я не...

Mohammad Umar Farooq / 23 мая 2018

0 голосов

0 ответов

Возможно ли иметь два экземпляра одного и того же искрового задания для обработки темы Кафки?

У меня есть работа по обогащению данных, и я обогащаю свои данные из источника данных (одна тема...

Martin Peng / 23 мая 2018

0 голосов

2 ответов

в этом случае спарк-кэш () вызывает драйвер collect ()?

нужна помощь в интерпретации журнала ошибок от Spark.Насколько я понимаю, кеш не должен запускать...

hiroprotagonist / 23 мая 2018

0 голосов

0 ответов

AWS Glue: использование ResolveChoice для проецирования на метку времени поля при преобразовании в паркет

Попытка преобразовать серию сжатых gz в формат паркета. В процессах пытаются сделать какие-то...

RidinAGrvyTrain / 23 мая 2018

0 голосов

1 ответ

Как привести столбец String в список

Мой фрейм данных выглядит так: df.schema приводит к: StructType( StructField(a,StringType,true),...

Hugo / 23 мая 2018

0 голосов

1 ответ

Как выполнить многострочный запрос spark sql при хранении в виде строковой переменной?

У меня есть такой код с многострочным запросом val hiveInsertIntoTable = spark.read.text(fileQuery)

gimp770 / 23 мая 2018

0 голосов

1 ответ

Делить тома между стеками докеров?

У меня есть два разных стека докеров, один для HBase и один для Spark.Мне нужно вывести банки HBase...

Jzl5325 / 22 мая 2018

0 голосов

1 ответ

Как вставить конфигурацию в yarn-site.xml в кластере EMR

У меня проблема с: running beyond physical memory limits. Current usage: 1.5 GB of 1.4 GB physical...

Marcos Santana / 22 мая 2018

0 голосов

1 ответ

Ошибка скольжения СДР не понята

Учитывая, что это работает: (1 to 5).iterator.sliding(3).toList Тогда почему это не работает? val...

thebluephantom / 22 мая 2018

0 голосов

1 ответ

Spark структурированная ошибка потоковой передачи

Я пытаюсь выполнить следующий код: import org.apache.spark.sql.types._ val schema = StructType(...

Prasad Ligade / 22 мая 2018