Вопросы с тегом искровой структурированный-потоковый

0 голосов

0 ответов

Сложности перевода кода Scala Spark-Streaming в Pyspark

Я пытаюсь перевести реализацию Spark в Pyspark, которая обсуждается в этом блоге: https://dorianbg

Nelson Fleig / 26 сентября 2019

0 голосов

1 ответ

Добавлять только новые агрегаты на основе групповых ключей

Я должен обработать некоторые файлы, которые приходят ко мне ежедневно.Информация имеет первичный...

LeandroHumb / 25 сентября 2019

0 голосов

0 ответов

Как смонтировать хранилище BLOB-объектов Azure в конкретный кластер

У меня есть структурированное потоковое задание для блоков данных Azure, которое записывает данные...

user9297554 / 25 сентября 2019

0 голосов

1 ответ

Apache Kafka со структурным потоковым протоколом

Я пытаюсь написать потребителя Kafka (из protobuf), используя структурированную потоковую передачу

teddy / 24 сентября 2019

0 голосов

2 ответов

Извлекайте данные из Azure EventHub для временного окна в Scala, используя IntelliJ

Я хотел бы получить данные за 1 день из концентратора событий Azure, применить логику и скопировать...

Antony / 23 сентября 2019

4 голосов

2 ответов

Что содержит foreachBatches в потоковом запросе из нескольких тем Kafka?

Учитывая DataStreamReader, настроенный для подписки на несколько тем, подобных этой (см. здесь ):...

Beryllium / 11 июля 2019

0 голосов

0 ответов

Как выполнить действие только при поступлении нового непустого сообщения из темы KAFKA в структурированном потоке?

У меня есть статический Dataframe (CSV-файл) и тема KAFKA (скажем, Topic1) в качестве входных...

rajesh / 11 июля 2019

0 голосов

0 ответов

Вставка в таблицу cassandra 9 (строковый msg), потребляющая искру. Неверная константа STRING (-1) для "calendar_period_id" типа bigint

Я вставляю в таблицу Cassandra типичные записи строк записи Kafka, получая из-за искровой потоковой...

venkat Ramanan VTR / 04 июля 2019

0 голосов

1 ответ

Как сохранить данные Кафки в другое место на основе значения столбца в потоковой структурированной искре?

У меня есть сценарий использования, в котором я использую данные из Кафки с использованием...

Pankaj Mishra / 25 июня 2019

0 голосов

1 ответ

Как определить происхождение сообщений в искровой структурированной потоковой передаче с кафкой в качестве источника?

У меня есть сценарий использования, в котором я должен подписаться на несколько тем в kafka в...

Pankaj Mishra / 24 июня 2019

4 голосов

2 ответов

Spark структурированная потоковая передача с Kafka не учитывает startOffset = "самое раннее"

Я настроил Spark Structured Streaming (Spark 2.3.2) для чтения из Kafka (2.0.0). Я не могу...

Daniel Ahn / 19 июня 2019

1 голос

0 ответов

Водяные знаки в Spark Структурированные потоковые 2.3.0

Я читаю данные из Кафки в Spark Structured Streaming 2.3.0.Данные содержат информацию о некоторых...

malgosia / 14 июня 2019

0 голосов

0 ответов

Поддерживает ли Spark Structured Streaming порядок сообщений Kafka?

У меня есть приложение Spark Structured Streaming, которое принимает сообщения из нескольких тем...

lfk / 11 июня 2019

0 голосов

0 ответов

Не удалось найти класс LoginModule: org.apache.kafka.common.security.plain.PlainLoginModule

Среда: Spark 2.3.0, Scala 2.11.12, Kafka (Какая бы ни была последняя версия) У меня есть безопасная...

Sparker0i / 10 июня 2019

1 голос

1 ответ

ошибка искровой отправки. Причина: java.lang.ClassNotFoundException: kafka.DefaultSource

В моей программе spark у меня есть этот код: val df = spark.readStream .format("kafka")

Sparker0i / 08 июня 2019

1 голос

0 ответов

Блоки данных MQTT Streaming AbstractMethodError

Я пытаюсь создать структурированную потоковую передачу SQL от брокера MQTT: test = spark.readStream

LeandroHumb / 31 мая 2019

2 голосов

1 ответ

Spark Structured Streaming OutOfMemoryError, вызванная тысячами экземпляров KafkaMbean

Исполнитель Spark Structured Streaming завершается с ошибкой OutOfMemoryError Проверка выделения...

Random Walker / 23 мая 2019

2 голосов

0 ответов

Как включить и «последний», и «JSON с определенным смещением» в «startOffsets» при импорте данных из Kafka в Spark Structured Streaming

У меня есть потоковый запрос, сохраняющий данные в fileink. Я использую .option («стартовый набор»,...

drone / 22 мая 2019

0 голосов

0 ответов

Читатель JSON ожидал токен типа «LEFT_PAREN», но обнаружил «,» при выполнении задания структурированной потоковой передачи Spark в приемник MongoDB

Я запускаю задание структурированной потоковой передачи в приемник MongoDB, и я сталкиваюсь с...

drone / 08 мая 2019

0 голосов

1 ответ

Как читать карту Redis в спарк с помощью spark-Redis

У меня есть нормальная карта скала в Redis (ключ и значение). Теперь я хочу прочитать эту карту в...

thedevd / 07 мая 2019

1 голос

0 ответов

Spark Structured Streaming: потребляет для каждой микропакета все данные из темы Кафки

Я не знаю, задаю ли я себе неправильное решение моей проблемы. Идея состоит в том, что я должен...

David G. / 03 мая 2019

0 голосов

1 ответ

Структурированный поток Apache Spark с Google PubSub

Я использую Spark Dstream для извлечения и обработки данных из Google PubSub. Я ищу способ перехода...

Alex / 03 мая 2019

1 голос

0 ответов

Чтение авро-сообщений от Кафки в потоковой передаче с искрой

Я впервые использую pyspark. Версия Spark: 2.3.0 Версия Kafka: 2.2.0 У меня есть производитель...

user10301750 / 02 мая 2019

2 голосов

2 ответов

Spark структурированное потоковое приложение для чтения из нескольких тем Kafka

У меня есть приложение структурированного потокового вещания Spark (v2.3.2), которое нуждается в...

jammann / 01 мая 2019

0 голосов

1 ответ

pyspark структурированные потоковые записи для паркета партиями

Я выполняю некоторые преобразования в кадре потоковых данных с искровой структурой.Я храню...

Y0gesh Gupta / 26 апреля 2019