Получение фрейма данных формы kafka с использованием искровой потоковой передачи - PullRequest
0 голосов
/ 14 ноября 2018

Привет, я новичок в искре. У меня есть сценарий получения потока данных из тем кафки в оконном режиме и последующего анализа. Я попробовал приведенный ниже код и выдает ошибку:

from pyspark.sql import SparkSession

spark=SparkSession.builder.appName("TestKakfa").getOrCreate()

df = spark \
  .readStream \
  .format("kafka") \
  .option("kafka.bootstrap.servers", "localhost:9092") \
  .option("subscribe", "dummy_events") \
  .option("startingOffsets", "earliest") \
  .load()


query = df.writeStream.format('console').start()
query.awaitTermination()

Я получаю ошибку ниже:

pyspark.sql.utils.StreamingQueryException: 'null\n=== Streaming Query ===\nIdentifier: [id = b842e3ba-8584-4764-8068-cce6b8d7de5f, runId = edc960c5-e5ef-4493-b9a2-c9543e1d2a8d]\nCurrent Committed Offsets: {}\nCurrent Available Offsets: {}\n\nCurrent State: INITIALIZING\nThread State: RUNNABLE'
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...