Question

Я пытаюсь визуализировать потоковые запросы в структурированном потоке. Как я мог это сделать? Должен ли я использовать инструментальные панели или есть какой-либо другой инструмент?

Я не могу найти ничего подобного в Интернете.

DF = spark \
    .readStream \
    .format("kafka") \
    .option("kafka.bootstrap.servers", bootstrapServers)\
    .option("subscribe", topics)\
    .load()\
    .selectExpr("CAST(value AS STRING)")

...
 query1 = prediction.writeStream.outputMode("update").format('console').start()
 query1.awaitTermination()

thebluephantom · Answer 1 · 27 марта 2020

Попробуйте что-то вроде этого - queryName ключ:

Scala

// Have all the aggregates in an in-memory table
val aggDF
 .writeStream
 .queryName("aggregates")    // this query name will be the table name
 .outputMode("complete")
 .format("memory")
 .start()

spark.sql("select * from aggregates").show()

pyspark

# Have all the aggregates in an in-memory table. The query name will be the table name
aggDF \
  .writeStream \
  .queryName("aggregates") \
  .outputMode("complete") \
  .format("memory") \
  .start()

spark.sql("select * from aggregates").show()   # interactively query in-memory table

Записные книжки от DataBricks имеют функцию display.

Spark Структурированная потоковая визуализация

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Spark Структурированная потоковая визуализация

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы