Я хочу получить только первое сообщение от производителя Kafka, и на основе этого сообщения я получу схему из этой первой записи и применю эту схему к следующим записям.
Есть ли способ, которым я могу получить данные столбца значения - первая строка - ячейка в строку Python?
# I have config spark kafka readStream
df_stream = spark \
.readStream \
.format("kafka") \
.option("kafka.bootstrap.servers", bootstrap_kafka_server) \
.option("subscribe", topic) \
.option("inferSchema", "true") \
# since the data - value column in Byte Array I have converted that data into String.
df_stream_value = df_stream.select(df_stream.value.cast("string").alias('value'))\
query = df_stream_value.writeStream.outputMode("complete").format("console").start()
# query.name() # get the name of the auto-generated or user-specified name
# query.explain() # print detailed explanations of the query
if df_stream_value.head().getInt(0) > 0:
# def process_row(row):