Есть ли способ, где я могу получить сообщение [данные столбца значения] из Spark Dataframe в строковую переменную? - PullRequest
0 голосов
/ 10 июля 2019

Я хочу получить только первое сообщение от производителя Kafka, и на основе этого сообщения я получу схему из этой первой записи и применю эту схему к следующим записям.

Есть ли способ, которым я могу получить данные столбца значения - первая строка - ячейка в строку Python?

# I have config spark kafka readStream 
df_stream = spark \
    .readStream \
    .format("kafka") \
    .option("kafka.bootstrap.servers", bootstrap_kafka_server) \
    .option("subscribe", topic) \
    .option("inferSchema", "true") \
    .load()

# since the data - value column in Byte Array I have converted that data into String.

df_stream_value = df_stream.select(df_stream.value.cast("string").alias('value'))\
                            .groupBy("value").count()

query = df_stream_value.writeStream.outputMode("complete").format("console").start()


# query.name()  # get the name of the auto-generated or user-specified name
# query.explain()  # print detailed explanations of the query


if df_stream_value.head().getInt(0) > 0:
    query.stop()

query.awaitTermination()
# def process_row(row):
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...