Я ищу решение для добавления значения временной метки kafka в мою схему структурированной потоковой передачи Spark.Я извлек поле значения из кафки и создания dataframe.Моя проблема в том, что мне нужно получить поле метки времени (от kafka) вместе с другими столбцами.
Вот мой текущий код:
val kafkaDatademostr = spark
.readStream
.format("kafka")
.option("kafka.bootstrap.servers","zzzz.xxx.xxx.xxx.com:9002")
.option("subscribe","csvstream")
.load
val interval = kafkaDatademostr.select(col("value").cast("string")).alias("csv")
.select("csv.*")
val xmlData = interval.selectExpr("split(value,',')[0] as ddd" ,
"split(value,',')[1] as DFW",
"split(value,',')[2] as DTG",
"split(value,',')[3] as CDF",
"split(value,',')[4] as DFO",
"split(value,',')[5] as SAD",
"split(value,',')[6] as DER",
"split(value,',')[7] as time_for",
"split(value,',')[8] as fort")
Как я могу получить метку времени иза кафки добавить как столбцы вместе с другими столбцами?