Я новичок в потоковом зажигании.Я пытаюсь выполнить некоторые упражнения по извлечению данных из kafka и соединению с таблицей улья. Я не уверен, как выполнить JOIN в потоковой передаче с искрой (не структурированной потоковой).Вот мой код
val ssc = new StreamingContext("local[*]", "KafkaExample", Seconds(1))
val kafkaParams = Map[String, Object](
"bootstrap.servers" -> "dofff2.dl.uk.feefr.com:8002",
"security.protocol" -> "SASL_PLAINTEXT",
"key.deserializer" -> classOf[StringDeserializer],
"value.deserializer" -> classOf[StringDeserializer],
"group.id" -> "1",
"auto.offset.reset" -> "latest",
"enable.auto.commit" -> (false: java.lang.Boolean)
)
val topics = Array("csvstream")
val stream = KafkaUtils.createDirectStream[String, String](
ssc,
PreferConsistent,
Subscribe[String, String](topics, kafkaParams)
)
val strmk = stream.map(record => (record.value,record.timestamp))
Теперь я хочу сделать соединение на одной из таблиц в улье.В потоковой передаче с искрой я могу напрямую вызывать spark.table («table nanme») и выполнять некоторое соединение, но в потоковой передаче с искрой я могу это сделать, поскольку все основано на RDD.кто-нибудь может мне помочь?