В программировании потокового воспроизведения мы можем явно назначить идентификатор группы потребителей kafka, установив ниже config:
val kafkaParams = Map[String, Object](
...
"group.id" -> "use_a_separate_group_id_for_each_stream",
...
)
val rdd = KafkaUtils.createRDD[String, String](sparkContext, kafkaParams, offsetRanges, PreferConsistent)
В настройке структурированного потокового воспроизведения ваш собственный идентификатор группы потребителей запрещен.
В моей программе я не собираюсь менять идентификатор группы потребителей, но повторно использую этот идентификатор группы, чтобы найти самый последний offfset для разделов topi c, на которые подписана группа.
Так есть ли какой-нибудь метод, который я могу получить идентификатор группы потребителей, неявно используемый в моем приложении spark?