spark-kafka транзитивно включает в себя kafka-клиентов, поэтому вы можете инициализировать необработанный экземпляр потребителя самостоятельно и искать его
В качестве альтернативы, если группа потребителей не существует, вы должны установить startingOffsets=latest
в ваша конфигурация Spark
примечание: API Kafka Direct Stream устарел начиная с Spark 2.4, и вы должны использовать вместо него структурированную потоковую передачу