Контроллер искр Kubernetes ничего не знает о контрольных точках, AFAIK.Это просто способ для Kubernetes составить расписание для вашего драйвера Spark и рабочих, необходимых для выполнения задания.
Сохранение смещения действительно зависит от вашего приложения и от того, где вы хотите сохранить смещение Кафки, чтобы приэто перезапускает, берет это смещение и начинает потреблять оттуда. является примером о том, как сохранить его в Zookeeper.
Вы можете, например, написать функции менеджера смещения ZK в Scala:
import com.metamx.common.scala.Logging
import org.apache.curator.framework.CuratorFramework
...
object OffsetManager extends Logging {
def getOffsets(client: CuratorFramework,
... = {
}
def setOffsets(client: CuratorFramework,
... = {
}
...
Другой способсохраняйте свои смещения Kafka в чем-то надежном, например HDFS .