Offcourse, вы можете использовать драйвер как rest api.
Когда вы получите запрос, просто подготовьте свой RDD / DF, затем выполните действие, и оно будет работать.
Вы можете сделайте это в драйвере (что означает, что SparkContext всегда активен и требует ресурсов), или вы можете обернуть его с помощью REST Api, который отправляет задания в ваш кластер по запросу (а затем для каждого задания будет создан новый SparkContext).