Вам вообще не нужен Hortonworks. Фактически Spark от HDP скомпилирован только для работы в среде YARN.
Вы можете скачать Spark с HDFS из spark.apache.org
, который также будет включать планировщик k8s
Лично я бы рекомендовал использовать Ceph (проект Rook CNCF), MinIO или GlusterFS вместо HDFS в кластере k8s. Каждый из этих вариантов может использовать Had oop FS APIs