В соответствии с документацией, SAP_Vora_Installation_Admin_Guide_2.0_en.pdf требуется, чтобы работали кластер Hadoop / Spark и кластер Kubernetis.
Теперь мой вопросЗачем вам нужен этот кластер Hadoop / Spark?Потому что SAP Vora может читать из HDFS, WebHDFS и так далее.
Так это просто, что если у вас есть задание Spark, вы можете просто запустить его в кластере Spark и, если ему нужны данные из HANA / Vora, оно может получить к нему доступ?Или Vora также использует кластер Spark для обработки данных?
Поскольку сейчас похоже, что Spark может использовать Vora, но не то, что Vora может использовать Spark (инструменты пользовательского интерфейса Vora, такие как редактор SQL и т. Д.).Поскольку Zeppelin, который вы можете прикрепить к Vora, просто используется для визуализации (насколько я понимаю, поправьте меня, если я ошибаюсь, пожалуйста).
Мой второй вопрос - возможно ли использовать PySpark на Hadoop / Spark?кластер для взаимодействия с Vora, а не только с Scala Spark.
Заранее спасибо.