Я проводил исследование о настройке Spark JobServer Backend (SharedDb) с Cassandra.
И я видел в документации SJS, что они ссылались на Cassandra как на одну из общих баз данных, которую можно использовать.
Вот часть документации:
Spark Jobserver предлагает различные варианты внутреннего хранилища, такие как:
H2 / PostreSQL или другие базы данных SQL
Cassandra
Сочетание базы данных SQL или Zookeeper с HDFS
Но я не нашел ни одного примера конфигурации для этого.
У кого-нибудь есть пример? Или может помочь мне настроить его?
Отредактировано:
Я хочу использовать Cassandra для хранения метаданных и заданий из Spark JobServer. Поэтому я могу подключиться к любому серверу через прокси-сервер за этими серверами.