У меня есть сервер в облаке (скрытый за VPN), на котором я запускаю кластер Elasticsearch с одним узлом.В этом экземпляре Elasticsearch у меня есть индекс (скажем, он называется metrics-data) - он занимает 8 ГБ.
Я хотел развернуть кластер GCP Dataproc и выполнить некоторый анализ с использованием Spark с Jupyter on metrics-индекс данных из этого удаленного кластера Elasticsearch.
Какой самый простой способ добиться этого?