У меня есть задание Spark Streaming, которое при запуске запрашивает Hive и создает объект Map [Int, String], который затем используется для частей вычислений, выполняемых заданием.
Проблема Iесть то, что данные в Hive имеют потенциальные изменения каждые 2 часа.Я хотел бы иметь возможность обновлять статические данные по расписанию без необходимости каждый раз перезапускать задание Spark.
Первоначальная загрузка объекта Map занимает около 1 минуты.
Любая помощь приветствуется.