У меня есть сценарий использования для генерации суррогатного ключа (уникального и с приращением 1) для каждой записи, которую я вставляю в таблицу Hive с помощью программы Spark Streaming. Клавиша не может быть повторена, даже если программа перезапустится.
Основываясь на моих исследованиях, это невозможно реализовать в потоковой передаче искры, поскольку исполнители будут работать на разных узлах.
Есть ли способ реализовать это ??