Более простой подход
Используйте 2 местоположения HDFS циклически для каждого источника или цели для загрузки с таблицами def t1_x и t2_x соответственно, и используйте view_x для переключения между t1_x и t2_x аналогичным образом.
Запросы всегда должны использовать view_x.
Вы можете своевременно очистить более неиспользуемые местоположения HDFS до следующего цикла.
Подсказка - оставить на некоторое время новые и старые данные.
Комментарий для создания Единственный недостаток - это когда набор запросов должен работать со старыми версиями данных.Если измененные данные имеют тип «добавлено», то нет проблем, но если они могут быть перезаписаны, возникает проблема.
Более сложный подход
В последнем случае, если вы не уверены, что проблема, или нет, вам нужно применить раздражающее решение, как указано ниже.
, которое предназначено для версии данных (с помощью разделения) с некоторым значением.
И имейте контрольную таблицу с current_version и подберите это значение и используйте его во всех связанных запросах, пока вы не сможете использовать новый current_version.
А потом сделай свое обслуживание.