Если вы хотите выполнять периодический экспорт, вам нужно использовать внешний планировщик (например, cron).Вы можете экспортировать в HDFS, NFS или S3.
Если у вас есть некоторые данные (ваши горячие данные) в Vertica и другие (холодные) данные во внешних таблицах, это две отдельные таблицы.Вы можете запросить их вместе (выберите ... из горячих, холодных), но ваши внешние данные Parquet не находятся "в" таблице, содержащей ваши данные Vertica (ROS, горячие).
Когда вы запрашиваетеВнешняя таблица Vertica считывает соответствующие данные из внешнего местоположения.В некотором смысле, он выполняет легкую загрузку, используя предложение FROM выражения CREATE EXTERNAL TABLE в каждом запросе.(Формат столбцов Parquet и оптимизации, такие как предикатное нажатие, означают, что это не больно.) Это означает, что если ваше предложение FROM является глобальным (например, hdfs:///data/*/*.parquet
), если вы экспортируете больше данных, вам не нужно обновлять определение таблицы -это просто работает.
Обратите внимание, что каждый экспорт должен быть в новом каталоге;если вы поместите их все в один и тот же родительский каталог, то вы можете использовать глоб, как в моем примере.См. документацию .