В настоящее время мы используем Hadoop и Snowflake для хранения наших данных.
Процесс состоит в том, чтобы скопировать файлы ORC Hadoop в папку Snowflake s3 с помощью DISTCP, а затем запустить таблицу копирования в Snowflake из S3.Это скопирует все, что есть в таблице Hadoop ORC, в таблицу Snowflake.
Теперь у меня есть новое требование, в котором моя таблица Hadoop является транзакционной таблицей, а существующие записи обновляются каждый час.Если я копирую файлы ORC на S3 и запускаю команду «Копировать», он добавляет дополнительные записи в существующую таблицу, а не обновляет существующие 1.
Как решить эту проблему в Snowflake?