Мое требование - хранить данные в S3 и выполнять запросы к данным S3 с помощью Amazon Redshift Spectrum.Мои данные моделируются как «один ко многим» и «многие ко многим».Например, рассмотрим следующую схему SQL
user (id, name)
user_phoes (id, phone_type, user_id)
user_roles (id, role_type, user_id)
user_role_activities (id, type, user_role_id)
. Мне нужен лучший подход для хранения этих данных в S3.Так что я могу легко загрузить их в Redshift через Redshift Spectrum для выполнения запросов JOIN.
ПРИМЕЧАНИЕ. Данные будут вставлены в S3 по расписанию.И Redshift должен поддерживать то же ограничение внешнего ключа, что и в моей модели.Данные могут быть вставлены в S3 в любом порядке.Это данные user_phones перед данными пользователей.
Ожидается лучший подход для хранения S3 и вычисления данных в Redshift