AWS Glue используется для сбора метаданных (сканирования) и для ETL. Это не для отчетности или аналитики. Он может применять очень сложные преобразования (идеально подходит для сложных требований ETL).
Redshift Spectrum в основном используется для создания отчетов и анализа данных, хранящихся в S3, обычно в сочетании с данными, хранящимися в Redshift. Однако МОЖЕТ также использоваться для простого ETL. Гораздо проще установить и использовать, чем Glue, если вам просто нужен простой тип ETL.
Есть еще одна опция, которую вы не упомянули: амазонка Athena, это отличный инструмент для выполнения запросов непосредственно к данным S3. Он похож на Redshift Spectrum, но обычно быстрее и дешевле, в зависимости от вашего варианта использования. Он не может объединить данные S3 с данными Redshift.