Основным преимуществом размещения данных в DW (с использованием CTAS) является то, что последующие запросы к этим данным будут значительно быстрее.Вы получите полное распределение данных по вашим узлам и дистрибутивам.Любые запросы, которые фильтруют или присоединяются к таблице, будут значительно быстрее.
Недостатком, как вы указали, является то, что вы сейчас храните другую копию данных ... при условии, что вы не удаляетефайл из вашего озера данных после загрузки.
Думайте о создании внешней таблицы как о простом отображении внешнего файла в структуру данных SQL.