Вы можете создать связующее задание, используя pyspark, который получит файл csv в df, а затем вы сможете преобразовать его как хотите.
После этого вы можете преобразовать этот df в паркет и сохранить его в s3.
Затем вы можете запустить сканер клея, который преобразует данные паркета в таблицу, которую вы можете запросить.
В основном вы выполняете ETL, используя клей aws.