Поскольку данные представлены в формате CSV, вам необходимо указать формат, который вы указали при создании таблицы.
CTAS (создать таблицу как выбор) не будет переводить базовый формат, это то, что вам нужно будет предоставить.
Преимущество в скорости будет зависеть от нескольких факторов.Размер набора данных, тип запроса и размер кластера будут влиять на производительность чтения.
Вы можете запустить следующую ячейку SQL, чтобы проверить формат:
%sql
desc extended employee_data
В поле Provider
будет указан формат файла, например, csv в этом примере.
Чтобы преобразовать в паркет, вы можете выполнить следующее:
CREATE TABLE employee_data USING PARQUET as
Select column1, column2, column3
FROM employee_data_csv