У меня задание Amazon ElasticMapreduce, настроенное для выполнения запроса куста
CREATE EXTERNAL TABLE output_dailies (
day string, type string, subType string, product string, productDetails string,
uniqueUsers int, totalUsers int
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t'
LINES TERMINATED BY '\n'
STORED AS TEXTFILE
LOCATION '${OUTPUT}';
INSERT OVERWRITE TABLE output_dailies
select day, type, subType, product, productDetails, count(distinct accountId) as uniqueUsers, count(accountId) as totalUsers from raw_logs where day = '${QUERY_DATE}' group by day, type, subType, product, productDetails;
После завершения задания расположение вывода, настроенное для S3, будет содержать 5 файлов с этим шаблоном task_201110280815_0001_r_00000x
где x переходит от 0 до 4. Файлы маленькие, каждый по 35 КБ.
Можно ли указать кусту сохранение результатов в одном файле?