Я предполагаю, что вы используете SymlinkTextInputFormat
.Если какой-либо из файлов отсутствует в файле символической ссылки, Athena и Presto в EMR должны выполнить запрос с ошибкой.Я не смог воспроизвести проблему.
CREATE EXTERNAL TABLE `symlink_test`(
`col1` string,
`col2` string)
ROW FORMAT SERDE
'org.apache.hadoop.hive.serde2.OpenCSVSerde'
WITH SERDEPROPERTIES (
'escapeChar'='\\',
'quoteChar'='`',
'separatorChar'=',')
STORED AS INPUTFORMAT
'org.apache.hadoop.hive.ql.io.SymlinkTextInputFormat'
OUTPUTFORMAT
'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
's3://my-bucket/datasets/symlink'
Если какой-либо из файлов в символьной ссылке не существует, Афина и Presto выдают сообщение об ошибке, похожее на:
HIVE_UNKNOWN_ERROR: Input path does not exist:[...]