Я могу читать данные из местоположения S3 с помощью Spark и Glue без проблем, но при попытке чтения с помощью Athena для одной и той же таблицы - ошибка при запуске select * from mytable limit 10;
HIVE_CURSOR_ERROR: Can not read value at 0 in block 0 in file
s3://.../part-00073-123-926b-456-c000.snappy.parquet
В чем может быть проблема иКак это исправить?
Я пытался с: MSCK REPAIR TABLE mytable;
Это не помогло (получая ту же ошибку).
Оператор создания таблицы:
CREATE EXTERNAL TABLE `mytable`(
co1 ..,
col2 ..
)
ROW FORMAT SERDE
'org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe'
STORED AS INPUTFORMAT
'org.apache.hadoop.hive.ql.io.parquet.MapredParquetInputFormat'
OUTPUTFORMAT
'org.apache.hadoop.hive.ql.io.parquet.MapredParquetOutputFormat'
LOCATION
's3://.../../'
TBLPROPERTIES (
'CrawlerSchemaDeserializerVersion'='1.0',
'CrawlerSchemaSerializerVersion'='1.0',
'UPDATED_BY_CRAWLER'='raw_1',
'averageRecordSize'='105',
'classification'='parquet',
'compressionType'='none',
'objectCount'='155',
'recordCount'='33459791',
'sizeKey'='1738251189',
'typeOfData'='file')