AWS Athena - ошибка - невозможно прочитать значение 0 в блоке 0 в файле s3: // - PullRequest
0 голосов
/ 23 октября 2019

Я могу читать данные из местоположения S3 с помощью Spark и Glue без проблем, но при попытке чтения с помощью Athena для одной и той же таблицы - ошибка при запуске select * from mytable limit 10;

HIVE_CURSOR_ERROR: Can not read value at 0 in block 0 in file


s3://.../part-00073-123-926b-456-c000.snappy.parquet

В чем может быть проблема иКак это исправить?

Я пытался с: MSCK REPAIR TABLE mytable;

Это не помогло (получая ту же ошибку).

Оператор создания таблицы:

CREATE EXTERNAL TABLE `mytable`(
co1 ..,
col2 ..
)
ROW FORMAT SERDE 
  'org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe' 
STORED AS INPUTFORMAT 
  'org.apache.hadoop.hive.ql.io.parquet.MapredParquetInputFormat' 
OUTPUTFORMAT 
  'org.apache.hadoop.hive.ql.io.parquet.MapredParquetOutputFormat'
LOCATION
  's3://.../../'
TBLPROPERTIES (
  'CrawlerSchemaDeserializerVersion'='1.0', 
  'CrawlerSchemaSerializerVersion'='1.0', 
  'UPDATED_BY_CRAWLER'='raw_1', 
  'averageRecordSize'='105', 
  'classification'='parquet', 
  'compressionType'='none', 
  'objectCount'='155', 
  'recordCount'='33459791', 
  'sizeKey'='1738251189', 
  'typeOfData'='file')
...