Невозможно запросить улей или c таблицу в Presto - PullRequest
0 голосов
/ 14 февраля 2020

Я ссылался на этот вопрос, но, похоже, ответ не имеет смысла Сбой запроса на presto-cli для таблицы, созданной в формате куста или c с данными, находящимися в s3

У меня есть аналогичная установка с внешними таблицами кустов с данными в s3 в OR C Формат

HIVE Show Create выглядит следующим образом:

CREATE EXTERNAL TABLE `zones`(
  `id` int, 
  `tenantid` int, 
  `zonecd` string, 
  `normalid` smallint)
ROW FORMAT SERDE 
  'org.apache.hadoop.hive.ql.io.orc.OrcSerde' 
STORED AS INPUTFORMAT 
  'org.apache.hadoop.hive.ql.io.orc.OrcInputFormat' 
OUTPUTFORMAT 
  'org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat'
LOCATION
  's3://something/zones_orc'

Когда я запрашиваю его в Улей - я получаю ожидаемые результаты, но когда я запрашиваю ту же таблицу из Presto, используя каталог улей, я получаю эту ошибку

Query 20200214_025104_00017_ypkvk failed: Failed to read ORC file: s3://something/zones_orc/part-00000-...-c000.snappy.orc
Caused by: java.lang.IllegalArgumentException: Unsupported encoding integer
    at com.facebook.presto.orc.reader.SliceBatchStreamReader.getMaxCodePointCount(SliceBatchStreamReader.java:120)
    at com.facebook.presto.orc.reader.SliceDirectBatchStreamReader.readBlock(SliceDirectBatchStreamReader.java:183)
    at com.facebook.presto.orc.reader.SliceBatchStreamReader.readBlock(SliceBatchStreamReader.java:64)
    at com.facebook.presto.orc.OrcBatchRecordReader.readBlock(OrcBatchRecordReader.java:124)
    at com.facebook.presto.hive.orc.OrcBatchPageSource$OrcBlockLoader.load(OrcBatchPageSource.java:238)
    ... 16 more

Я не верю, что это поврежденный файл, потому что я в состоянии прочитать или c из улья без проблем. Есть идеи, почему это происходит?

...