Почему я всегда получаю 0 записей в качестве выходных данных при чтении из таблицы dtap: // hive в Presto? - PullRequest
0 голосов
/ 25 сентября 2019

Я пытаюсь запустить Presto с Hive (все подробности о версии ниже) на CDH 5.14.2 Удивительно, но я получаю 0 записей в качестве вывода при выполнении любого запроса select для любой таблицы.Когда я выбираю * для любой таблицы, я просто получаю список всех полей, опять же никаких данных.Все таблицы являются внешними таблицами улья с данными в формате паркета

  • Улей 1.1.0

  • Presto 0.223, также 0.219

Проверьте файл server.log в установке Presto, там нет сообщений об ошибках и предупреждений

Также пробовал эту же установку с Presto 0.219, тот же случай

presto: sample_db>выберите count (*) из tableName;

_col0
-------
     0
(1 row)

Query 20190925_125900_00005_8tzp2, FINISHED, 1 node
Splits: 18 total, 18 done (100.00%)
0:01 [0 rows, 0B] [0 rows/s, 0B/s]

Вывод DESCRIBE FORMATTED tablename -

# col_name              data_type               comment

column1             string
column2             string
column3             string
column4             decimal(6,0)
column5             timestamp

# Partition Information
# col_name              data_type               comment

active                  string

# Detailed Table Information
Database:               db_name
Owner:                  cloudera-vivek
CreateTime:             Sun Nov 25 03:23:06 GMT 2018
LastAccessTime:         UNKNOWN
Protect Mode:           None
Retention:              0
Location:               dtap://dbname/tablename
Table Type:             EXTERNAL_TABLE
Table Parameters:
        EXTERNAL                TRUE
        STATS_GENERATED_VIA_STATS_TASK  true
        numPartitions           2
        numRows                 4142
        transient_lastDdlTime   1543116186

# Storage Information
SerDe Library:          org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe
InputFormat:            org.apache.hadoop.hive.ql.io.parquet.MapredParquetInputFormat
OutputFormat:           org.apache.hadoop.hive.ql.io.parquet.MapredParquetOutputFormat
Compressed:             No
Num Buckets:            -1
Bucket Columns:         []
Sort Columns:           []
Storage Desc Params:
        serialization.format    1
Time taken: 0.919 seconds, Fetched: 40 row(s)

Может ли это быть из-за несовпадения версий между Hive и Presto?Я не смог найти ничего подобного в примечаниях к выпуску Presto. Любые другие файлы .jar или config, которые необходимо добавить во время установки?

Очень признателен за вашу помощь

1 Ответ

0 голосов
/ 25 сентября 2019

Можете ли вы попробовать имя таблицы таблицы восстановления msck, как указано здесь: https://github.com/prestodb/presto/issues/4109?

...