У меня есть поток в NiFI, в котором я использую процессор ExecuteSQL, чтобы получить целое слияние подразделов с именем dt из таблицы hive
.Например: моя таблица разделена на sikid
и dt
.Так что у меня под sikid=1, dt=1000
и под sikid=2, dt=1000
.То, что я сделал, это select * from my_table where dt=1000
.
К сожалению, я получаю взамен от процессора ExecuteSQL поврежденные данные, включая строки с dt=NULL
, в то время как в исходной таблице нет даже одной строки с dt = NULL.
DBCPConnectionPool
настроен для использования HiveJDBC4
баночка.Позже я попытался использовать совместимый jar в соответствии с выпуском CDH, но тоже не исправил.
Процессор ExecuteSQL
настроен так:
Normalize Table/Column Names
: true
Use Avro Logical Types
: false
Версия улья: 1.1.0
CDH: 5.7.1
Есть идеи, что происходит?Спасибо!
РЕДАКТИРОВАТЬ: Очевидно, мои возвращенные данные содержат дополнительные строки ... несколько тысяч из них ... что довольно странно.