Я использую сторонний инструмент CDC, который реплицирует данные из исходной базы данных в разделы Kafka.Пример строки показан ниже:
{
"data":{
"USER_ID":{
"string":"1"
},
"USER_CATEGORY":{
"string":"A"
}
},
"beforeData":{
"Data":{
"USER_ID":{
"string":"1"
},
"USER_CATEGORY":{
"string":"B"
}
}
},
"headers":{
"operation":"UPDATE",
"timestamp":"2018-05-03T13:53:43.000"
}
}
Какая конфигурация необходима в файле приемника для извлечения всех (под) полей в data
и headers
и игнорирования в полях beforeData
, поэтомучто таблица назначения, в которой данные будут передаваться Kafka Sink, будет содержать следующие поля:
USER_ID, USER_CATEGORY, operation, timestamp
Я прошел список преобразования в документах слияния , но не смогнайдите, как использовать их, чтобы достигнуть вышеупомянутой цели.