Я сам пытался найти варианты ETL для KAFKA в HBase, однако пока мое исследование говорит мне, что не очень хорошая идея взаимодействовать с внешней системой в приложении потоков KAFKA (см. Ответ здесь и здесь ). Потоки KAFKA очень мощны и хороши, если у вас есть вариант использования KAFKA->Transform_message->KAFKA
, и в конечном итоге вы можете подключиться к KAFKA, который будет брать ваши данные из темы KAFKA и записывать их в приемник.
Поскольку вы не хотите использовать стороннее KAFKA connect для HBase, один вариант - написать что-то самостоятельно с помощью API подключения, другой вариант - использовать API-интерфейс производителя KAFKA и написать приложение традиционным способом, опрашивать сообщения, писать в приемник, фиксировать пакет и двигаться дальше.