HBase является магазином KV и на самом деле подходит для этого.
Но если я понимаю ваш подход, вы, кажется, хотите присоединиться.Это, конечно, не подход.Слишком много данных и, следовательно, времени для микропакета, даже с кэшированием.СОЕДИНЕНИЕ работает только с небольшими справочными таблицами (из Hive, KUDU).
Вам нужно что-то похожее на это:
val query = ds.writeStream
.foreach(new HBaseForeachWriter ...
См. Spark Structured Streaming с интеграцией Hbase дляруководство, и вы должны быть на вашем пути.