В нашем приложении мы соединяем искру с HBase, используя следующий код:
val hBaseRDD: RDD[(ImmutableBytesWritable, Result)] =
sparkSession.sparkContext.newAPIHadoopRDD(
conf,
classOf[TableInputFormat],
classOf[ImmutableBytesWritable],
classOf[Result]
)
val resultRDD: RDD[Result] = hBaseRDD.map(tuple => tuple._2)
Но это дает нам СДР типа Результат.
Нам нужен СДР типа«Строка» для создания DataFrame из этого RDD.Как мы можем сделать то же самое?
Спасибо