Вопрос в том, представлен ли он как серия RDD, можем ли мы создать Stream RDD и ожидать, что он будет работать аналогично DStream?
Вы правы.DStream
логически представляет собой серию RDD
с.
Spark Streaming просто скрывает процесс создания Seq[RDD]
, поэтому это не ваша работа, а фреймворк.
Более тогоSpark Streaming предоставляет гораздо более приятный API для разработчиков, поэтому вы можете думать о Seq[RDD]
как о DStream
, но вместо rdds.map(rdd => your code goes here)
вы можете просто dstream.map(t => your code goes here)
, который ничем не отличается, за исключением типов rdd
и t
.Вы просто на один уровень ниже уже при работе с DStream
.