Есть file.sreams, как в этом примере
val fileStreamDf = sparkSession.readStream
.option("header", "true")
.schema(schema)
.csv("/tmp/input") //folder where file is
Но AFIAK. Я не знаю ни о каком http-потоке URL, я думаю, что из источников, таких как s3, это должно быть возможно.
Если вы хотите изучить pls, посмотрите это.
структурированная потоковая передача по протоколу HTTP связь
, в которой используются следующие компоненты.
kafka-clients-0.10: used by KafkaAsReceiver
httpclient-4.5: HttpStreamClient uses HttpClient project
jetty-9.0: HttpStreamServer is devploped upon Jetty
spark-2.1: spark structued streaming libray