Я работаю над Spark Structured Streaming, что довольно легко использовать.
Я буду читать данные из Kafka и сохраняться в приемнике hdfs после синтаксического анализа JSON.
У меня почти завершил часть. Теперь проблема в том, что у нас должен быть хороший способ закрыть задание потоковой передачи без необходимости внезапного закрытия (ctrl + c или yarn -kill).
Я использовал следующие параметры sparkConf.set("spark.streaming.stopGracefullyOnShutdown","true")
, но бесполезно.
Мое требование - когда запущено задание потоковой передачи, оно должно останавливаться, когда какой-либо сенсорный файл создается в hdfs или Linux Путь EN.
https://jaceklaskowski.gitbooks.io/spark-structured-streaming/spark-sql-streaming-demo-StreamingQueryManager-awaitAnyTermination-resetTerminated.html
В этой ссылке выше они создают поток на фиксированную продолжительность. Но мне нужно что-то вроде того, что выходит из исполнения, когда создается какой-то фиктивный файл.
Я новичок ie, поэтому, пожалуйста, вам нужна ваша помощь для этого.
Заранее спасибо.