У меня есть две тетради. Первый блокнот читает твиты из твиттера, используя твипы, и записывает их в сокет. Другая записная книжка читает твиты из этого сокета с использованием искровой структурированной потоковой передачи (Python) и записывает результаты в консоль. К сожалению, я не получаю вывод на консоли Jupyter. Код отлично работает на pycharm.
spark = SparkSession \
.builder \
.appName("StructuredStreaming") \
.getOrCreate()
spark.sparkContext.setLogLevel("ERROR")
# This is Spark Structured Streaming Code which is reading streams from twitter and showing them on console.
tweets = spark \
.readStream \
.format("socket") \
.option("host", "127.0.0.1") \
.option("port", 7000) \
.load()
query = tweets \
.writeStream \
.option("truncate", "false") \
.outputMode("append") \
.format("console") \
.start()
query.awaitTermination()