Spark Structured Streaming [2.3] Поле с нулевым значением пропускается при записи в kafka - PullRequest
0 голосов
/ 04 декабря 2018

У меня задание со структурированной потоковой передачей, которое читает и записывает данные json в / из kafka.При записи в kafka поля в json, имеющие нулевые значения, опускаются.Есть ли способ, которым я могу написать нулевое значение поля в выводе.

org.apache.spark.sql.streaming.StreamingQuery kafkaOutputStream= processedData
                .select(org.apache.spark.sql.functions.to_json(org.apache.spark.sql.functions.struct("*"))
                        .as("value"))
                        .writeStream()
                        .format("kafka")
                        .outputMode("append")
                        .option("kafka.bootstrap.servers", kafkaServers)
                        .option("topic", "filtersink")
                        .option("checkpointLocation", checkpointLocation)
                        .start();
kafkaOutputStream.awaitTermination();

Ввод:

{"name": "user1", "age":1, "city": null}

Вывод:

{"name": "user1", "age": 1}

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...