Apache Spark Read Json Поток возвращает только ноль - PullRequest
0 голосов
/ 01 апреля 2020

Привет, я новичок в зажигании & scala. Я начал писать приложение, которое будет читать json файл и печатать поток в консоли. Но он всегда печатает значения как NULL.

Это программа, которую я пробовал.

val spark: SparkSession = SparkSession.builder()
      .master("local[3]")
      .appName("Demo")
      .getOrCreate()

    val userSchema = new StructType()
      .add("name", "string")
      .add("age", "integer")


    val df = spark.readStream
      .schema(userSchema)
      .json("/home/sajith/Desktop/temp_data/demo/cpy/")

    df.printSchema()

    df.writeStream
      .format("console")
      .start()
      .awaitTermination()

И это образец Json файл

{
 "name":"Sajith", 
 "age": 55
}

Когда Я положил json файл в каталог Это дает этот результат.

enter image description here

1 Ответ

0 голосов
/ 01 апреля 2020

Причина в том, что данные json должны быть одной строкой.

{"name":"Sajith","age":55}
...