У меня есть текстовый файл со значением json. и это читается в DF
{"name":"Michael"}
{"name":"Andy", "age":30}
Я хочу выводить схему динамически для каждой строки при Потоковое и сохранять ее в отдельных местах (таблицах) в зависимости от ее схемы.
к сожалению, пока я пытаюсь прочитать value.schema, он по-прежнему отображается как String. Пожалуйста, помогите, как это сделать при потоковой передаче, поскольку RDD не допускается при потоковой передаче.
Я хотел использовать следующий код, который не работает, поскольку значение по-прежнему читается как строковый формат.
val jsonSchema = newdf1.select("value").as[String].schema
val df1 = newdf1.select(from_json($"value", jsonSchema).alias("value_new"))
val df2 = df1.select("value_new.*")
Я даже пытался использовать,
schema_of_json("json_schema"))
val jsonSchema: String = newdf.select(schema_of_json(col("value".toString))).as[String].first()
все еще нет надежды .. Пожалуйста, помогите ..