У меня есть 2 схемы JSON, как показано ниже -
df1.printSchema ()
# root
# |-- name: string (nullable = true)
# |-- age: long (nullable = true)
df2.printSchema ()
#root
# |-- name: array (nullable = true)
# |-- gender: integer (nullable = true)
# |-- age: long (nullable = true)
Как можно сравнить эти 2 схемы и выделить различия, используя pyspark, поскольку я использую pyspark-sql для загрузки данных из файла JSON в DF.