На мой взгляд, не существует оптимального решения описанной вами проблемы.Потому что различие между фреймами данных можно найти только тогда, когда у вас есть column/reference
, на котором оба фрейма данных могут быть объединены.
С этим примечанием, один из подходов заключается в использовании функции subtract
, чтобы найти разницу, котораяпомогает в некоторой степени.
>>> df_1.show()
+-----+-----+-----+
|fname|lname|cmpny|
+-----+-----+-----+
| abc| xyz| 123|
+-----+-----+-----+
>>> df_2.show()
+-----+-----+-----+
|fname|lname|cmpny|
+-----+-----+-----+
| abc| xyz| 456|
+-----+-----+-----+
>>> df_1.select('*').subtract(df_2.select('*')).show()
+-----+-----+-----+
|fname|lname|cmpny|
+-----+-----+-----+
| abc| xyz| 123|
+-----+-----+-----+
>>> df_2.select('*').subtract(df_1.select('*')).show()
+-----+-----+-----+
|fname|lname|cmpny|
+-----+-----+-----+
| abc| xyz| 456|
+-----+-----+-----+