df1.show()
+---------+
|Data_Type|
+---------+
| string|
| string|
| int|
+---------+
df2.show()
+---------+
|Data_Type|
+---------+
| string|
| string|
| int|
+---------+
Я хочу сравнить (проверка на равенство) столбцы в df1 со строками в df2 ["Column_name"].
Я попытался сравнить их с помощью объединений, т. Е. По
df1.join(df2,on="Data_Type",how="left").join(df2,on="Data_Type",how="right")
if(df3.count() == df1.count() == df2.count()):
print(True)
Но это не работает, так как у меня есть повторяющиеся значения в столбце «Data_Type», и я получаю перекрестный вид продукта после объединения, как показано ниже:
+---------+
|Data_Type|
+---------+
| int|
| string|
| string|
| string|
| string|
| string|
| string|
| string|
| string|
+---------+
Любой другой способ сделать проверка на равенство данных?