Я хочу внешнее соединение двух фреймов данных с помощью Spark:
df1 columns: first_name, last, address
df2 columns: first_name, last_name, phone_number
Мои ключи first_name and df1.last==df2.last_name
Я хочу, чтобы окончательная схема набора данных содержала следующие столбцы:
first_name, last, last_name, address, phone_number
Это означает, что если имена столбцов идентичны, я хочу объединить столбцы в выходном фрейме данных, а если они не идентичны, я хочу, чтобы оба столбца были отдельными.
Я не могу сделать это в одном соединении, но только в двух, например: df1.join(df2,'first_name','outer').join(df2,[df1.last==df2.last_name],'outer')