Вы используете псевдоним DataFrame
, а не столбцы, которые используются для доступа / ссылки на столбцы в этом DataFrame
. Таким образом, первое соединение приведет к другому DataFrame
с одинаковым именем столбца дважды (origin_latitude
, а также origin_longitude
). Как только вы попытаетесь получить доступ к одному из этих столбцов в результирующем DataFrame
, вы получите ошибку Ambiguity
.
Поэтому вам нужно убедиться, что DataFrame
содержит каждый столбец только один раз. Вы можете переписать первое соединение, как показано ниже:
p_value
.join(t_d, Seq("origin_latitude", "origin_longitude"), "left")
.filter(t_d.col("t_d.origin_longitude").isNull)