Как объединить строчные значения столбцов в искровой DF - PullRequest
0 голосов
/ 07 июня 2018
 val df_final = Data1
        .join(broadcast(df),
          Seq(lower(col("NAME")),  lower(col("TYPE"))),
          "left")

Приведенный выше код вызывает следующую ошибку.

<console>:65: error: overloaded method value join with alternatives:
  (right: org.apache.spark.sql.Dataset[_],joinExprs: org.apache.spark.sql.Column,joinType: String)org.apache.spark.sql.DataFrame <and>
  (right: org.apache.spark.sql.Dataset[_],usingColumns: Seq[String],joinType: String)org.apache.spark.sql.DataFrame
 cannot be applied to (org.apache.spark.sql.Dataset[org.apache.spark.sql.Row], Seq[org.apache.spark.sql.Column], String)
               .join(broadcast(df),
            ^

1 Ответ

0 голосов
/ 07 июня 2018

Вы не можете использовать встроенные функции внутри условие последовательность, вместо этого вы можете сделать следующее

 val df_final = Data1
        .join(broadcast(df),
          lower(col("NAME")) === lower(col("TYPE")),
          "left")
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...