Как реализовать условие EXISTS как SQL в spark Dataframe - PullRequest
0 голосов
/ 07 января 2020

Мне интересно знать, как я могу реализовать sql как существующее предложение в искровом Dataframe.

Ответы [ 2 ]

0 голосов
/ 08 января 2020

Если сравниваемые данные маленькие, как широковещательный список, вы можете использовать -

df.filter(col("columnName").isin(list...) === true)

0 голосов
/ 07 января 2020

LEFT SEMI JOIN эквивалентно функции EXISTS в Spark.

val cityDF= Seq(("Delhi","India"),("Kolkata","India"),("Mumbai","India"),("Nairobi","Kenya"),("Colombo","Srilanka")).toDF("City","Country")

df1

val CodeDF= Seq(("011","Delhi"),("022","Mumbai"),("033","Kolkata"),("044","Chennai")).toDF("Code","City")

df2

val finalDF= cityDF.join(CodeDF, cityDF("City") === CodeDF("City"), "left_semi")

df3

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...