Spark SQL - Альтернатива для функции «содержит» - PullRequest
0 голосов
/ 14 января 2020

У меня есть сценарий, в котором мне нужно найти существование строк в столбце dataframe внутри больших строк в другом столбце другого dataframe. Я использую Spark 2.4.4 и Scala 2.11.12 .

1 Ответ

0 голосов
/ 14 января 2020

org.apache.spark.sql.Column имеет функцию содержимого, которую можно использовать для выполнения операции «Стиль строки содержит» между двумя столбцами, содержащими строку.

val df = //a dataframe buiktas a result of join and has 2 columns - c1, c2

df.filter(col("c1").contains(col("c2"))).show()

...