Вы можете сделать это, используя вместо этого выражение SQL.По некоторым причинам Python API не поддерживает его напрямую.Например:
from pyspark.sql.functions import expr
data = [
("aaaa", "aa"),
("bbbb", "cc")
]
df = sc.parallelize(data).toDF(["value", "pattern"])
df = df.withColumn("match", expr("value like concat('%', pattern, '%')"))
df.show()
Выводит это:
+-----+-------+-----+
|value|pattern|match|
+-----+-------+-----+
| aaaa| aa| true|
| bbbb| cc|false|
+-----+-------+-----+