Вдохновленный комментарием @ jx c, попробуйте использовать sql ниже в ячейке блоков данных.
%sql
SELECT exists(column_list, element -> substr(element, 1, length(val)) == val)
Код element.startswith(val)
Я понимаю, что с помощью SQL нужно взять длина головы N (length(val)
) строки element
с использованием substr
и равняется ли val
self.
В противном случае, пожалуйста, обратитесь к классу pyspark.sql.UDFRegistration(sparkSession)
документа PySpark, чтобы зарегистрировать схожие функции как UDF для их совместного использования.