Я пытаюсь GPG зашифровать столбец данных в искровом фрейме FName
df = spark.createDataFrame([('Andy', 'NY'), ('Bob', 'PA'), ('Cindy', 'DC')], ("FName", "City"))
Я создал udf, который принимает строковое значение в качестве входных данных и дает зашифрованную строку в качестве выходных.
gpg = gnupg.GPG(gnupghome='/home/testgpguser/gpghome')
encrypt_str = udf(lambda string_value: gpg.encrypt(string_value, 'myrecepeintemailid', passphrase='mypassphrase'))
Я применяю свой udf, как показано ниже:
df = df.withColumn('Encrypted_FName', encrypt_str(col('FName')))
Но, я предполагаю, что весь столбец проходит и не шифрует значение правильно.
Как перебрать каждое значение в dataframe ипередать его как string_value
на udf
?