У меня проблема внутри функции pyspark udf, и я хочу напечатать номер строки, генерирующей проблему.
Я попытался посчитать строки, используя эквивалент статической переменной в Python, но она не работает:
import pyspark.sql.functions as F
def myF(input):
myF.lineNumber += 1
if (somethingBad):
print(myF.lineNumber)
return res
myF.lineNumber = 0
myF_udf = F.udf(myF, StringType())
Как мне посчитать строку внутри pyspark udf?