Запуск нескольких файлов CSV, и я пытаюсь запустить и сделать некоторые проверки, и по какой-то причине для одного файла я получаю NullPointerException
, и я подозреваю, что есть какая-то пустая строка.
Итак, я запускаю следующее, и по какой-то причине он выдает мне OK
вывод:
check_empty = lambda row : not any([False if k is None else True for k in row])
check_empty_udf = sf.udf(check_empty, BooleanType())
df.filter(check_empty_udf(sf.struct([col for col in df.columns]))).show()
Я что-то упустил в функции фильтра или мы не можем извлечь пустые строкис данных.