Предположим, я выполняю простой скрипт pyspark data_rdd.map(some_fun).toDF()
, где data_rdd
содержит только последовательность записей, которые должны быть обработаны some_fun
.some_fun
вернет список, а иногда это пустой список.Пример выходных данных показан ниже, где вы можете увидеть пустой список.
Мой вопрос: есть ли в любом случае отфильтровать этот пустой список без использования дорогих where
или filter
?В любом случае, чтобы map
сам игнорировал пустые списки?Спасибо!