У меня есть фрейм данных PySpark со столбцом, содержащим список Python
id value
1 [1,2,3]
2 [1,2]
Я хочу удалить все строки с len
списка в столбце value
меньше 3.
Итак, я попытался:
df.filter(len(df.value) >= 3)
, и действительно, он не работает.
Как я могу отфильтровать кадр данных по длине внутренних данных?