У меня есть фрейм данных pyspark, и у него есть число строк n , каждая строка имеет один столбец результат
Содержимое столбца результата представляет собой JSON
{"crawlDate": "2019-07-03 20:03:44", "Code": "200", "c1": "XYZ", "desc": "desc", "attributes": {"abc":123, "def":456}}
{"crawlDate": "2019-07-04 20:03:44", "Code": "200", "c1": "ABC", "desc": "desc1"}
{"crawlDate": "2019-07-04 20:03:44", "Code": "200", "c1": "ABC", "desc": "desc1", "attributes": {"abc":456, "def":123}}
df.show ():
![enter image description here](https://i.stack.imgur.com/SfXo5.png)
Теперь я хочу проверить, сколько записей(ROWS) имеют атрибуты элемент и сколько записей не имеют.
Я пытался использовать array_contains, фильтровать и взрывать функций вискра, но он не получил результатов.
Есть предложения, пожалуйста?