В RDD в pyspark значение «realted_values »является ключом к результатам логистической регрессии. Очевидно, что «предсказанные значения» содержат только 0 и 1.
Я хочу посчитать количество 0 и 1 в поле вывода.
Я пытаюсь:
Counter(rdd.groupByKey()['predicted_value'])
, что дает
TypeError: 'PipelinedRDD' object is not subscriptable
Каков наилучший способ сделать это?