Предположим, у меня есть этот фрейм данных ..
TEST_schema = StructType([StructField("col1", IntegerType(), True),\
StructField("col2", IntegerType(), True)])
TEST_data = [(5,-1),(4,-1),(3,3),(2,2),(1,-1),(0,-1),(0,-1),(0,2),(0,-1)]
rdd3 = sc.parallelize(TEST_data)
TEST_df = sqlContext.createDataFrame(TEST_data, TEST_schema)
TEST_df.show()
+----+----+
|col1|col2|
+----+----+
| 5| -1|
| 4| -1|
| 3| 3|
| 2| 2|
| 1| -1|
| 0| -1|
| 0| -1|
| 0| 2|
| 0| -1|
+----+----+
Я хочу подсчитать количество «-1» специально после col1 == 1.
поэтому, когда после col1 == 1 df.count()
что вернет 4.