У меня есть фрейм данных, как показано ниже:
df = sqlContext.createDataFrame([("count","doc_3",3), ("count","doc_2",6), ("type","doc_1",9), ("type","doc_2",6), ("one","doc_2",10)]).withColumnRenamed("_1","word").withColumnRenamed("_2","document").withColumnRenamed("_3","occurences")
Из этого мне нужно создать матрицу, как показано ниже:
----------+-----+------+----+
|document |count| type |one |
+---------+-----+------|----+
|doc_1 | 0 | 9 | 0 |
|doc_2 | 6 | 6 | 10 |
|doc_3 | 3 | 0 | 0 |
Итак, я попытался
print df.crosstab("document").show()
, который не дал того, что я хотел. Любая помощь приветствуется