Вы должны использовать collect()
вместе с RDD, как, t1.keys().collect()
, чтобы распечатать их.Проверьте ниже, и я получил это.
>>> rdd= sc.parallelize([['Mike',25,'XXX'],['Sam',45,'YYY'],['Jim',26,'ZZZ']])
>>> rdd.collect()
[['Mike', 25, 'XXX'], ['Sam', 45, 'YYY'], ['Jim', 26, 'ZZZ']]
#Making Nationality as Key, and others as values
>>> t1=rdd.map(lambda x:(x[2],(x[0],x[1])))
>>> t1.collect()
[('XXX', ('Mike', 25)), ('YYY', ('Sam', 45)), ('ZZZ', ('Jim', 26))]
>>> t1.keys().collect()
['XXX', 'YYY', 'ZZZ']
>>> t1.values().collect()
[('Mike', 25), ('Sam', 45), ('Jim', 26)]