В этой строке:
kvs.saveAsTextFiles('path','txt')
Вы сохраняете необработанный поток, а не поток с кортежами.Хранить по счетам вместо:
counts.saveAsTextFiles('path','txt')
Интересно, файлы, сохраненные на рабочих узлах в каталоге, указанном в 'path'.
Сохранение в HDFS неподдерживается PySpark API, как и в последней версии, другие языки имеют saveAsHadoopFiles .Ссылка на документ .