Исходя из вашего ввода и из того, что я понимаю, пожалуйста, найдите ниже код. Просто незначительные изменения в вашем коде:
output = rdd1.flatMap(lambda t: t.split(" ")).map(lambda lists: (lists, 1)).reduceByKey(lambda x,y : x+y)
Вы использовали map
для разделения данных. Вместо этого используйте flatMap
. Это разобьет вашу строку на слова. Выход PFB:
output.collect()
[('have', 2), ("Let's", 1), ('To', 1), ('you', 1), ('need', 1), ('fun', 1), ("don't", 1), ('any', 1), ('some', 1), ('fun.', 1), ('plans.', 1)]