Сначала получите данные в СДР:
rdd = sc.parallelize([10,21,90,34,40,98,21,44,59,21,90,34,29,19, 21,90,34,29,49,78])
Отобразите приведенный выше список и первый элемент списка.
rdd.collect()
rdd.take(1)
Также я хочу отобразить отсортированный вывод(восходящий и нисходящий) через СДР и отображать отдельные элементы списка с помощью СДР.
rdd.distinct().sortBy(lambda x:x).collect()
rdd.distinct().sortBy(lambda x:-x).collect()
Отображать максимум и минимум данного списка.
rdd.max()
rdd.min()
Объединить приведенный выше список сновый ввод в форме: {30,35,45,60,75,85} и вывод на экран.
newrdd = sc.parallelize({30,35,45,60,75,85})
rdd.union(newrdd).collect()
Укажите сумму элементов списка с использованием метода Reduce с различными значениями.
rdd.distinct().reduce(lambda x,y:x+y)
Укажите сумму элементов списка с помощью метода Reduce.
rdd.reduce(lambda x,y:x+y)
PS Фактически, если вы сортируете свой элемент по убыванию rdd, элемент max будет первым элементом этого rdd.Итак, вы можете получить максимум этого rdd без , используя max()
, так что это код:
rdd.distinct().sortBy(lambda x:-x).take(1)