У меня есть текстовые данные с разделителями табуляции с 5 столбцами, мне нужно узнать сумму 4-го столбца.
# Find the total sales values:
from pyspark import SparkContext, SparkConf
if __name__ == '__main__':
conf = SparkConf().setAppName("sales").setMaster("local[2]")
sc = SparkContext(conf=conf)
sales = sc.textFile("C:\\Users\\Desktop\\Retail_Sample_Data_Set.txt")
result = sales.map(lambda line: line.split("\t")[4])
Я использовал sum () и уменьшить по ключу, но у меня ничего не работает. Пожалуйста, помогите мне?