Недавно я начал изучать Фрэнка Кейна, а именно «Укрощение больших данных» с помощью apache spark, используя python. В строке, где мне нужно вычислить среднее количество друзей, я получаю синтаксическую ошибку. Я не могу понять, как исправить эту ошибку. Пожалуйста, обратитесь к приведенному ниже коду. Я использую python 3. Я выделил код с синтаксической ошибкой. Пожалуйста, помогите, поскольку я застрял здесь.
from pyspark import SparkConf, SparkContext
conf = SparkConf().setMaster("local").setAppName("AverageAge")
sc = SparkContext(conf = conf)
def parseline(line):
fields =line.split(',')
friend_age= int(fields[2])
friends_number= int(fields[3])
return (friend_age,friends_number)
lines = sc.textFile("file:///Sparkcourse/SparkCourse/fakefriends.csv")
rdd=lines.map(parseline)
making_keys=rdd.mapByValues(lambda x:(x,1))
totalsByAge=making_keys.reduceByKeys(lambda x,y: (x[0]+y[0],x[1]+y[1])
**averages_by_keys= totalsByAge.mapValues(lambda x: x[0] / x[1])**(Syntax Error)
results=averageByKeys.collect()
for result in results:
print result