Я получаю синтаксическую ошибку при вычислении среднего числа друзей в apache spark - PullRequest
0 голосов
/ 06 апреля 2020

Недавно я начал изучать Фрэнка Кейна, а именно «Укрощение больших данных» с помощью apache spark, используя python. В строке, где мне нужно вычислить среднее количество друзей, я получаю синтаксическую ошибку. Я не могу понять, как исправить эту ошибку. Пожалуйста, обратитесь к приведенному ниже коду. Я использую python 3. Я выделил код с синтаксической ошибкой. Пожалуйста, помогите, поскольку я застрял здесь.

from pyspark import SparkConf, SparkContext


conf = SparkConf().setMaster("local").setAppName("AverageAge")
sc = SparkContext(conf = conf)

def parseline(line):
    fields =line.split(',')
    friend_age= int(fields[2])
    friends_number= int(fields[3])
    return (friend_age,friends_number)


lines = sc.textFile("file:///Sparkcourse/SparkCourse/fakefriends.csv")
rdd=lines.map(parseline)
making_keys=rdd.mapByValues(lambda x:(x,1)) 
totalsByAge=making_keys.reduceByKeys(lambda x,y: (x[0]+y[0],x[1]+y[1])
**averages_by_keys= totalsByAge.mapValues(lambda x: x[0] / x[1])**(Syntax Error)

results=averageByKeys.collect()
for result in results:
    print result

1 Ответ

0 голосов
/ 06 апреля 2020

Посмотрите на строку выше, вам не хватает закрывающей скобки.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...