Я новичок в MapReduce и пытаюсь найти среднюю оценку mov ie для фильмов в наборе данных MovieLens 100k. У меня есть рабочая программа, которая находит среднюю оценку для каждого mov ie, но я хочу сделать это только для фильмов, которые имеют> 100 обзоров. Как я могу добавить условное утверждение, чтобы сделать это?
from mrjob.job import MRJob
class PopularMovieAvgReview(MRJob):
def mapper(self, key, line):
(userID, movieID, rating, timestamp) = line.split('\t')
yield movieID, float(rating)
def reducer(self, movieID, rating):
total = 0
numElements = 0
for x in rating:
total += x
numElements += 1
yield movieID, total / numElements
if __name__ == '__main__':
PopularMovieAvgReview.run()